时间进入2009年12月中旬。
墙上的电子挂钟跳到上午十点整。
对于写字楼里的上班族来说,年底只意味着写不完的年终总结。
但对于京城邮电大学计算机系教研室里的人来说,今天是个大日子。
郭长征站在电脑屏幕前。
楚一航坐在椅子上,右手握着鼠标,左手习惯性地搓着下巴上的络腮胡。
旁边站着研究生钟柏、江深和叶言。
电脑浏览器上,ImageNet视觉识别挑战赛的官方网站正式开放访问。
楚一航点击刷新按钮。
原本只有倒计时的页面瞬间变了模样,深蓝色的导航栏加载出来。
赛题和规则文档链接出现在页面正中央。
钟柏赶紧凑近屏幕,指着其中一行英文。
“上面说,开放了一百二十万张图像,作为训练集?这数据量有点离谱吧。”
楚一航摸了摸下巴。
“以前的视觉识别比赛,搞个几万张图片就算顶格配置了。”
“这次一上来就直接放出百万级别的数据集,跨度太惊人了。”
“主办方这明摆着是鼓励大家别走寻常路,逼着所有参赛队伍去点新的科技树啊。”
“而且这是明示大家,要用GPU去处理图片,传统的CPU干冒烟了,也处理不过来这么多图片。”
叶言在旁边点头赞同,补充说明。
“确实,要是继续用传统的老算法去跑这百万张图像的特征,算到比赛结束都跑不完第一轮。”
“除了训练集,还有五万张验证集图片,这部分是带标签答案的,是让方便我们对自己的模型,先内部评估一下。”
“算是模拟试卷。”
楚一航继续往下念规则。
“十五万张测试集图片,答案不公开。”
“这就是这个比赛真正的考题了。”
“我们需要用自己的算法,预测这十五万张测试集的标签,然后上传到官网。”
郭长征看着比赛周期说明。
“比赛为期三个月,到明年3月15日截止。”
钟柏指着“UplOad”按钮旁边的一行小字。
“这上面写着,比赛期间可以随时提交预测结果。”
“官网会根据提交的结果,动态更新每个团队的当前排名。”
叶言愣了一下。
“实时排名?还能这样玩?”
楚一航乐了,拍了拍大腿。
“这哪是搞学术,这纯纯是网游里的天梯排位赛啊。”
钟柏也跟着分析。
“以前的学术比赛,都是大家蒙头搞几个月。”
“最后一天统一提交,组委会再花几天时间评阅,最后放榜。”
郭长征思索着这种新赛制带来的变化。
“实时更新排名,意味着所有参赛队伍都能看到别人的进度。”
“这就倒逼着大家一刻不能停,只要被人超了,就得继续优化模型重新跑。”
叶言接着念规则。
“整个比赛期间,每个账号最多只能上传五次预测结果。”
“最终成绩,取五次中得分最高的那一次。”
楚一航啧了一声。
“五次机会,这不就是排位赛里的保级赛机制吗?用完就只能干瞪眼看别人上分了。”
钟柏继续看排名机制的具体算法。
“榜单分为TOp-1正确率和TOp-5正确率两个实时排名。”
楚一航看着那两条榜单规则,直接乐了。
“这赛事主办方也太懂年轻人了,硬生生把沉闷的学术比赛做出了电子竞技的刺激感。”
叶言在一旁兴奋地搓了搓手。
“确实有意思,以前搞研究只能自己一个队伍闷头死磕代码,毫无互动可言。”
“现在搞出实时排行榜和提交次数限制,直接变成了全网极客在线大乱斗。”
钟柏的胜负欲完全被勾起来了,声音都不自觉地拔高。
“这么一来,咱们上传成绩的时间节点就非常讲究了,还得跟全世界的其他队伍玩心理战。”
郭长征看着几个干劲十足的年轻人,笑着点头。
“这种赛制把竞争完全摆在明面上,确实能最大程度逼出大家的好胜心。”
楚一航双手在键盘上快速敲击了两下,眼神里全是跃跃欲试。
“那还等什么?我已经迫不及待想下场,好好蹂躏他们了。”
……
至于为什么这次比赛的赛制,会如此有意思,还要说回两周前。
远在魔都的高档写字楼里。
英伟达中国大区总经理张建忠的桌面上,放着ImageNet赛事的最终赞助确认书。
秘书小刘站在办公桌对面,正在汇报赛事的媒体宣发情况。
“张总,ImageNet官网已经按照我们的要求,把实时排行榜功能上线了。”
张建忠翻看着文件。
“李飞飞教授那边没再提出什么异议吧?”
小刘摇头。
“没有。他们团队的资金缺口很大,亚马逊的众包标注平台收费很高。”
“我们这笔赞助解了他们的燃眉之急,对于赛制修改的要求,他们全盘接受了。”
张建忠拿笔在文件上签下名字。
实时排行榜这个点子,就是他本人向总部提议,并要求加进ImageNet比赛里的。
传统的学术比赛太过沉闷,圈外人根本不关心。
既然英伟达赞助这次比赛的核心诉求就是热度,那就需要一种能让媒体持续报道、能让参赛者产生焦虑感和竞争欲的机制。
排行榜就是最好的焦虑制造机。
为了放大这种竞争欲,英伟达不仅赞助了赛事运营,还单独设立了三万美元的冠军奖金。
小刘提出一个疑问。
“张总,官网还开通了论文和代码同步公开的功能。”
“这也是我们提的诉求。”
“您就这么确信,排在前面的队伍,会用我们英伟达的CUDA架构吗。”
张建忠靠在椅背上。
“这不需要确信,这是概率学。”
“目前市面上能提供大规模并行计算能力,且被学术界广泛接受的,就只有我们的显卡。”
“高校那些传统的图像特征提取算法,处理几千张图片还行。”
“面对一百二十万张的庞大数据集,传统的CPU计算模式根本跑不动。”
小刘接着问。
“万一有人用AMD的显卡呢?”
张建忠笑了笑。
“硬件只是躯壳,生态才是灵魂。”
“AMD没有CUDA这样成熟的底层调用架构。”
“研究员拿了AMD的卡,连最基础的矩阵运算库都要自己从头写。”
“三个月的比赛时间,光写底层代码都不够,还比什么赛?”
小刘翻开手里的另一份简报。
“那盛夏科技前两个月推出的那个九章计算平台呢?”
张建忠听到这个名字,手指在桌面上敲了两下。
“九章确实是个变数,它能兼容AMD的硬件。”
“但一个推出才两个月的新平台,很多高校的老师,甚至都没听过它的名字。”
“研究员们习惯了我们英伟达的工具链,谁会冒着比赛失利的风险,去踩一个新平台的坑?”
张建忠对目前的局势判断非常清晰。
英伟达通过几年的高校赞助,已经完成了用户习惯的初步绑定。
这三万美元的奖金,就是用来收割这批高校用户的成果的。
只要前几名使用了CUDA并在官网上公开技术论文或者源码,那就是对英伟达最好的免费广告。