“这40%的正确率,确实能打,但这是通用模型没做微调跑出来的数据。”
“这绝对不是咱们实力的天花板。”
郭长征敲了敲桌子,给几个年轻人降降温。
“你想想,为了去榜单上当个显眼包,白白浪费一次提交机会。”
“等后面咱们训练出准确度更高的专用模型,结果发现手里只剩四次机会了,亏不亏?”
楚一航非常赞同郭长征的观点,也跟着劝钟柏。
“郭老师说得对,稳住咱们能赢。”
“五次提交机会太宝贵了,不能一开局为了装杯就随便浪费掉。”
楚一航搓了搓下巴。
“咱们得沉得住气。”
钟柏听完,彻底收起了那股想出风头的浮躁劲,乖乖离开了电脑桌。
“懂了,苟住发育。那咱们接下来这三个月从哪下手?”
郭长征转身走到白板前,拿起黑色马克笔。
“干咱们该干的具体工作。”
“先把这通用模型的输出层改了,剔除多余的四千个类别,专门针对比赛的一千个分类做训练。”
几个人立刻进入了工作状态。
钟柏负责修改网络输出层的代码结构。
叶言开始编写过滤多余分类的数据清洗脚本。
楚一航则坐在电脑前,监控着九章平台的显存调度,为接下来的微调训练预留算力通道。
教研室里刚才的激动情绪一扫而空,只剩下连串的键盘敲击声。
……
斯坦福大学的人工智能实验室里,大卫用力敲打着回车键。
屏幕上弹出一行红色的错误提示,伴随着一声警告音。
大卫抓了抓头发,把键盘推到一边。
约翰坐在旁边的工位上,转动椅子滑了过来。
“又报错了?”约翰看着大卫的屏幕。
“内存溢出。”大卫指着屏幕上的代码行,“这数据量完全超出了现有设备的承受极限。”
约翰凑近看了一眼后台的运行日志。
“这套图片分类的数据集太大了,一百万张图片,我们的算法根本跑不动。”约翰连连摇头。
两人都是李飞飞团队的博士。
虽然作为主办方团队的成员,但是两人也报名参加了比赛。
两人正愁眉苦脸,李飞飞拿着一个装满黑咖啡的马克杯走了进来。
大卫赶紧转头看向李飞飞。
“飞飞教授,你觉得这次数据集的比赛,第一名大概能达到怎样的程度?”大卫开口询问。
李飞飞拉过一把办公椅,在大卫身边坐下。
她把马克杯放在桌上,看着屏幕上的错误日志。
“大家不要灰心,我们内部其实已经用各种传统数值方法做过测试了。”李飞飞语气平缓。
大卫立刻来了精神,坐直了身子。
“教授,测试结果怎么样?”大卫追问。
李飞飞喝了一口咖啡,放下杯子。
“根据我们跑出的结果,这套数据集的极限应该可以超过30%。”李飞飞说出了数字。
约翰在旁边计算了一下。
“您是指 tOp 1 的正确率?”约翰确认道。
李飞飞点了点头。
“是的。至于 tOp 5 的正确率,可以超过70%。”李飞飞补充。
大卫皱起眉头,手指在桌面上敲击。
“超过30%?我们在特征提取上花了这么多时间,结果还差这么多?”大卫显得有些沮丧。
李飞飞看着大卫的眼睛。
“大卫,科学研究不能只看眼前的得失。目前我们尝试了所有不同的算法,确实只能达到这个程度。”
李飞飞站起身,走到实验室中央的白板前。
“但是,我对其他参赛团队很有信心。”李飞飞说。
“为什么?”约翰不解地问。
“因为现在这个数据集完全开放了。它会激发全球所有顶尖研究人员的热情。”李飞飞解释道。
大卫叹了口气。
“光有热情没用啊,算力跟不上,大家都在用传统的支持向量机做分类,上限就在那里。”大卫反驳。
李飞飞笑了笑,“这就要感谢英伟达了。他们这次提供了非常大的帮助。”。
约翰撇了撇嘴。
“老黄这次确实花了不少钱,几万美元的奖金呢。”约翰调侃道。
大卫跟着附和。
“就是,重赏之下必有勇夫。很多人估计连夜都在改代码,就为了抢这笔奖金。”
李飞飞走回座位。
“不仅仅是奖金。英伟达设置的赛制非常吸引人,这种实时排名会带来很大的竞争压力。”
李飞飞继续分析。
“这些条件加在一起,能帮助比赛吸引更多顶尖团队来提交数据。有竞争,才能取得更高的成绩。”
大卫还是觉得不乐观。
“可是教授,您觉得第一名到底能考多少分?”大卫又回到了最初的问题。
李飞飞在心里盘算了一下。
“按照目前的学术发展速度,我预测,tOp 1 正确率能到32%。”李飞飞给出了具体的数值。
“tOp 5 正确率能到75%。”李飞飞继续说道。
约翰把这两个数字记录在笔记本上。
“这就到顶了吗?”约翰问。
李飞飞点头。
“对,这就是目前的极限了。”李飞飞语气肯定。
“为什么不能更高?”大卫追问。
“毕竟以目前的技术水平,据我所知,应该还没有达到那种脱胎换骨的程度。”李飞飞解释。
李飞飞端起咖啡杯。
“没有新技术的加入,单靠优化现有算法,32%就是很难突破的瓶颈。”
大卫靠在椅背上。
“那这个比赛还有什么意义?大家只是在小数点后两位互相竞争。”大卫抱怨道。
李飞飞拍了拍大卫的肩膀。
“不要着急。我觉得,如果这个比赛未来几年一直办下去,一定会产生质的改变。”李飞飞语气中充满期待。
大卫无奈地重新拉过键盘。
“好吧,那我继续去改参数。看看能不能把正确率从25%提高到30%。”大卫重新投入工作。
……
同一时间,加拿大多伦多大学。
教研室的角落里,亚历克斯正盯着电脑屏幕上缓慢跳动的进度条,烦躁地抓了抓头发。
伊利亚坐在旁边,机械地敲击着键盘。
“这组数据的预训练还要跑多久?”伊利亚头也不回地问。
亚历克斯叹了口气,敲了一下回车键。
“按照现在的运算速度,大概还需要一个星期。这还是不出任何内存报错的情况。”亚历克斯语气里满是绝望。
长时间的等待让人抓狂,亚历克斯切出编译器,打算看点科技新闻换换脑子。
一条关于ImageNet视觉识别挑战赛的通告弹了出来。