字:
关灯 护眼
乡村小说 > 带着手机重生,目标科技教父 > 第635章 李飞飞的断言

第635章 李飞飞的断言

    “这40%的正确率,确实能打,但这是通用模型没做微调跑出来的数据。”

    “这绝对不是咱们实力的天花板。”

    郭长征敲了敲桌子,给几个年轻人降降温。

    “你想想,为了去榜单上当个显眼包,白白浪费一次提交机会。”

    “等后面咱们训练出准确度更高的专用模型,结果发现手里只剩四次机会了,亏不亏?”

    楚一航非常赞同郭长征的观点,也跟着劝钟柏。

    “郭老师说得对,稳住咱们能赢。”

    “五次提交机会太宝贵了,不能一开局为了装杯就随便浪费掉。”

    楚一航搓了搓下巴。

    “咱们得沉得住气。”

    钟柏听完,彻底收起了那股想出风头的浮躁劲,乖乖离开了电脑桌。

    “懂了,苟住发育。那咱们接下来这三个月从哪下手?”

    郭长征转身走到白板前,拿起黑色马克笔。

    “干咱们该干的具体工作。”

    “先把这通用模型的输出层改了,剔除多余的四千个类别,专门针对比赛的一千个分类做训练。”

    几个人立刻进入了工作状态。

    钟柏负责修改网络输出层的代码结构。

    叶言开始编写过滤多余分类的数据清洗脚本。

    楚一航则坐在电脑前,监控着九章平台的显存调度,为接下来的微调训练预留算力通道。

    教研室里刚才的激动情绪一扫而空,只剩下连串的键盘敲击声。

    ……

    斯坦福大学的人工智能实验室里,大卫用力敲打着回车键。

    屏幕上弹出一行红色的错误提示,伴随着一声警告音。

    大卫抓了抓头发,把键盘推到一边。

    约翰坐在旁边的工位上,转动椅子滑了过来。

    “又报错了?”约翰看着大卫的屏幕。

    “内存溢出。”大卫指着屏幕上的代码行,“这数据量完全超出了现有设备的承受极限。”

    约翰凑近看了一眼后台的运行日志。

    “这套图片分类的数据集太大了,一百万张图片,我们的算法根本跑不动。”约翰连连摇头。

    两人都是李飞飞团队的博士。

    虽然作为主办方团队的成员,但是两人也报名参加了比赛。

    两人正愁眉苦脸,李飞飞拿着一个装满黑咖啡的马克杯走了进来。

    大卫赶紧转头看向李飞飞。

    “飞飞教授,你觉得这次数据集的比赛,第一名大概能达到怎样的程度?”大卫开口询问。

    李飞飞拉过一把办公椅,在大卫身边坐下。

    她把马克杯放在桌上,看着屏幕上的错误日志。

    “大家不要灰心,我们内部其实已经用各种传统数值方法做过测试了。”李飞飞语气平缓。

    大卫立刻来了精神,坐直了身子。

    “教授,测试结果怎么样?”大卫追问。

    李飞飞喝了一口咖啡,放下杯子。

    “根据我们跑出的结果,这套数据集的极限应该可以超过30%。”李飞飞说出了数字。

    约翰在旁边计算了一下。

    “您是指 tOp 1 的正确率?”约翰确认道。

    李飞飞点了点头。

    “是的。至于 tOp 5 的正确率,可以超过70%。”李飞飞补充。

    大卫皱起眉头,手指在桌面上敲击。

    “超过30%?我们在特征提取上花了这么多时间,结果还差这么多?”大卫显得有些沮丧。

    李飞飞看着大卫的眼睛。

    “大卫,科学研究不能只看眼前的得失。目前我们尝试了所有不同的算法,确实只能达到这个程度。”

    李飞飞站起身,走到实验室中央的白板前。

    “但是,我对其他参赛团队很有信心。”李飞飞说。

    “为什么?”约翰不解地问。

    “因为现在这个数据集完全开放了。它会激发全球所有顶尖研究人员的热情。”李飞飞解释道。

    大卫叹了口气。

    “光有热情没用啊,算力跟不上,大家都在用传统的支持向量机做分类,上限就在那里。”大卫反驳。

    李飞飞笑了笑,“这就要感谢英伟达了。他们这次提供了非常大的帮助。”。

    约翰撇了撇嘴。

    “老黄这次确实花了不少钱,几万美元的奖金呢。”约翰调侃道。

    大卫跟着附和。

    “就是,重赏之下必有勇夫。很多人估计连夜都在改代码,就为了抢这笔奖金。”

    李飞飞走回座位。

    “不仅仅是奖金。英伟达设置的赛制非常吸引人,这种实时排名会带来很大的竞争压力。”

    李飞飞继续分析。

    “这些条件加在一起,能帮助比赛吸引更多顶尖团队来提交数据。有竞争,才能取得更高的成绩。”

    大卫还是觉得不乐观。

    “可是教授,您觉得第一名到底能考多少分?”大卫又回到了最初的问题。

    李飞飞在心里盘算了一下。

    “按照目前的学术发展速度,我预测,tOp 1 正确率能到32%。”李飞飞给出了具体的数值。

    “tOp 5 正确率能到75%。”李飞飞继续说道。

    约翰把这两个数字记录在笔记本上。

    “这就到顶了吗?”约翰问。

    李飞飞点头。

    “对,这就是目前的极限了。”李飞飞语气肯定。

    “为什么不能更高?”大卫追问。

    “毕竟以目前的技术水平,据我所知,应该还没有达到那种脱胎换骨的程度。”李飞飞解释。

    李飞飞端起咖啡杯。

    “没有新技术的加入,单靠优化现有算法,32%就是很难突破的瓶颈。”

    大卫靠在椅背上。

    “那这个比赛还有什么意义?大家只是在小数点后两位互相竞争。”大卫抱怨道。

    李飞飞拍了拍大卫的肩膀。

    “不要着急。我觉得,如果这个比赛未来几年一直办下去,一定会产生质的改变。”李飞飞语气中充满期待。

    大卫无奈地重新拉过键盘。

    “好吧,那我继续去改参数。看看能不能把正确率从25%提高到30%。”大卫重新投入工作。

    ……

    同一时间,加拿大多伦多大学。

    教研室的角落里,亚历克斯正盯着电脑屏幕上缓慢跳动的进度条,烦躁地抓了抓头发。

    伊利亚坐在旁边,机械地敲击着键盘。

    “这组数据的预训练还要跑多久?”伊利亚头也不回地问。

    亚历克斯叹了口气,敲了一下回车键。

    “按照现在的运算速度,大概还需要一个星期。这还是不出任何内存报错的情况。”亚历克斯语气里满是绝望。

    长时间的等待让人抓狂,亚历克斯切出编译器,打算看点科技新闻换换脑子。

    一条关于ImageNet视觉识别挑战赛的通告弹了出来。
『加入书签,方便阅读』