1李想坐在那。椅子上。房间里只有他一个人。电脑屏幕的光打在脸上。白惨惨的。
屏幕上是个国际论坛。叫“尖峰”。里面全是各个国家的大牛。专家。教授。
李想只是个学生。国内一所普通大学。他是通过导师的关系,弄了个观察员的身份。只能看,
不能说话。他看着那些ID在聊天框里刷屏。英文。德文。法文。像一群他看不懂的鸟在叫。
他手里攥着一个馒头。早就凉了。硬得像块石头。他来自一个小镇。镇上只有一所高中。
他爸妈都是工人。他们跟他说,想走出去,就做题。不停地做题。他做了。从小到大,
做的题堆起来比他还高。他考上了大学。来了大城市。可他到了这里,才发现自己啥也不是。
人家聊的他听不懂。人家玩的他没见过。他就像那个凉馒头,又干又硬。
一个叫Hans的ID跳了出来。是个德国佬。搞人工智能的。大牛。Hans发了一段话。
很长。李想看懂了。大意是说,东亚的教育模式,尤其是中国的,就是培养做题机器。
没有创造力。只会模仿。永远跟在别人屁股后面。下面一堆人附和。
re good at copying, not creating.”李想的手停了。
鼠标在他手心里。有点潮。他看着那些字。一个一个。都像针。扎他眼睛。奈何。他想。
我读了那么多书。做了那么多题。熬了那么多夜。到头来,在人家眼里,我就是个机器?
个会模仿的玩意儿?他把那个凉馒头放在桌上。很轻。没发出声音。然后,他深吸一口气。
他点开了那个灰色的发言框。他不能说话。观察员没有权限。但他可以申请发言。
他的手指在键盘上停了一下。然后,他敲下了申请理由。四个字。“我不同意。”发送。
2申请发出去。石沉大海。聊天框里,Hans还在说。他贴出了一张图。
是个复杂的算法模型。
ving problems from a textbook.” HANS打字很快。
下面又是一片叫好。李想盯着那个发言框。还是灰色的。他心里有点堵。像塞了一团湿棉花。
他知道自己就是个 nobody。谁会理一个 nobody 的发言申请?
他有点想关掉网页。去泡碗面。加根肠。就在这时。屏幕右下角。一个头像亮了。
是个黑白的莲花图案。很静。ID叫 SuRui。李想的心跳了一下。他不知道为什么。
这个ID他见过。是论坛的版主之一。很神秘。很少说话。那个莲花头像旁边,
弹出一个私聊框。SuRui: “Why?”就一个词。李想愣了。他看看自己的申请。
又看看那个词。他想了想。打字回复。“因为他说的不对。
”SuRui: “Prove it.”李想看着这两个字。手指有点抖。他怎么证明?
他只是个学生。Hans是大牛。大牛说的话,就是真理?他脑子里乱糟糟的。
全是那些做过的题。那些公式。那些定理。它们在他脑子里转。像一团乱麻。
他忽然想起一件事。大一的时候,他做过一个课题。关于神经网络优化的。很偏门。
导师都说他钻牛角尖。但他做出来了。写了一篇论文。投给了一个国内的三流期刊。
石沉大海。他当时觉得挺可惜。现在,那团乱麻里,好像有根线头被拽了出来。
他的手指又动了起来。“Hans的那个模型,我看过。他的基础架构,
引用了三年前一篇论文。那篇论文有个前提假设。在特定环境下成立。”他发过去。
SuRui没回。李想等。一秒。两秒。他感觉自己像个在法庭上说话的证人。
等着法官的判决。忽然。他那个灰色的发言框。亮了。他获得了发言权限。
那个莲花头像旁边,又弹出一句话。
Rui: “The floor is yours.”3李想看着那个亮起来的发言框。
整个世界好像都安静了。他能听见自己的心跳。咚。咚。咚。他脑子里的那团乱麻,
瞬间理顺了。他不再去想自己是谁。不再去想自己是不是个做题家。他现在只有一个身份。
一个要证明Hans错了的人。他的手指放在键盘上。他没有长篇大论。他只发了一张图。
一张截图。来自三年前的一篇论文。就是他提到的那篇。他用红圈,圈出了其中一行字。
一个前提假设。然后,他发了一句话。“Hans先生。您的基础,建立在一个沙滩上。
”论坛里静了一下。然后,炸了。
profile says he's a student!”Hans的ID也动了。
他发了一个“?”。李想继续打字。“您的模型,在数据量小于某个阈值时,
会陷入局部最优解。效率会下降百分之四十。您没测试过吗?还是您测试了,但没说出来?
”他的话很直接。很冲。没有一点客套。这就是他。一个做题家。他只相信数据和逻辑。
不相信人情世故。聊天框里,那些大牛们开始讨论。
evolutionary as he claimed.”Hans的ID沉默了很久。
李想就等着。他像一只耐心的狼。等着猎物露出破绽。他知道自己赌对了。
他赌Hans这种大牛,不会亲自去跑那些繁琐的底层测试。他有自己的团队。他只看结果。
而那个团队的测试报告里,很可能为了迎合老板,故意忽略了那个“特定环境”。终于。
Hans回复了。
“Nonsense. Show me the data.” 他的话里,带着怒气。
4“Show me the data.”李想看着这行字。他笑了。数据?
他当然有数据。他大一做那个课题的时候,就是为了验证这个。他花了半年时间,
在学校那台破服务器上,跑了无数个模型。他把那些数据都整理过。
放在一个加密的文件夹里。名字叫“我的青春”。他现在觉得,这名字起得真好。
他没有直接把数据扔出去。那样太没意思了。他要一步一步地,把Hans逼到墙角。
他又发了一句话。“数据很简单。您可以自己跑。用您自己的模型。
数据集用ImageNet的子集,限制在一万张图片以内。您会看到结果的。
”他在给Hans下套。他算准了Hans不会这么干。一个大牛,
亲自去跑一个学生提出来的测试?传出去,面子往哪搁?果然。Hans没回复。
但李想能感觉到,屏幕那头的德国佬,脸一定很绿。论坛里的人都在等。
看Hans怎么接招。就在这时。那个莲花头像,SuRui,在主频道里说话了。
这是她第一次在主频道说话。
y is solid. Why not just run it?”她的ID是版主。
她的话,就是权威。Hans被架在火上烤。过了足足五分钟。Hans的ID才再次亮起。
e data, show it. If not, shut up.”他开始耍赖了。
李想看着他这句话。他没生气。他只是觉得有点好笑。原来,所谓的学术权威,
也会说“我没时间”和“你闭嘴”。这跟镇上那些吵架的大妈,有什么区别?
李想的手指又动了起来。“我没说我有数据。”他发了一句。论坛里的人都愣了。
“什么意思?
d he has data!” “Is he trolling?”李想不紧不慢地,
发了第二句话。“我只是说,您的模型有问题。我甚至不需要用我自己的数据来证明。
”他停顿了一下,让所有人都有时间消化这句话。然后,他发了第三句话。
“我只需要用您自己的数据。”5“我只需要用您自己的数据。”这句话一出来。
整个论坛都死寂了。所有人都懵了。用Hans自己的数据,
证明Hans自己的模型有问题?这怎么可能?这就好像用一把刀,去砍这把刀自己。
能砍断吗?Hans的ID也愣住了。他发了一个词。“How?”李想知道,鱼上钩了。
他开始发图。一张。又一张。全是Hans自己发布的那篇论文里的配图。数据图。
性能对比图。李想用红色的箭头,在图上标注。“Hans先生。您看这张图。
这是您的模型在CIFAR-10数据集上的表现。准确率百分之九十八。很棒。
”“再看这张。这是您的模型在另一个数据集上的表现。准确率百分之九十七点九。也很棒。
”“但是,您有没有发现一个问题?”李想停了下来。他在吊胃口。所有人的心都提了起来。
Hans也忍不住了。“What problem?”李想发了最后一张图。
是Hans论文里的一张汇总表。“您所有的测试,
用的都是大型、干净、标注完美的数据集。
您从来没有在小型、或者带有噪音的数据集上测试过。”“我的理论是,您的模型,
在处理这些‘脏’数据时,表现会非常差。差到不如一个三年前的传统算法。
”“我为什么这么说?”“因为您那个前提假设,‘数据服从高斯分布’,
在这些‘脏’数据里,根本不成立。”李想把所有的推理,一次性全扔了出来。像一颗炸弹。
论坛里,那些大牛们瞬间就明白了。
environment. His model is fragile.”李想没有停。
他发了最后一击。“我不需要跑代码。我只需要看您自己的论文。您自己,
已经证明了您的模型有缺陷。”“您只是,没看懂自己写的论文。”6“您只是,
没看懂自己写的论文。”这句话。像一记耳光。狠狠地抽在Hans的脸上。隔着屏幕。
李想都能感觉到那股火辣辣的疼。论坛里。静得能听见针掉在地上的声音。然后。
是山呼海啸般的反应。
owned Hans with his own paper!”无数条私信涌向李想。
全是加好友的请求。有美国的教授。有日本的研究员。有以色列的工程师。李想没看。
他只盯着一个ID。那个黑白的莲花。SuRui的私聊框,又亮了。
SuRui: “Well done.”后面跟了一个微笑的表情。李想看着那个微笑。
他心里的那团湿棉花,好像一下子被阳光晒干了。
他感觉自己不是坐在那个又小又暗的房间里。他站在山顶上。风吹着他的头发。他第一次,
感觉自己不是个“小镇做题家”。他就是李想。一个用自己的脑子,赢得了尊重的人。
他回复SuRui。“谢谢。”SuRui: “我很好奇。你是怎么想到的?
”李想想了想。打字。“因为我穷。”“我们学校的服务器很破。跑不了大型数据集。
我只能用那些小数据集。那些‘脏’数据。”“所以,我发现了别人发现不了的问题。