第8章
写批注。
现有框架处理不了。
我花了三个月,重构了注意力头的计算方式,加了十一层自定义的预处理模块。
代码注释写了六万字。
但核心逻辑,全在我脑子里。
"可以。"我说。"代码库我开放权限,你们先看。"
我给了他们三台备用工作站和代码仓库的**权限。
钱国栋把我拉到一边,压低声音。
"陆深,甜甜虽然犯了错,但她积极解决问题的态度是好的。你看,人家找来的团队也不差——"
"钱总。"我打断他。
"你让他们先看代码。能看懂了再说。"
他拍了拍我的肩,走了。
转头经过会议室的时候,他停下来,对着几个还在工位上的同事说了一句。
"看看人家甜甜,犯了错不推诿,第一时间找资源、想办法。年轻人就应该这样。"
会议室门没关。
这句话我听得清清楚楚。
他看了我一眼。
我不知道是有意还是无意。
我没说话。
我回到自己的工位,继续做数据恢复。
六个小时后,晚上十一点。
张博士团队的三个人还在加班。
我路过他们工位的时候,屏幕上的代码高亮停在一段注意力头的自定义实现上。
组里那个女生的浏览器开着七八个标签页——全是Stack Overflow的搜索结果。
搜索***:custom attention mechanism unknown function。
张博士本人在看我的预处理模块文档。
表情从"自信"逐渐变成"困惑",最后定格在某种说不清的沉默里。
他注意到我在看他,抬起头。
"陆工,你这个多头注意力的权重共享机制……不是标准实现?"
"不是。我重写的。"
"文档里没写原理。"
"原来在我脑子里。"
他嘴唇动了一下,没说话。
手指在键盘上顿了顿,又开始翻代码。
我走了。
48小时的倒计时,开始了。
第六章
48小时后。
周五下午三点。
会议室。
张博士团队交付了他们的模型。
钱国栋亲自到场。
周甜甜坐在旁边,笔记本电脑摆着,像是要做会议记录。
张博士投屏了评估报告。
PPT做得很漂亮,配色用的
现有框架处理不了。
我花了三个月,重构了注意力头的计算方式,加了十一层自定义的预处理模块。
代码注释写了六万字。
但核心逻辑,全在我脑子里。
"可以。"我说。"代码库我开放权限,你们先看。"
我给了他们三台备用工作站和代码仓库的**权限。
钱国栋把我拉到一边,压低声音。
"陆深,甜甜虽然犯了错,但她积极解决问题的态度是好的。你看,人家找来的团队也不差——"
"钱总。"我打断他。
"你让他们先看代码。能看懂了再说。"
他拍了拍我的肩,走了。
转头经过会议室的时候,他停下来,对着几个还在工位上的同事说了一句。
"看看人家甜甜,犯了错不推诿,第一时间找资源、想办法。年轻人就应该这样。"
会议室门没关。
这句话我听得清清楚楚。
他看了我一眼。
我不知道是有意还是无意。
我没说话。
我回到自己的工位,继续做数据恢复。
六个小时后,晚上十一点。
张博士团队的三个人还在加班。
我路过他们工位的时候,屏幕上的代码高亮停在一段注意力头的自定义实现上。
组里那个女生的浏览器开着七八个标签页——全是Stack Overflow的搜索结果。
搜索***:custom attention mechanism unknown function。
张博士本人在看我的预处理模块文档。
表情从"自信"逐渐变成"困惑",最后定格在某种说不清的沉默里。
他注意到我在看他,抬起头。
"陆工,你这个多头注意力的权重共享机制……不是标准实现?"
"不是。我重写的。"
"文档里没写原理。"
"原来在我脑子里。"
他嘴唇动了一下,没说话。
手指在键盘上顿了顿,又开始翻代码。
我走了。
48小时的倒计时,开始了。
第六章
48小时后。
周五下午三点。
会议室。
张博士团队交付了他们的模型。
钱国栋亲自到场。
周甜甜坐在旁边,笔记本电脑摆着,像是要做会议记录。
张博士投屏了评估报告。
PPT做得很漂亮,配色用的
阅读下一章(解锁全文)
点击即可畅读完整版全部内容
相关书籍
友情链接