首富从AI浪潮开始 第118节
“成本呢?”
“标注基础设施加上奖励模型训练和迭代,大概五百到一千万,时间三到六个月。上限嘛,”赵文渊想了想,“估计能再提三到五个点,到八十八左右。”
“这个提升不算大。”
“在这个阶段每一点提升都很艰难,而且这条路的核心优势不在上限。”赵文渊说,“开物的真实用户行为数据,是我们独有的资产。别人花钱也买不到。”
韩路一点了下头。
“第二条,”赵文渊翻到下一页,“MoE,混合专家模型。”
MoE,Mixture of Experts,混合专家模型。不是把一个模型训得什么都会,而是训一群各有专长的小模型,遇到问题再决定派谁上。像一家公司,与其要求每个员工全能,不如让专业的人做专业的事。
“这个主要是架构层面的改变。不改基座,不改训练方法,改调用方式、推理方式。把一个大模型拆成多个专精的子模型——一个擅长Python、一个擅长前端、一个擅长数据库。推理时根据任务类型自动路由到最合适的专家,同算力下效果更好,应该也能提三到五个点。”赵文渊接着说。
“成本?”韩路一问道。
“一千到两千万,架构要重写,模型要重训,时间四到八个月。”赵文渊说,“技术上挑战不算太大,成本主要是要调的模型多。但是需要补人,我们现在的团队在MoE方面没有经验,至少要招两到三个做过类似架构的人。”
“最后说第三条。”赵文渊又翻了一页,语气中有点儿兴奋——是他作为科学家的兴奋。
第一百一十八章 第三条路
虽然没有明说,但赵文渊兴奋的语气让韩路一听出来,第三条是他最想走的路。
“自训基座模型。”
“现在市面上的开源底座,不够用了?”
“别人开源的底座本身,从我们现在的角度来看,有很多的优化空间。如果我们从零开始训练一个代码专用大模型,架构可以针对代码生成做优化——上下文窗口、依赖追踪、多文件理解,全部可以从底层设计。这种方式上限最高,完全自主可控,首轮正确率有可能能做到九十以上。”
“成本也很高,对吧。”韩路一说。
“三千万人民币起步。”赵文渊说,“而且是每一次。如果跑飞了——参数配错、数据有问题、损失不收敛,那就得推倒重来,又是三千万。”
韩路一暗自为这个数字咋舌。
这就是那种,你心里早就知道它贵,真听到数字还是会感慨:真他妈的贵。
赵文渊看了他一眼,继续说:“这个方案预估时间六到十二个月,风险极高,但是如果成了——”
他没把话说完。
不需要说完。如果成了,天工就不只是微调模型,源码在AI时代就有了核心竞争力,这是谁也拿不走的王牌。
自己的模型。
自己的底座。
自己的护城河。
这一刻,韩路一其实比谁都清楚,这就是他最想要的东西。
因为 AI这个行业,本质上是飞轮型竞争。
越早进场,越早积累数据,越早迭代模型,越早建立产品闭环,就越容易把后面的人甩开。
领先者不是领先一步。
而是一步之后,还能借这一小步,再滚出下一步、下下一步。
飞轮一旦转起来,后面的人想追,除非前面的人自己犯错。
韩路一看着窗外的江面,心里很清楚:
这条路,越早开始越好。
但是,自研模型是个无底洞,究竟能不能成,没人知道。
三条路,三个价格。
五百万、一千万、三千万。
最后一条路是三千万,每次。
韩路一沉默了一会儿。
赵文渊没催。
韩路一站起来走到窗边,太阳照在江面上,亮得有点晃眼。
他在想的不是技术,技术的部分赵文渊已经足够好了,即使他用视界辅助他自己自学的大模型知识,相比赵文渊的水平也高不出太多。赵文渊的研究水平是业内领先的,他信任视界在这方面的判断。
他想,现在的困境是钱。
A轮融了两个亿,但花钱的速度远超预期。团队扩张到五十人,薪资开支翻了快十倍,尤其是模型组,每个人都很贵;服务器成本每个月都在涨,开物的免费用户越多,推理成本就越高。和青岳云签了不限量的年框协议,但问题是云服务商的资源也不是无限的,尤其是GPU,用量上来了之后高峰时段会不够用,开物团队已经在做高峰时段分流到其他服务商的改进了。
而收入端,千帆白标接入开物API才刚刚起步,能提供一个很好的助力,加上开物用户暴涨,BugKiller的收入也在稳定增长,财务情况看起来还算健康,但这是从运营的角度上来说。
想训练自有模型,那是远远不够的。
源码科技在做应用这条路上已经走的很好了。转型做模型,是一个艰难的决定。
“这三条路,”韩路一转过身来,“你个人倾向哪条?”
“你问我个人?”赵文渊说,“当然是自主训练。”
他没有解释为什么,也不需要解释,这是作为研究者的追求。
“但我知道,”赵文渊接着说,“这不是技术问题。”
韩路一拿出手机,看了一下日程软件。
一会儿和陆明洲有个财务数据的对齐会,聊完之后,对财务状况会有更直观的了解。接下来怎么走,还是先看兜里有多少钱再说。
“你放心。”他说,“我知道该怎么做。”
赵文渊站起来,把笔记本电脑和笔记本都夹在腋下,准备往外走:“至少现在的后训练已经阶段性成功了,我先回去把接口整理好。”
韩路一“嗯”了一声。
赵文渊拉开门,迈出半步。
“文渊,等一下。”
赵文渊停住了。
韩路一看了一眼手机屏幕。
王志远的事已经发酵了一段时间,他从鼎盛离职,科技圈儿里对这件事情议论纷纷。但是关于是不是要告诉赵文渊自己在这件事中所扮演的角色,韩路一一直没想清楚。
赵文渊当初被王志远狠狠坑过,把真相告诉他,是个收买人心的好机会。
但是这件事韩路一和顾司玥做的一直都算隐蔽,知情的只有一个陈博文,他又有把柄在韩路一手上,不会四处乱说。如果告诉赵文渊,多一个知情人,又害怕平添波折。
视界可以帮他获取信息,却不能帮他做决定。
韩路一又看了赵文渊一眼,下定了决心。
“还有件事。”
赵文渊转过身来,意识到韩路一的表情和刚才聊技术时不太一样。
赵文渊走回来,没有坐,站在办公桌对面。
“王志远从鼎盛离职了。”韩路一说。
赵文渊的表情没有什么变化。
这个消息对他来说不算全新,虽然还没上媒体,圈子里已经传开了,他也暗地里说过一句“多行不义,报应不爽”。但韩路一亲口跟他说,显然不是为了传八卦。
“王志远不是主动离职的,”韩路一接着说,“是内部审计查出来的,他违规操作,谋取私利。”
赵文渊把笔记本电脑放在桌上。王志远的操作,他大概猜到了,CodeSafe和鼎盛合作之前,王志远还和他谈过。可是违规又怎么样呢?王志远那个级别的人,他没想过去碰,以卵击石,又何必呢。
后来CodeSafe被收购,赵文渊的股份被强制跟售了,没拿到多少钱,他也只怪自己时运不济,技不如人,为此消沉了一段时间。
“这件事,”韩路一看着他,“是我推动的。”
办公室里又安静了很长一段时间。
赵文渊没有追问细节。他没有问怎么推动的、通过谁推动的、用了什么手段。这些不是他需要知道的,他其实也根本不在意。
但他理解这句话的分量。
韩路一扳倒了鼎盛的VP,然后选择私下告诉他这件事。
“当时CodeSafe被鼎盛收购,我的反对无效,后来我被从自己创办的公司踢出局……”赵文渊说,声音有点哑,“我本来觉得,那件事过去了就过去了。”
韩路一没说话。
“现在看一看,这次才是真的过去了。”赵文渊说完这句话,从办公桌上拿起电脑。
他没有多说什么。
韩路一也没有。
有些话不需要说出来。
门关上之后,韩路一在椅子里坐了一会儿,没有动。
敲门声响了起来。
“请进。”
姜亦心推开门,探进半个头:“韩总,打扰一下?”
