首页 > 都市言情> 首富从AI浪潮开始

首富从AI浪潮开始 第118节

  “成本呢?”

  “标注基础设施加上奖励模型训练和迭代,大概五百到一千万,时间三到六个月。上限嘛,”赵文渊想了想,“估计能再提三到五个点,到八十八左右。”

  “这个提升不算大。”

  “在这个阶段每一点提升都很艰难,而且这条路的核心优势不在上限。”赵文渊说,“开物的真实用户行为数据,是我们独有的资产。别人花钱也买不到。”

  韩路一点了下头。

  “第二条,”赵文渊翻到下一页,“MoE,混合专家模型。”

  MoE,Mixture of Experts,混合专家模型。不是把一个模型训得什么都会,而是训一群各有专长的小模型,遇到问题再决定派谁上。像一家公司,与其要求每个员工全能,不如让专业的人做专业的事。

  “这个主要是架构层面的改变。不改基座,不改训练方法,改调用方式、推理方式。把一个大模型拆成多个专精的子模型——一个擅长Python、一个擅长前端、一个擅长数据库。推理时根据任务类型自动路由到最合适的专家,同算力下效果更好,应该也能提三到五个点。”赵文渊接着说。

  “成本?”韩路一问道。

  “一千到两千万,架构要重写,模型要重训,时间四到八个月。”赵文渊说,“技术上挑战不算太大,成本主要是要调的模型多。但是需要补人,我们现在的团队在MoE方面没有经验,至少要招两到三个做过类似架构的人。”

  “最后说第三条。”赵文渊又翻了一页,语气中有点儿兴奋——是他作为科学家的兴奋。

第一百一十八章 第三条路

  虽然没有明说,但赵文渊兴奋的语气让韩路一听出来,第三条是他最想走的路。

  “自训基座模型。”

  “现在市面上的开源底座,不够用了?”

  “别人开源的底座本身,从我们现在的角度来看,有很多的优化空间。如果我们从零开始训练一个代码专用大模型,架构可以针对代码生成做优化——上下文窗口、依赖追踪、多文件理解,全部可以从底层设计。这种方式上限最高,完全自主可控,首轮正确率有可能能做到九十以上。”

  “成本也很高,对吧。”韩路一说。

  “三千万人民币起步。”赵文渊说,“而且是每一次。如果跑飞了——参数配错、数据有问题、损失不收敛,那就得推倒重来,又是三千万。”

  韩路一暗自为这个数字咋舌。

  这就是那种,你心里早就知道它贵,真听到数字还是会感慨:真他妈的贵。

  赵文渊看了他一眼,继续说:“这个方案预估时间六到十二个月,风险极高,但是如果成了——”

  他没把话说完。

  不需要说完。如果成了,天工就不只是微调模型,源码在AI时代就有了核心竞争力,这是谁也拿不走的王牌。

  自己的模型。

  自己的底座。

  自己的护城河。

  这一刻,韩路一其实比谁都清楚,这就是他最想要的东西。

  因为 AI这个行业,本质上是飞轮型竞争。

  越早进场,越早积累数据,越早迭代模型,越早建立产品闭环,就越容易把后面的人甩开。

  领先者不是领先一步。

  而是一步之后,还能借这一小步,再滚出下一步、下下一步。

  飞轮一旦转起来,后面的人想追,除非前面的人自己犯错。

  韩路一看着窗外的江面,心里很清楚:

  这条路,越早开始越好。

  但是,自研模型是个无底洞,究竟能不能成,没人知道。

  三条路,三个价格。

  五百万、一千万、三千万。

  最后一条路是三千万,每次。

  韩路一沉默了一会儿。

  赵文渊没催。

  韩路一站起来走到窗边,太阳照在江面上,亮得有点晃眼。

  他在想的不是技术,技术的部分赵文渊已经足够好了,即使他用视界辅助他自己自学的大模型知识,相比赵文渊的水平也高不出太多。赵文渊的研究水平是业内领先的,他信任视界在这方面的判断。

  他想,现在的困境是钱。

  A轮融了两个亿,但花钱的速度远超预期。团队扩张到五十人,薪资开支翻了快十倍,尤其是模型组,每个人都很贵;服务器成本每个月都在涨,开物的免费用户越多,推理成本就越高。和青岳云签了不限量的年框协议,但问题是云服务商的资源也不是无限的,尤其是GPU,用量上来了之后高峰时段会不够用,开物团队已经在做高峰时段分流到其他服务商的改进了。

  而收入端,千帆白标接入开物API才刚刚起步,能提供一个很好的助力,加上开物用户暴涨,BugKiller的收入也在稳定增长,财务情况看起来还算健康,但这是从运营的角度上来说。

  想训练自有模型,那是远远不够的。

  源码科技在做应用这条路上已经走的很好了。转型做模型,是一个艰难的决定。

  “这三条路,”韩路一转过身来,“你个人倾向哪条?”

  “你问我个人?”赵文渊说,“当然是自主训练。”

  他没有解释为什么,也不需要解释,这是作为研究者的追求。

  “但我知道,”赵文渊接着说,“这不是技术问题。”

  韩路一拿出手机,看了一下日程软件。

  一会儿和陆明洲有个财务数据的对齐会,聊完之后,对财务状况会有更直观的了解。接下来怎么走,还是先看兜里有多少钱再说。

  “你放心。”他说,“我知道该怎么做。”

  赵文渊站起来,把笔记本电脑和笔记本都夹在腋下,准备往外走:“至少现在的后训练已经阶段性成功了,我先回去把接口整理好。”

  韩路一“嗯”了一声。

  赵文渊拉开门,迈出半步。

  “文渊,等一下。”

  赵文渊停住了。

  韩路一看了一眼手机屏幕。

  王志远的事已经发酵了一段时间,他从鼎盛离职,科技圈儿里对这件事情议论纷纷。但是关于是不是要告诉赵文渊自己在这件事中所扮演的角色,韩路一一直没想清楚。

  赵文渊当初被王志远狠狠坑过,把真相告诉他,是个收买人心的好机会。

  但是这件事韩路一和顾司玥做的一直都算隐蔽,知情的只有一个陈博文,他又有把柄在韩路一手上,不会四处乱说。如果告诉赵文渊,多一个知情人,又害怕平添波折。

  视界可以帮他获取信息,却不能帮他做决定。

  韩路一又看了赵文渊一眼,下定了决心。

  “还有件事。”

  赵文渊转过身来,意识到韩路一的表情和刚才聊技术时不太一样。

  赵文渊走回来,没有坐,站在办公桌对面。

  “王志远从鼎盛离职了。”韩路一说。

  赵文渊的表情没有什么变化。

  这个消息对他来说不算全新,虽然还没上媒体,圈子里已经传开了,他也暗地里说过一句“多行不义,报应不爽”。但韩路一亲口跟他说,显然不是为了传八卦。

  “王志远不是主动离职的,”韩路一接着说,“是内部审计查出来的,他违规操作,谋取私利。”

  赵文渊把笔记本电脑放在桌上。王志远的操作,他大概猜到了,CodeSafe和鼎盛合作之前,王志远还和他谈过。可是违规又怎么样呢?王志远那个级别的人,他没想过去碰,以卵击石,又何必呢。

  后来CodeSafe被收购,赵文渊的股份被强制跟售了,没拿到多少钱,他也只怪自己时运不济,技不如人,为此消沉了一段时间。

  “这件事,”韩路一看着他,“是我推动的。”

  办公室里又安静了很长一段时间。

  赵文渊没有追问细节。他没有问怎么推动的、通过谁推动的、用了什么手段。这些不是他需要知道的,他其实也根本不在意。

  但他理解这句话的分量。

  韩路一扳倒了鼎盛的VP,然后选择私下告诉他这件事。

  “当时CodeSafe被鼎盛收购,我的反对无效,后来我被从自己创办的公司踢出局……”赵文渊说,声音有点哑,“我本来觉得,那件事过去了就过去了。”

  韩路一没说话。

  “现在看一看,这次才是真的过去了。”赵文渊说完这句话,从办公桌上拿起电脑。

  他没有多说什么。

  韩路一也没有。

  有些话不需要说出来。

  门关上之后,韩路一在椅子里坐了一会儿,没有动。

  敲门声响了起来。

  “请进。”

  姜亦心推开门,探进半个头:“韩总,打扰一下?”

首节 上一节 118/298下一节 尾节 目录txt下载

上一篇:这个导演不讲规矩

下一篇:返回列表

推荐阅读