首富从AI浪潮开始 第136节
“期待你的消息,Louis。”
“我也是,期待下次谈话。”
画面一黑。
会议室突然安静得不太习惯,之前屏幕那头持续了将近一个小时的环境声全部消失,只剩中央空调送风的细响。
苏念念转头看向韩路一:“你真的是这么想的?”
韩路一哈哈一笑,肩膀松弛了下来,转头看向苏念念。
“当然是骗他的。怎么,你也相信啦?”
第一百三十四章 远超预期
两人来到韩路一的办公室,正准备就刚才的视频会议,谈谈应对策略。
这时,门外传来了急促的敲门声。
“韩总,在吗?”
是赵文渊的声音。
韩路一和苏念念对视了一眼。
韩路一走过去把门打开,赵文渊手里抱着笔记本电脑,一脸兴奋。
“韩总!真神了!”他一边说一边走进来,才突然注意到苏念念也在房间里,一愣。
随即他的表情放松下来,把笔记本电脑放在办公桌上。
“正好,苏总你也在,一起看看。”赵文渊说道,“第一轮训练的结果出来了。”
他翻开屏幕,手指在触控板上快速滑动,调出一个表格。
“先看基础数据。”赵文渊切到第一页,“7B的开源基座微调,参数量不到GPT-4的二十分之一。知识问答、逻辑推理、数学计算、代码生成,常规指标在同量级模型里中游偏上,没有惊喜。7B就是7B,没法跟几百B的大家伙比。”
他看了韩路一一眼,期待着他的反应。
“重点在下一页。”
赵文渊翻到第二页。
屏幕上是一张柱状图。横轴排列着十几个模型的名字,纵轴是分数。
韩路一认出了几个:GPT、Mercury、Gemini。
这些名字旁边的柱子高度差不多,分数集中在71到78之间。
最右边有一根单独的浅蓝色柱子,明显高出一截。
模型名称是PX-7B-post_trained-v0.1。
顶端的数字是83.7。
“意图理解维度的评测结果。”赵文渊的声音压低了,语速却很快。“评测集用的是IFEval标准框架加上我自己设计的深层意图还原测试,一共一千二百道题,覆盖十六个垂直场景。”
他拿手指点了点那根浅蓝色的柱子。
“83.7,断层领先。”
“第二名,GPT,78.2。”
“第三名,Gemini,76.9。”
韩路一自己看了一下 Mercury 3.1——就是刚才瑞恩展示的那个,得分是74.8。
办公室安静了三秒钟。
韩路一没有说话。苏念念也没有。
“我跑了三遍验证。”赵文渊说。“第一遍以为评测代码写错了。第二遍换了评测框架,分数不同,但是结果排序一样。第三遍打乱评测集做交叉验证,误差在0.3个点以内。”
他往后翻了一页。屏幕上是具体的案例对比——左列是用户输入,中间是各模型的理解结果,右列是标注的真实意图。
赵文渊翻了几页案例对比,没有逐条讲解,但每一页停留的时间特意拉长了一些,像是在确认韩路一和苏念念有没有跟上。
韩路一跟上了。
意图理解,简单来说,就是模型能不能读懂用户真正想要什么。用户打字输入的内容是表面,表面之下是处境、是约束、是没说出口的真实需求。绝大多数模型在做的事情是理解字面意思,然后给出一个正确但泛泛的回答。而PX-7B做到的,是从同样的输入中读出字面背后那个具体的人。
这是一个极其困难的任务。参数量大十倍的模型都未必做得好,因为它考验的不是知识储备,而是对人的理解。
赵文渊合上案例页,回到那张柱状图。
赵文渊郑重说出了这句话。
“韩总,我做这行这么多年了,从来没见过一个7B的东西能在任何单项维度上打赢GPT-4,从来没有。”
“而且这才是第一轮,只跑了几个epoch,超参数都没调到最优。在这个基础上再调试几轮,还有上升的空间。”
苏念念一直没说话,这时候才轻轻开口说了一句:“意图理解……这不就是开物一直想做的事吗?”
韩路一点了点头,心里好像都松了一些。
视哥,给力!
沉思了一下,韩路一问了一个问题。
“如果有十万条这种精度的数据呢?”
赵文渊仰起头,对着天花板想了一会儿。
“十万条这种精度的标注,”他慢慢说,“理论上足够在70B甚至更大的基座上把意图理解能力拉到当前行业天花板,之上。”
“这不是提升几个百分点的事,你可以想象从GPT-3到GPT-4那种级别的换代。”
“而且不只是意图理解,意图理解是模型的基础能力,模型一旦真正学会了理解人话,所有下游任务的表现都会跟着涨,回答更精准,代码更贴合需求,内容更有针对性,用户满意度提升——”
他停住了,意识到自己说得太远。
“这是理论上。”他往回收了一步,“实操还要看数据分布、训练稳定性、泛化表现,不能简单的线性推理,但方向肯定没问题。”
他接着说:“这个效果,这个水平的标注数据,拿到任何一家大模型公司去做对齐训练,都可以让意图理解直接上一个档次。”
“韩总,我融资经验不多,但我可以肯定的告诉你,我们不会缺融资了。”
韩路一和苏念念对视了一眼,都为这个好消息感到振奋,刚刚Nexus AI带来的压力也被扫清了一些。
“把参数调完,做一个最优的原型出来,你大概还要多少时间?”韩路一问。
“一周吧。”说完,赵文渊面露难色,“但是,要占用工作时间。”
这就是韩路一和赵文渊之前讨论的灰色地带了,在工作时间使用工作资源做出的成果,源码科技可以主张所有权,如果宏远真的和韩路一闹僵了,这就是个隐患。
想了一会儿,赵文渊说:“我先请无薪假吧,一周,先把成果做出来。”
韩路一点了点头:“不用过沈丛云,我来批。”
赵文渊准备起身告辞,韩路一叫住了他,转头看了一眼苏念念,才说道:“既然训练结果不错,趁你们两个都在,我说个事。”
两人一起看向韩路一。
“融资的事,我仔细想过了。既然我们最缺的只是算力,也没必要从投资人那绕一大圈,直接找有算力的人用算力入股。”
“现在国内的几个大玩家,这方面最有实力的还是鼎盛。源码过去和鼎盛有点不愉快,但我希望你们别有芥蒂。”
韩路一说完,看了两人一眼,又补充道:“当然,这是我的初步想法,你们有什么建议都可以提。”
苏念念先表态:“我没什么问题,在商言商,只要能以最快的速度把模型做出来,和谁合作无所谓,而且——”
她看了赵文渊一眼:“你其实不用问我的看法。不管和谁合作,保持住控制权才是最重要的。”
听完韩路一的问题,赵文渊沉默的更久一些。良久,他才开口道:“非得在国内找吗?我在谷歌——”
韩路一打断他:“文渊,大模型的训练,必须得在国内!”
赵文渊抬起头看向他,发现他也正盯着自己,两人对视了一会儿,赵文渊点点头:“……我明白了,我没问题。”
“既然这样,后面的就交给我谈吧。”韩路一说道。
韩路一送两人走出办公室后,拿出了手机,找到了程远的微信。
当时两人见面加上微信之后,程远发过来一条问候:“韩总,我是鼎盛程远。今天一见如故。以后常联系,有合作意向的话第一时间告诉我。”
韩路一一直没有回复。
隔了半个多月,他要主动发消息了。
尴尬吗?
不尴尬。
做生意,哪有什么尴尬的?
无非是利益而已。
“程总,不好意思,刚看到。我这边有个新项目的想法,有时间聊一聊?”
发送。
第一百三十五章 名扬海外
程远的信息回的很快:“韩总,太见外了!鼎盛战投部的大门一直为源码科技打开!”
