首富从AI浪潮开始 第142节
“五十人左右,A轮。”
刘大海皱着眉头,头顶飘着两个为什么——
为什么五十人就敢做大模型,光数据清洗的团队都凑不齐,虎了吧唧的。
为什么这么不切实际的公司今天能来鼎盛开会,还是郑总发话,需要他亲自来给演示。
“郑总的意思,你把坤元最新的评测结果给对方演示一下就行。”程远说。
“坤元”是鼎盛内部通用大模型的代号。乾元是代码大模型,已经公开发布了。坤元是通用模型,还在内部测试阶段,没有对外公布过。
“现在我们内部做到什么水平了?刘博士,能不能先给我解解惑?”
刘大海点了点头,打开了演示界面,顺手调出了一组数据。
“上周刚跑完的结果,”刘大海指着屏幕,“咱们最强的在这,意图理解直接干到了78,比上一版提了将近两个点,老猛了!”
刘大海切到一张对比图,纵轴是综合得分,横轴排着国内外十几家模型。
“你瞅这,综合跑分这个位置,”刘大海用手指点了一下点状图最高的那个点,“GPT-4o。”
然后他的手指往左移了两格:“咱在这,差距大概三个百分点,放在国内这是第一梯队,稳稳当当的!”
接着他切了一张图:“只看意图理解这个单项,咱和OpenAI的差距已经缩到不到0.2个点了,而且在中文场景下咱还能加加,支棱支棱超过去也不是啥大问题。”
程远看着那张图,心里踏实了不少,这个数字拿出去,足够让任何一个创业公司掂量掂量自己几斤几两。
“刘博士,演示的时候你把这张对比图放出来就行,不用太详细,点到为止。”
“嗨,妥妥的。”刘大海关掉了屏幕,“说实话我不太乐意整这种对外演示,但郑总发话了,那就走个过场呗。”
程远笑了笑,没接话。
刘大海也不在乎,掏出手机开始接着看论文。
一点五十。
还有十分钟就又要和韩路一见面了,程远拉了拉看完表的袖口,嘴角不自觉地挂上了一抹势在必得的笑意。
第一百四十章 好戏开场
两点整,韩路一一行人走出电梯。
鼎盛大厦三十三层的走廊很宽,铺着浅色的地砖,墙上挂着几幅画,看不出画的是什么,有点抽象。
张彪在走廊尽头的休息区坐下来,开始刷手机,连刷手机的时候背都挺的笔直。
前台引着韩路一和赵文渊走向图灵厅。
程远已经站在会议室门口了,看到韩路一过来,笑着伸出手。
“韩总,欢迎欢迎。”
手握得有力,节奏控制得很好,不松不紧,三秒松手,掌握着主动权,带一点“我比你年长”的上位感。
然后他看到了韩路一身后的赵文渊,脸上的笑容一僵。
当初收购CodeSafe的时候,就是程远出的面。程远做得比较绝,没有给赵文渊留岗位,股价压得也很低。赵文渊被逼出局之后他再也没有关心过弃子的动向。
虽然那是王志远促成的收购,但是现在,在这个场合碰见赵文渊,程远还是觉得不妙。
“赵总,没想到会在这见到你。”程远伸出手。
赵文渊握了一下,客气但不多余:“程总,又见面了。”
两个人都没提上次的事,但各自怀着不同的心境。
韩路一打开视界。
淡蓝色面板浮现——
【程远|43岁|鼎盛集团·战略投资部VP】
【情绪:自信】
【隐藏情绪:惊疑】
【当前状态:收购谈判预案执行中】
这惊疑是从哪来的?
“请进,”程远侧身让路,“给你们介绍一下,这位是我们的刘大海刘博士,鼎盛集团模型方向的首席科学家。”
刘大海本来在看手机,听到动静抬起头,站起来和两人颔首示意,算是打了个招呼。
“那啥?韩总是吧,幸会幸会。”
可能是口音加持,听着语气还挺诚恳,就是过于随和,像在澡堂偶遇了朋友的朋友。
赵文渊主动伸出手:“刘博士,久仰。你在OpenAI做Scaling Law那篇论文我读过很多遍,对我们自己的训练策略影响很大。”
刘大海愣了一下,显然没预料到对面还有人认识自己的学术工作,他看了看赵文渊,又看了看程远,表情像在问“这位是?”
“赵文渊,源码科技的模型负责人。”赵文渊自己介绍了。
“哦哦,”刘大海握了下手,“你们几个人搞模型啊?”
今天谈的是新公司、新项目,不是源码的天工,赵文渊犹豫了一下,说:“目前就我一个。”
刘大海的表情有点没绷住,像是听到有人说自己在家里拿电饭锅炼钢。
“那挺牛的。”他把赵文渊当成哪来的民科了,“坐坐坐,来都来了。”
韩路一对准刘大海开了视界。
淡蓝色面板——
【刘大海|42岁|鼎盛集团·首席科学家】
【情绪:心不在焉】
【当前状态:想赶紧做完演示回去做研究】
【核心驱动:纯粹技术好奇心(极强)|对商业博弈无兴趣】
和程远完全不同。
程远的面板写满了权力,预案,控制。而刘大海的面板里只有对技术的渴望。
刘大海一坐下就打开了工作站的投影,动作很快,明摆着想赶紧演完赶紧走。
投影亮起来,是鼎盛内部评测系统的界面。
“咱就长话短说,不浪费韩总时间哈。”刘大海切出一组数据,指着屏幕,“这是鼎盛内部的通用基座大模型项目——坤元,目前还在比较早期的阶段,但是已经有一些成绩了。你看,这是最新的评测结果,和GPT-4o差大概三个百分点。”
“咱们的目标就是冲着GPT去的,有信心明年就能发布哈。尤其是意图理解这块是咱们的绝对强项。”
他切到实时演示窗口,上传了一个包含原始数据的表格(xlsx)文件,然后快速输入了一段模糊需求:“帮我做一份销售团队的绩效分析。”
坤元回复很快,一秒多钟就开始流式弹出回复,大概几十秒结束了。屏幕上是一份结构完整的报告,数据维度、对比指标、可视化建议全列了,格式工整。
韩路一和赵文渊对视了一眼,点了点头。
鼎盛果然也在做通用大模型,而且成果确实不差。
二百多人的团队、十几亿的投入,做出来的东西配得上这个评价。
程远一直在边上观察着他的表情,没看到预期中的震惊。
这让他有些意外。
“韩总觉得怎么样?”程远问。
“坤元确实很强,”韩路一说,“国内能做到这个水平的团队不超过三家。”
程远微微一笑,心想你知道就好,接下来就是我的节奏了。他刚想顺着往下接——
韩路一从背包里拿出了笔记本电脑。
“不过,程总,刘博士,”韩路一打开电脑,“我也准备了一点东西想给你们看一下,Wi-Fi密码是多少?”
连上Wi-Fi,他把屏幕转向对面两人。
“这是我们最近用开源基座微调的一个通用模型,内部代号是汤圆,7B参数,训练数据不到一万条。”
汤圆是前两天刚起的名字,当时韩路一正在吃黑芝麻汤圆。
刘大海看着韩路一的屏幕,眉毛拧在了一起。
这啥意思啊?
7B参数,不到一万条数据。
鼎盛训练坤元是几百亿参数,训练时间已经三个多月了。
光是标注数据就攒了几十万条,专门雇了两百人的标注团队干了半年。
你说你7B的参数加一万条标注数据?那连一个实验室的暑期实习项目都不如。
“您来出题?”韩路一看着一脸迷惑的刘大海,淡定地说。
刘大海瞥了程远一眼,程远点了一下头:咱有点礼貌,配合,配合一下。
“行吧。”
刘大海拉过韩路一的笔记本电脑,在浏览器打开的聊天界面里打了几行字。
