学霸的模拟器系统 第451节
“安慰剂组的数据脏得没法看!”
她调出一张散点图。
屏幕上密密麻麻全是噪点。
“你看这几个样本,有些病人的认知能力评分提高了20%。
“但他们的脑脊液生物标志物根本没变!
“这是典型的安慰剂效应漂移,或者是评估医生的主观误差。”
林允宁凑过去。
屏幕上的光映在他的瞳孔上。
他伸出手指,在屏幕上虚画了一个圈。
“别用K-Means聚类,那个对噪声太敏感。
“用DBSCAN(基于密度的聚类算法)。
“半径设小一点,最小点数设为5。”
林允宁直起腰,揉了揉酸痛的后颈。
“把那些密度不够的离群点全部剔除。
“具体的参数设定,等下我写个详细的文档,发你邮箱。”
程新竹愣了一下,随即松了口气。
“你都准备好了?”
“放心——”
林允宁提起放在脚边的黑色电脑包。
包带勒在肩膀上,沉甸甸的。
“我是去法国,又不是去仙女座星系,那边有网络。
“有事发邮件,我晚上回酒店会看。”
他环视了一圈这间办公室。
每个人都在忙碌。
方雪若在用手机发信息,克莱尔在敲击键盘,维多利亚在翻看合同条款。
以太动力已经是一台正在高速运转的精密机器。
而他,则可以暂时卸下包袱,去追寻宇宙的真理。
……
芝加哥大学,埃克哈特楼(Eckhart Hall)。
哥特式的石造建筑上,枯黄的藤蔓抓着灰白的石墙,在寒风中瑟瑟发抖。
林允宁在楼下的石阶上找到了赵晓峰和苏畅。
两个学生缩着脖子,手里捧着印有校徽的纸杯咖啡,试图汲取一点热量。
赵晓峰脚边放着厚厚一叠打印纸。
最上面那张,已经被咖啡渍洇湿了一大块。
“林老师!”
看到林允宁,两人立刻弹了起来。
“坐。”
林允宁紧了紧风衣领口,一屁股坐在冰凉的石阶上。
寒气顺着牛仔裤直钻骨髓。
他伸手拿过赵晓峰那叠纸。
纸上密密麻麻全是手写的公式,还有被粗暴划掉的错误推导,铅笔芯断裂的痕迹清晰可见。
“Tevatron(费米实验室加速器)的那些旧数据,我知道全是噪音。”
林允宁指着纸上一处混乱的能谱图。
“几千个物理学家,几十年的撞击数据。
“你用普通的统计方法,这辈子也洗不干净。
“晓峰,你有以太动力计算集群的最高权限。
“别省着。”
“加一个自动编码器(Autoencoder)进去。”
林允宁掏出一支笔,在图谱旁边画了一个沙漏形状的结构。
“让神经网络先学习什么是‘正常’的数据分布。
“然后让它去重构这些数据。
“只有那些重构误差特别大的、神经网络‘看不懂’的样本,才是我们要找的东西。”
“新物理,往往就藏在这些误差里。”
赵晓峰盯着那个沙漏图,满是血丝的眼睛瞪得溜圆。
“降维……再重构……
“把异常当成信号……
“我懂了!谢谢林老师!”
林允宁点点头,拍了拍他的肩膀,又转头看向苏畅。
这个有着联觉症的女孩,正盯着地上的一滩积水发呆。
水面上漂着几滴汽油,折射出五彩斑斓的光圈。
“还在纠结那组点云?”
苏畅回过神,有些局促地搓着手。
“嗯……
“我算出的贝蒂数总是不稳定。
“那个拓扑结构,在我脑子里一会儿是绿色的环,一会儿又碎成了蓝色的点。”
林允宁静静地听着,露出了温和的笑。
“联觉症”,真是个很有趣的特质
“因为你太关注‘瞬间’了。”他说道。
“拓扑数据分析的核心是‘持续同调’(Persistent Homology)。
“你要关注的不是某个参数下的孔洞。
“而是随着过滤参数的变化,哪些孔洞是‘长寿’的。”
他在苏畅的笔记本上画了几条长短不一的横线。
“去画这个条形码图(Barcode)。
“短的条码是噪声,长的条码才是信号。
“就像你在听交响乐。
“别去管那些偶尔出现的咳嗽声。
“去听那个贯穿始终的主旋律。”
苏畅看着那些横线,原本迷茫的眼神慢慢聚焦。
“主旋律……”
林允宁站起身,拍了拍裤子上的灰。
“行了,回实验室去吧。
“这鬼天气,把脑子都冻僵了。”
……
I-90高速公路上。
红色的尾灯连成了一条停滞的长河。
周五下午的芝加哥,拥堵得让人绝望。
广播里,新闻主播正在用焦虑的语调,播报着通用汽车申请政府救助的最新进展。
“……底特律在流血,华尔街在燃烧……”
林允宁坐在副驾驶,伸手关掉了收音机。
车厢里瞬间安静下来。
上一篇:影视:开局从同过窗开始进步!
下一篇:返回列表
