首页 > 都市言情> 我的智商逐年递增

我的智商逐年递增 第226节

  他点开那个压缩包,解压。

  打开里面的文本文档。

  只看了一眼,楚戈的脸就黑了。

  密密麻麻的文本,几百页。

  里面全是不规则的数据。

  有些是正常的中文标签风景,人物。

  有些是乱码%&*#¥。

  还有些是拼写错误的英文单词,甚至是半角全角混杂的标点符号。

  这根本不是程序员写出来的东西,而是那些不懂电脑的文员,用各种千奇百怪的输入法手动录入的原始垃圾。

  “怎么了?”

  陈拙看出了楚戈的不对劲。

  楚戈指着屏幕上的那堆乱码。

  “对方让拿这些原始数据跑一次测试。”

  楚戈头疼地揉了揉太阳穴。

  “这活儿没法干,这数据太脏了,里面全是不符合任何逻辑规律的人为输入错误。”

  陈拙走过去,看了一眼屏幕。

  “写个正则筛除脚本不行么?”

  “不行。”

  楚戈摇头。

  “正则表达式只能抓取有规律的东西,你看这行,他把苹果打成了pinguo,旁边还跟了个火星文,这种东西一进底层逻辑,程序立马就会判定为异常变量,直接卡死。”

  楚戈咬着牙。

  “这帮孙子,自己不愿意花时间去清理这些垃圾数据,想用一千五百块钱让我连代码带清洗全包了。”

  旁边,陆嘉被楚戈的说话声吵醒了。

  他迷迷糊糊地直起身子。

  看了一眼屏幕上的那些东西。

  “这没有数学规律。”

  陆嘉看了一眼就得出了结论,声音带着刚睡醒的沙哑。

  “代数方程解不了无序的错误。”

  屋里安静下来。

  楚戈靠在椅子上,看着屏幕上的两万条数据,有些泄气。

  熬了一整夜,脑子都快炸了。

  就差这临门一脚。

  “要不......我明天写个稍微复杂的脚本,多加几个条件判断,能筛多少是多少?”

  楚戈自己都没底气。

  这种脏活儿,用代码去防人为的愚蠢,是最费力不讨好的。

  陈拙看着屏幕上不断滚动的乱码。

  他伸手拿过鼠标,往下拉了几页。

  “不用写脚本。”陈拙松开鼠标,“机器分不清这种无规律的错误,但人眼分得清。”

  楚戈愣了。

  “这两万条,纯靠人眼看?那得看到什么时候去?”

  “一个人看两万条当然慢。”

  陈拙走到自己的书包前,拿出一张崭新的空白软盘,插进楚戈电脑的软驱里。

  陈拙把那个装满原始数据的文本文档拖了进去。

  拔出软盘,装进口袋里。

  他看了一眼楚戈,又看了一眼揉着眼睛的陆嘉。

  “这活儿交给我吧。”

  陈拙走到窗前,拉开一点窗帘。

  外面的天已经蒙蒙亮了。

  “今天早上正好没课,你俩把电脑关了,回去睡觉。”

  陈拙转过身。

  “明天晚上,我把干净的数据带回来,你直接跑程序交差。”

  楚戈张了张嘴,想问陈拙去哪找人看这两万条数据。

  但看着陈拙那副淡定的样子,他把话咽了回去。

  “行。”

  楚戈也是真熬不住了。

  他关了电脑。

  把满桌子的草稿纸收拢起来,塞进兜里。

  拍了拍还在打呼噜的王大勇。

  大勇迷迷糊糊地醒过来,抹了一把嘴角的口水。

  “跑完了?”

  “跑完了,睡吧。”

  楚戈站起身,伸了个懒腰。

  他看了一眼陈拙,没多说客套话。

  “谢了。”

  楚戈带着陆嘉,走出了215的门。

  上午十点。

  科大老图书馆。

  阳光透过常春藤的叶子,在木地板上投下斑驳的光影。

  借阅台前没什么人。

  苏微正坐在一张高脚凳上。

  手里拿着一本有些年头的线装书,正在仔细地修补脱落的书页。

  陈拙走过来,把手里的软盘放在木制台面上。

  发出轻轻的一声响。

  苏微抬起头。

  目光落在那个软盘上,又看向陈拙。

  “借书卡?”苏微问。

  “不借书。”

  陈拙拉过旁边的一张椅子坐下,隔着借阅台看着她。

  “找你帮个忙,赚点外快。”

  苏微放下手里的线装书和胶水,拿过旁边的一块干毛巾擦了擦手。

  “说。”

  “这个软盘里,有两万条杂乱的文本数据。”

  陈拙指了指那个黑色的塑料方块。

  “里面全是人为录入的标签,有很多拼写错误,乱码和无意义的符号。”

  他看着苏微的眼睛。

  “机器的算法剔除不了这种没有逻辑规律的脏数据,需要人工一行一行地看,把有错误的行删掉,保留格式正确的。”

  苏微看着那个软盘,没说话,在心里评估工作量。

  “两万条,如果速度快,大概明天。”

  陈拙语气平缓。

  “明天下午六点之前给我,五十块钱。”

首节 上一节 226/280下一节 尾节 目录txt下载

上一篇:都重生了,受欢迎很正常吧

下一篇:返回列表

推荐阅读