是她的错吗?
唐念有些失神。
仿佛又回到了记忆中无数次争吵的场景,灰白暗淡的光打过来,像被一片乌云笼罩。
[都是你的错,如果不是你,你爸爸怎么会死?]
[老师是因为你才出事的。]
[我真是命苦,都是为了养活你才会过得这么辛苦,你现在赚钱了为什么不给我花?]
[都是你的错……]
她不懂。
为什么所有人都在怪她。
她没有做错任何事啊。
成帅似乎还在说着什么,嘴唇翻动。
唐念一句话都没听见。
她咬了下唇,手指蜷缩着,无意识地说道:“对不起。”
她不知道自己为什么道歉,只是想用这种方式赶紧结束眼下的情景。她心里好烦,脑袋也痛,不想再待下去了,可对方却不依不饶,不准她离开。
陈知礼就是这时候经过楼道的,听到女生有些颤抖的嗓音,半框眼镜闪过一道寒光。
她真是好脾气,一遍遍跟人道歉说自己不是故意的,男生看她性子软好拿捏,就把所有过错一股脑归咎与她,仿佛自己受到了多大的伤害。
陈知礼就这样站在楼梯口,目光沉沉,看着她低声下气给人道歉。
她难道听不出来这男的是在故意找茬?
也是。
除了对他,她好像对谁都能这么有礼貌。
一股莫名的火气直冲云霄,他冷下脸,点名喊她:“唐念,过来!”
他穿着纯黑色定制西装,站在楼道的暗处,神色藏着看不清晰,但语气很重,是要发火的前兆。
见她还在犹犹豫豫小声强调着什么,陈知礼不耐烦了:“磨蹭什么,过来!”
唐念转身跑过来,离近后,陈知礼拉住她胳膊把人往后一拽。抬步走了出去,他比成帅要高半个头,居高临下看人时,压迫感十足。
“陈老板……不不是,陈老师,您回来了。”
在实验室大家总是私下里称导师为“老板”,原因很简单,到了研究生这个阶段已经相当于步入半个社会,我替你发论文评职称,你让我毕业,大家各取所需。
这已经算好的师生相处之道,但毕竟这个称呼太过市侩,正式场合不能喊,眼下陈大魔王很明显的心情不好,最好不要顶风作案。
陈知礼:“实验室是让你骚扰女生的地方?”
成帅:“不是,是误会,我在跟小师妹开玩笑……”
“玩笑?”陈知礼缓缓掀起眼帘,神色看不清情绪:“你看见她笑了吗?”
“……”成帅怔了两秒,立即跟唐念道歉:“对不起,是我脑子不清醒,我给师妹道歉。”
唐念没出声,也没接受他的道歉。
成帅脸色青一块白一块的,被女生拒绝已经很丢人了,pua还被小老板听见,他真的想死的心都有了。
他张了张口,想给自己辩解几句,心里又实在有些怕他,只没敢多话。
陈知礼瞥他一眼,离开前“好心”警醒:“再有下次,你自己打包走人,我这里不欢迎夹带私欲的人,懂吧?”
“懂懂懂。”
成帅点头,战战兢兢地离开。
寂静的走廊剩下两人,沉默的气氛有点令人发黄。
是他把她叫过来的,唐念还以为他会主动开口说点什么,哪知陈知礼压根没搭理她,转身就走,留唐念局促地站在原地。
她站着思考了半分钟,最后还是硬着头皮跟了过去。
办公室的门没关。
唐念敲了敲门,杵在门口罚站。
陈知礼的目光在她身上停了片刻,不带什么情绪:“进来。”
唐念挪了个位置继续罚站。
陈知礼抬了抬下巴,对着桌对面的电脑说:“查收一下邮件,有服务器密码,去把数据分类统计一下。”
这是要让她干活?
好的。
有事做总比尴尬站着要好。
唐念麻利地走到电脑后,登上自己的邮箱,最新一条未读邮件来自<a href="mailto:<a href="mailto:
chenzl@anju.edu.cn">c
henzl@anju.edu.cn">c
henzl@anju.edu.cn">h
enzl@anju.edu.cn</a>">c<a href="mailto:
henzl@anju.edu.cn">h
enzl@anju.edu.cn">h
enzl@anju.edu.cn">e
nzl@anju.edu.cn</a></a>
任务是要她给一堆中医药材分类。
唐念根据提示登进服务器,数据是从74万篇中医古籍中采集出来的6.5万种药材,里面有很多别名、错名、重复等干扰项,需要先删除重复、冗余或噪声数据,再人工标注并对数据进行归类。
唐念以前做过机器学习方面的比赛,懂得归类问题的基本步骤,一般先是建立词汇表,获取每个词的embedding,然后使用cnn进行特征提取,最后挑选算法做二分类。
唐念凭借多年工作形成的肌肉记忆,搭建了个算法框架,把6.5万条数据灌进去,结果出来后拿着对照组验证准确度。
陈知礼从办公桌前走出,走到她身后,只扫一眼得出结论:“过拟合了,重测。”
“……”
唐念只好删掉记录,又重新跑了一遍,陈知礼看一眼,仍不满意:“我说的重测是让你换一种算法,不是让你拿着3000万美金的gpu在这磨时间,消耗性能,ok?”
“……”
那你一开始说清楚啊!
“还有,你样本选的有问题,smote得到的增强样本有误差,可能已经偏离了原来的语义,大概是文本embedding后距离向量处于高维空间,需要映射到低维再处理。”
唐念没听懂,一脸茫然地看着他。
“看我干什么,数据增强不会做就去查资料,瞪着一双大眼只会喘气吗?”
他的火气太明显,唐念懂了,他根本就不是让她来干活的,寻个理由拿她撒气罢了,所以无论她做什么都不可能令他满意。
“你说话就说话,大声吼什么,我怕狗叫!”
她最近根本没得罪他,上课不迟到,文献也好好翻译完了,都不知道他在这发的什么神经。
当然,犯病是不需要理由的。
陈知礼目光忽然移过来,唐念也看着他,四目相对,谁也不服谁。
唐念是娃娃脸的长相,眼睛圆,皮肤奶白,鼻头微翘,齐刘海盖住细长的眉,五官精致得像漫画里走出的少女。
此刻她正直勾勾瞪着他,有点奶凶奶凶的。
陈知礼冷淡地回视一眼,眼神嘲讽:“这不是挺会怼嘛。”
“……”
“跟我就能伶牙俐齿,怎么被别人欺负的时候嘴皮子就没这么溜,只会点头哈腰说对不起了。”
“你跟他道的什么歉,难道就听不出来他是在故意找你麻烦?”
“你脾气越好他就越是得寸进尺,这个道理都不懂?”
虽然他这话说的很不中听,但似乎是在为她谋不平,唐念还真不需要:“不用你管。”
她坐回电脑前继续工作,把几个算法梳理一遍,调参重跑,想早点干完,早点离开是非之地。
“没人想管你。”
陈知礼也没心情和她吵,接了个电话。
随后,把门阖上,下楼去了。
是韩琦教授团队打来的电话。
这次合作他们负责数据的采集和入库,以建立大型中医汉语语料库。这些数据不仅来源传统中医知识,还可能来自网页数据、小说数据、各大医院问诊、手写医嘱等,数据的整理和收集就变得非常繁琐且复杂。
韩琦教授团队毕竟只精通中医,不懂技术,所以陈知礼这边会给予技术支持。
“陈老师有时间吗?”
“你说。”
“我们目前已经把45家中医院校还有400多家中医机构的诊断记录收集起来,目前有个问题是这类资料大多是手写,字迹潦草,我们很难用扫描识别的方式转化为电子版,人工辨别的话则成本太高,您这边有没有好的办法?”
陈知礼想了想,觉得这事在电话里一时半会说不清楚:“我下周抽空过去看一下。”
工作人员:“好的,麻烦您了。”
那头工作人员又叽叽咕咕说了一堆遇到的问题,陈知礼说下周统一解决,对面表达感谢。
挂断电话,他看了眼手机,想起荀教授那边还有点事,就顺便过去一趟,等处理完回到科研楼已经六点钟了。
陈知礼摁着太阳穴上楼,推开办公室的门,看见唐念还在。
夕阳穿透窗玻璃,斜斜落在她身上,落下一道温暖的弧度。
她趴在电脑桌前,脑袋枕着自己的胳膊,长发散落,像是睡着了。
陈知礼眸光动了动,把空调温度调高两度,脱下了外套轻轻盖在她身上。
唐念动了动眼睫,但没醒,把脑袋缩的更低了,小小的一团,藏在大衣里,黑发有些凌乱地压在脸颊下,隐约压出一条条的痕迹。
陈知礼定定地看了几秒,食指指腹勾住发梢帮她顺到背后,松手后发丝很快又顺着肩膀滑下来,遮住了脸颊。
她的头发保养太好,如丝绸般柔顺黑亮,固定不住。
陈知礼视线转向她的电脑屏幕,黑屏还在不停滚动着日志,光标闪烁,是她自己跑的 tensorflow计算框架。
tensorflow是当前人工智能主流开发工具之一,主要工作步骤是生成会话并且在训练数据上反复运行,传播优化算法,预测下一个句子出现的的概率。
陈知礼凑近一些,看到她的输入词是【问候陈知礼】
看到自己的名字,陈知礼略微讶异。