陆辞渊想了一个办法——数据增强。他可以用现有的卓文君作品作为种子,通过人工辅助的方式,生成一批风格相似的“伪作”,然后用这些伪作来微调模型。这听起来有些作弊,但在低资源场景下,这是一种常见的技术手段。
他需要帮手。
他拿出手机,翻到通讯录里一个很久没有联系的名字——林若溪。
林若溪是他的大学同学,中文系的,现在在某985高校读古代文学的博士。他们是在一门跨学科选修课上认识的,课名叫“数字人文导论”——一门试图用计算机方法研究人文问题的课程。陆辞渊当时是课程的技术助教,林若溪是选课的学生。
他记得林若溪是一个很有趣的人——她对计算机技术几乎一窍不通,但对“用算法分析诗歌”这件事充满了热情。她曾经在课上提出过一个观点,让他印象深刻:
“你们计算机的人总想着用算法去‘理解’诗歌,但我觉得方向反了。不是应该让计算机来理解诗歌,而是应该让诗歌来‘教育’计算机。诗歌是人类情感的最高编码形式,如果计算机能学会诗歌,那它就能学会一切。”
当时陆辞渊觉得这个观点有些天真。但现在回想起来,他觉得林若溪也许是对的。
他给林若溪发了一条消息:
“若溪,好久不见。我有个项目可能需要你的帮助。关于卓文君的。方便通个电话吗?”
消息发出去之后,他看了看时间——早上七点二十三分。他犹豫了一下,觉得这个时间打电话可能不太礼貌,于是放下手机,去洗手间洗了把脸。
等他回来的时候,手机已经亮了。林若溪回复了:
“陆辞渊?!你居然主动联系我!天上下红雨了吗?我八点有个会,九点之后可以。你等我!”
三个感叹号。陆辞渊看着屏幕,嘴角不自觉地微微上扬。
他想起大学时候的林若溪,说话的时候总是带着很多感叹号,像是一个永远充满能量的小太阳。她曾经试图“拯救”他这个“情感表达障碍患者”(她的原话),给他推荐了一大堆文学作品,从《诗经》到《红楼梦》,从博尔赫斯到石黑一雄。他礼貌地收下了书单,然后一本都没有读。
现在,他主动来找她帮忙了。生活真是一个充满讽刺的圆。
九点十分,他的手机响了。林若溪的视频通话。
他接通,屏幕上出现了一张圆圆的、带着黑眼圈的脸。林若溪比大学时候瘦了一些,但眼睛还是那么大,说话的时候眼珠子转得飞快,像是随时在算计什么。
“陆辞渊!你瘦了!你以前就瘦,现在更瘦了,像一根竹竿!”她的声音还是那么大,还是带着那种不容忽视的能量。
“你也瘦了。”他说。
“我那是累的!读博嘛,你知道的,不是在写论文就是在被论文折磨。”她挥了挥手,背景看起来是一个堆满书的办公室,“说吧,什么项目?卓文君?你要做什么?”
陆辞渊简单介绍了一下Ling-2项目,以及他目前遇到的困难。他说得很克制,尽量不用太多术语,也尽量不暴露自己的“疯狂”——比如他想让AI拥有“心”这件事,他暂时没有提。
但林若溪的敏感度超出了他的预期。她听完之后,沉默了几秒钟,然后说:
“等等,你不是在做普通的诗歌生成模型。你想让AI‘理解’卓文君,对吧?不是表面的理解,是深层的、情感上的理解。你想让AI写出像卓文君一样能打动人心的诗。”
陆辞渊愣了一下:“你怎么知道的?”
“因为你提到了‘心动值’。”林若溪的眼睛亮了起来,“你给模型标注了‘心动值’。你不仅想让它学会诗歌的形式,还想让它学会诗歌的‘灵魂’。陆辞渊,你这是要搞大事情啊。”
他犹豫了一下,决定摊牌:“我想让AI拥有‘心’。”
林若溪盯着屏幕看了他三秒钟,然后爆发出一阵大笑。
“哈哈哈哈哈哈!陆辞渊!你!一个纯种的理工直男!一个连《红楼梦》都没读完的人!居然想给AI造一颗心!哈哈哈哈!”
陆辞渊面无表情地等她笑完。
“笑够了吗?”
“笑够了笑够了。”林若溪擦了擦眼角的泪,“对不起,我不是嘲笑你。我只是……太意外了。你以前可是那种会说‘情感是bug不是feature’的人。”
“我说过那种话?”
“你说过。大三那年,在课上,你还记得吗?有个同学说希望AI能有情感,你说‘情感是人类进化中的冗余功能,在AI中实现情感等于引入不可控变量’。原话。”
章节错误,点此报送,报送后维护人员会在两分钟内校正章节内容,请耐心等待。