天才一秒记住【孤独小说网】地址:http://www.gdntek.com
原先赶进度,有很多功夫没有做到位。
从2028年开始可以坐下来慢慢改进、反复琢磨。
但是,到年底我就撞上了墙。
“那时的万国宝翻译网购平台文字界面,几乎做到了完美。
不仅是标准文字,一张商品图片上的中文它都可以立即识别、翻译、改图嵌入。
麻烦出在真人交流,尤其是语音会话。
当时困扰我的有三个大问题:第一,它搞不懂讽刺。
第二,它无法处理很多种修辞,特别是隐喻和指代。
第三,遇到语境决定语意的情况就犯蒙。
“前两个问题我用一个真实的内测例子说明。
测试员作为中国卖家挂出了恐龙蛋化石商品,一个美国买家向他询问来源和真伪。
中国卖家一番解释之后,美国买家说:‘yeahright!
itoohaveanoceanfrontinnevadatosellyou.’万国宝的翻译:‘真不错!
我在内华达州有一套海景房,也可以卖给你。
’中国卖家听了非常兴奋,催他下单,说下单之后大家可以聊房地产。”
听众已经笑倒了一片,译员们笑得尤其厉害。
图海川一本正经继续:“后来的万国宝是这样翻译的:‘老板实在!
我有块地皮在中南海,你买不买?’在座的人类很容易理解,这才是美国买家的本意。
那么我们和后来的万国宝有什么共同点?和以前的万国宝又有什么不同?我们知道内华达不靠海。
我们起码经历过几百次别人说yeahright的场合。
后来的万国宝会把英语隐喻置换成类似的汉语隐喻,甚至使用类似的土鳖语气,就像各位译员刚才脑子里转的弯。
“当时我设想的解决方法是:把yeahright之类的常用短语,以及后面那个土味浓厚的美国俗语,分别归入‘讽刺’和‘俗语’类型,各自用一个深度学习网络层处理。
但这也不能完全解决问题——你架不住随时有人发明新俗语、新黑话。
更架不住真的有人说yeahright,表示同意。
这就是我刚才说的第三个问题:语境决定语意。
这才是最广泛、最无解的问题。
汉语中尤其严重,‘大胜’等于‘大败’之类,例子太多我就不啰嗦了。
();
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!