手机浏览器扫描二维码访问
“教授,你不是做语言翻译的,语言是规则的游戏,概率这太不靠谱了。”保罗·加尔文还想再挣扎一下。
当然他确实也不信翻译和统计学能扯上什么关系。
词语之间一一对应。
英文单词和俄语单词一一对应,直接直译,扩充语料库。
在当时的思维里,这才是正道。
也就是所谓穷举法。
把所有的词语做好一一对应之后,自动翻译也就实现了。
统计学,概率游戏,不谈如果林燃是对的,他们的无能会暴露无遗,光是林燃提到的改进原理从直觉上来说就是错误的。
简单来说,反直觉。
就像在GPT大模型出来之前,大家都觉得算法最重要。
GPT出来之后,大家开始都一窝蜂力大飞砖。
等到deepseek的时候,好像算法有点用。
哪怕是顶级的研究人员,也会有盲从的问题,会有迷茫、找不到方向、走不出来的情况。
在这个计算机的混沌年代,会这样再正常不过了。
“精确?精确意味着出错,现在的计算机远远达不到精确这一点。
你们难道不清楚,你们在54年之所以演示出了良好的效果,是因为那些俄语句子是你们精挑细选出来的。
实际自然语言的复杂性要远超你们预期。
你们只做了语料库的扩展,规则覆盖都没有做,上下文依赖处理也没有。
你们能比我更懂机器翻译?”
林燃怒吼道:“你们做了九年都没有进展,现在立刻马上按照我说的去做!”
林燃的地位、实力和权力摆在这,他们根本没有拒绝的选择。
沃森会信林燃就不说了,毕竟深蓝项目才结束,国防部的麦克纳马拉那更是林燃说什么就是什么。
你们这帮搞计算机的能比数学大师更懂计算机?
林燃在博弈论和统计学上展现出来的风采,麦克纳马拉还没忘呢。
IBM的CEO支持林燃,国防部部长支持林燃,乔治敦大学的研究团队只能被按在地上摩擦。
“我们要做的一共五点,优化算法和规则设计,扩充语料和词汇,改进数据处理的效率,引入统计方法和硬件最大化利用。
其中改进数据处理效率和硬件最大化利用由IBM方面负责。
另外三点则由乔治敦大学的成员们负责。
我们先来谈优化算法和规则设计。
你们一直的问题在于,你们对于规则集的扩张没有引入更加细化的句法规则。
因为存储有限,你们觉得扩充对照词汇库就够了。
实际上句法规则显得更加重要。
你们需要做到,引进常见的高频句型。
对上下文进行依赖处理。使词汇翻译考虑前后词,通过有限的上下文窗口来减少歧义。
比如свет同时有光和世界的意思。
前世孤苦一生,今世重生成兽,为何上天总是这样的捉弄!为何上天总是那样的不公!他不服,不服那命运的不公。自创妖修之法,将魔狮一族发展成为能够抗衡巨龙的麒麟一族,成就一代麒麟圣祖的威名。...
一个现代人,来到了古代,哇噻,美女如云呀,一个一个都要到手,战争阴谋铁血一揽众美,逍遥自来快乐似神仙本书集铁血与情感于一身为三国类中佳品。...
地球少年江云卷入了一个神秘的超凡世界之中,获得了超凡之力,并且开始在地球以及一个个超凡世界,开启了自己追逐巅峰的超凡旅程。VIP。全订阅可入,要验证。普通。(ps已经完本神卡...
魔族强势,在人类即将被灭绝之时,六大圣殿崛起,带领着人类守住最后的领土。一名少年,为救母加入骑士圣殿,奇迹诡计,不断在他身上上演。在这人类六大圣殿与魔族七十二柱魔神相互倾轧的世界,他能否登上象征着骑士最高荣耀的神印王座?...
神魔陵园位于天元大6中部地带,整片陵园除了安葬着人类历代的最强者异类中的顶级修炼者外,其余每一座坟墓都埋葬着一位远古的神或魔,这是一片属于神魔的安息之地。一个平凡的青年死去万载岁月之后,从远古神墓中复活而出,望着那如林的神魔墓碑,他心中充满了震撼。沧海桑田,万载岁月悠悠而过,整个世界彻底改变了,原本有一海峡之隔的...
生长于孤儿院的少年刘翰和几女探险时偶得怪果奇蛇致使身体发生异变与众女合体并习得绝世武功和高超的医术为救人与本地黑帮发生冲突得贵人相助将其剿灭因而得罪日本黑道。参加中学生风采大赛获得保送大学机会。上大学时接受军方秘训后又有日本黑龙会追杀其消灭全部杀手后又参加了央视的星光大道和青歌大赛并取得非凡成绩。即赴台探亲帮助马当选总统世界巡演时与东突遭遇和达赖辩论发现超市支持藏独向世界揭露日本称霸全球的野心为此获得诺贝尔和平奖而在颁奖仪式上其却拒绝领奖主人公奇遇不断出现艳遇连绵不...