友情提示：如果本网页打开太慢或显示不完整，请尝试鼠标右键“刷新”本网页！阅读过程发现任何错误请告诉我们，谢谢！！报告错误

追随智慧-第40章

按键盘上方向键 ← 或 → 可快速上下翻页，按键盘上的 Enter 键可回到本书目录页，按键盘上方向键 ↑ 可回到本页顶部！
————未阅读完？加入书签已便下次继续阅读！

344以后的两个星期里，邸烁和陈正继续把精力放在“维斯波”上，彼此说明自己的理解，或者讨论或者争执，甚至相互开展“大批判”，还同太平洋彼岸的黄学东小组来往了无数电子邮件和无数电话，在希格玛大厦将“维斯波”的英文程序运行通畅，全部实验数据印证无误，听写识别率也能与雷德蒙的“维斯波”所能达到的标准吻合。到了这时候，李开复要么是觉得这两个人已经足够成熟，要么是觉得不能再为练兵花费更多的时间，所以便对他们说：“我们可以开始做中文的工作了。”
这样，就出现了一个有趣的局面：一个训练有素并已卓有成就的“世界级科学家”，带着两个凭借直觉灵感连蒙带猜的小伙子。研究院的中文语音识别研究，就这样开始了。
一次突发奇想的双重效果此前我们曾经提到，微软公司通常把一个人的学习能力看得比他的专业基础更重要。他们不一定会对你提出“专业对口”这样的问题，但却会非常注意你对新事345物的反应能力和接受能力。假如一个人过多地夸耀自己以往的经验，在微软看来，这也许正是思维枯竭的征兆，至少也存在陷入“思维瓶颈”的倾向。这“瓶颈”通常不是缺少经验所致，而恰是经验太多的结果。把一大堆固定知识装满脑子的学生，犹如把一大堆僵死经验装满脑子的老人。成功有时候并不是一个好老师，它有可能让聪明人的思想枯竭，走进死胡同。所以，李开复在这个时刻所需要的，正是邸烁和陈正这种没有什么经验的人。
邸烁中等身材，方脸，浓眉，嘴角轮廓分明。刚到研究院的时候，他是副研究员，合同上注明两年聘期，但一年后他便成为微软公司的正式员工，并且开始拥有微软公司的认股权。和大多数这个年龄的人一样，邸烁自负，随意，性好独立，精力过剩，思路敏捷。不过，无论从哪个方面看，都不能证明他的天赋真有特别的过人之处。他的真正超越常人的能力，是能够在他完全不熟悉的领域当中迅速抓住问题的关键，并且知道到哪里去寻找解决难题的答案。他每天在他的电脑前构筑语音模型，其最重要的一部分工作，是在406个汉语音节当346中，确定155个基本音素，以供机器识别。还要在原有汉语拼音中的四种声调之外加上第五声，也即“轻声”。
如果需要克服时差的障碍与雷德蒙的研究小组交换问题和结论，他就从夜间一直干到凌晨，实在太困的时候，就在办公室的沙发上睡一会儿，又开始工作。他连续调整了“维斯波”中至少400个参数，以使它能够接受中文的信息。他所遇到的最大困难，不是这些几个月前还完全不懂的数据，而是中文语音的数据质量过于低劣，总被噪音干扰，远不像英文语音库里那些东西，即使把音量放大多倍仍无噪音，这使他不得不对他的新参数反复训练。
要说邸烁的直觉灵感弥补了他在语音专业上的不足，并把它们以一种可见的形式表现出来，那么，陈正在语言模型的建造上也起了同样作用。陈正骨瘦如柴，浓眉，小脸，从初中一年级的时候就开始戴眼镜，镜片由于度数很大而显得特别厚。旁人都以为这是他格外用功付出的代价，但他认为自己的高度近视是父亲的遗传，而且坚持说自己“从小就不刻苦”。他从小不喜欢被约束，经常因为上课说话之类的小毛病受到老师严厉批评。他347还特别不喜欢读书而喜欢玩，所以每天晚上8点半以后，一定要放下书本去看电视。但他学习新东西总比别人快。
他喜欢在全力以赴地玩过之后，再全力以赴做习题。他有一种在他那个年龄的孩子身上异乎寻常的天赋，能够将注意力迅速地在游戏和功课之间转来转去，一旦集中精力，便能持之以恒。这使他用不着投身题海当中，也总能获得很好的成绩。
他被父亲那一本本砖头似的医学书籍吓破了胆，但对中学校园里面的计算机分外着迷。看来，计算机的确为那些迷恋游戏、厌恶书本的孩子开辟了一条通向科学殿堂的道路。这条道路上，迂腐的循规蹈矩最少，激动人心的憧憬最多。比尔．盖茨在成名之后曾经说，一个孩子整天沉迷于计算机，要比沉迷于电视机好得多，因为计算机让人思考。陈正并不懂得这些道理，他用“学就是玩，玩就是学”来概括他当年选择这个专业的动机。
多年以后他真的成为清华大学计算机博士，又成为微软中国研究院的副研究员之后，每天坐在电脑屏幕前面的时候，还是那副如鱼得水的样子，下了班还不愿意离去。
不了解他的人说他是在加班，但了解他的女友说，“他变348成‘计算机狂’了，好像是在和计算机恋爱。”陈正觉得“恋爱”之说有点过分，但他承认：“这种加班就像是在玩一样。”陈正花了整整3天时间，来构造中文语言模型的搜索引擎框架。如果这仍然可以看作“玩”，那么他第一次发现，“玩”有时候真是艰苦。因为李开复给他的第一个指导，是不能再循着国内此项研究的老路子走下去。“我听说，在中国做语音搜索统计，只联系到前面一个词，”李开复说，“这不够，至少要向前推两个词。”
在常人看来，这“一个词”和“两个词”的区别至为微小，实则其中隐含着巨大的变化。
机器不是人，没有人所共有的耳朵。它之所以能够听懂人话，必须遵循一个基本逻辑：将声音信号变成拼音符号，然后再变成计算机能够理解的“比特”。但人类语言的一个特征就是多有歧义，中文尤其如此。比如“一”
的同音字多达137个，也即专家所说“一音对多字”，而计算机能够识别的语言则必须是“一对一”－－不仅是“一”，而且要告诉它是哪一个“一”。不过，自然语言349中的另外一个特征，给科学家们提供了摆脱困境的机会。
这就是，每一个单字都是在一个完整的句子中间才会构成特有的含义。比如你要让电脑在“意”、“义”、“一”
这三个字中决定取舍，它必会莫名其妙。但你若给它阅读前边一字的机会－－“注意”、“主义”、“逐一”，它就会很容易地确定应该使用这三个字中的哪一个。这种情形在英文叫做“Bigram”模型，也即让机器在识别一个字的时候，将其和前边一字的各种联系全部搜索一遍，以判断哪一个字用在这里最合适。
然则更多的时候，仅仅依靠向前对应一个字，并不能做出正确的判断，以致电脑经常会犯下非常愚蠢的错误。有一次王坚在饭桌上面讲述了一个笑话，令人在喷饭之余，也想到了这个问题的严重性。
笑话说，杭州市有一家药店，大字招牌上是这样几个字：杭州市长春药店。人们看到这个店名的时候，必定读成：杭州市／长春药店。但这店名之所以会成为笑话，是因为句子中间有可能发生歧义，变成：杭州／市长／春药店。
即使是一个最迟钝的人，想来也不会犯这样的错误，350但每秒钟运算几千万次的电脑就无法分辨。有时候你会禁不住感叹：电脑真是一个最聪明的笨蛋！其实，不是电脑笨，而是电脑软件的设计，比如“Bigram”模型，还没有足够聪明。
问题发生在，“市”前边的第一个字为“州”，“州”
和“市”在一起组合，什么也不是。电脑如果一味拘泥于“Bigram”，必会自动地将其分开，以致铸成大错。但如果我们让电脑看到前边两个字：“杭州”，它就有极大可能把“市”与“杭州”连接起来。所以李开复认定，语音识别的研究必须让电脑前推两个词，方有可能大大减少其犯错误的可能。英文把这种方法叫做“Trigram”。
陈正明白李开复的意思之后，立即意识到他的工作量将会骤然增加。从“一个词”到“两个词”，并非人们通常所想像的“一加一”，而是“平方”和“三次方”的关系。所以机器的“搜索”范围，就将不是扩大一倍而是扩大10倍，又由于一个词大约由1。6个字组成，就使得实际的数量更加巨大，语料库的数据积累亦须相应增加。陈正的幸运在于，当他开始从事这项研究的时候，前人已经把所有这些道理都弄明白了。“我继承了分割语351言的方法。”后来他这样说。但他没有陷在前人的经验中，当他深入到这种方法里的时候，就发现，这种建立在自然语言基础上的分割，并不自然。比如“中国”一词，按照传统的切分，应当写成：zhong/guo。陈正把这组拼音写在电脑屏幕上，左看右看，连续数十分钟目不转睛，似已魂飞魄散，蓦然间脑子里面跳出一个念头，为什么不能这样切分呢：z/h/o/n/g/g/u/o这一来，他就看到了他梦想中的美好情景。
“我要做的是，将每一个字母都分出来，具体到最小的语言要素。”他向同事陈述自己的想法，“每一个字母都有多种匹配的可能，所以我要切分每一个字母。”他相信个人电脑的计算功能已经足够强大，运算速度也已足够快，不怕在瞬间完成巨大的统计，只怕不知道怎样做。
以后事情的发展证明，这的确是一个聪明的想法，机器不仅大大地提高了选择能力，并且开始产生一种奇妙的功效：自动纠正人为造成的拼写错误，也即我们此前所述的“自动纠错模型”。由于有了“最小语音要素”
352的概念，陈正有可能提出进一步的设想：让机器来纠正自己那满口南方腔调造成的拼音错误。他向王坚请教，王坚赞赏他的想法，还给了他一本书。书的内容是专门分析英文拼写中发生的各种错误，其统计错误概率的方法，令陈正茅塞顿开。于是他转而建筑汉语拼音拼写的“错误模型”。他将这个模型分为“替代”、“插入”、“跳跃”、“交换”四种，又将26个拼音字母的各种搭配分布于这四种模型中，列出下面一个简单的算术式：26×26×4=2704这意味着，陈正建立起来的“电脑自动纠错模型”
共计2704种。
陈正完成了一件划时代的工作，但却给人留下了意犹未尽的印象。当语音被分割成一个个最小因素的时候，英文和中文之间似乎有了某种共同的东西。那一天，李开复对他说：“英文也有自己的组词规律，我们能不能让机器识别出来。”于是他们拿出一大堆“维斯波”的英文实验数据，让电脑去识别一串字母像英文还是像中文。
结果，一个更加令人惊讶的事情发生了：当他使用“Trigram”的模型去追寻正确的字母搭配时，机器居然353能够准确地分辨英文字母与汉语拼音。当初王坚小组设计“无模式界面”的研究计划时，就曾说到“中文和英文混合输入而无须切换按钮”，陈正那时的第一个反应是：“怎么可能？”没有想到，由于有了“最小因素分割”
的思想，王坚小组提出的取消“中英文切换”模式的想法，立即成为可能。
工业时代的奥秘是“分工”，信息时代的奥秘是“融合”
陈正的“搜索引擎”基本框架，一步一步地生成。
与此同时，邸烁的中文语音识别系统也有了大致模样。
到了6月20日，距离“21世纪的计算”大会还有一周的时候，李开复有些着急，他问两人能否在一周之内“弄出一个结果来”。“试试吧。”两个人说。陈正胸有成竹，邸烁也跃跃欲试。一个星期以后，他们果真拿出了阶段性的报告，汉语语音识别系统的识别率达到了78％。

返回目录上一页下一页回到顶部赞（0）踩（0）

未阅读完？加入书签已便下次继续阅读！

温馨提示：温看小说的同时发表评论，说出自己的看法和其它小伙伴们分享也不错哦！发表书评还可以获得积分和经验奖励，认真写原创书评被采纳为精评可以获得大量金币、积分和经验奖励哦！