全部

《人工智能》在线阅读(4)

来源:齐鲁网

作者:周晓垣

2018-08-05 13:31:08

第四节

让人工智能理解你——语音识别

一、语音识别发展史

每一个研究人工智能的人,都希望人工智能能够直接听懂自己所说的每一句话,而不必再通过鼠标键盘才能与人工智能交流。而这,就需要语音识别技术的帮助了。

关于自动语音识别的设想,在计算机发明之前就被提上了议事日程。

早期的声码器可以被看作是语音识别的雏形。

1920 年生产的“Radio Rex”玩具狗,应该算是最早的语音识别器。当人们叫这只玩具狗名字的时候,它能会从底座上弹出来。基于电子计算机的语音识别系统,最早是由 AT&T 贝尔实验室开发的 Audrey 语音识别系统,它能够识别 10 个英文数字。Audrey 语音识别系统,是跟踪语音中的共振峰进行识别。该系统的识别达到 98% 的正确率。

20 世纪 50 年代末,伦敦学院的 Denes 语音识别系统中,已经加入了语法概率。

20 世纪 80 年代,实验室语音识别研究取得了巨大的突破。卡耐基梅隆大学的 Sphinx 系统,它是第一个高性能的非特定人、大词汇量连续语音识别系统。大词汇量、连续语音和非特定人这三个因素,一直是语音识别最大的障碍,Sphinx 系统第一次把这三个特性都集成在一个系统中。

在这一时期,语音识别研究得到了进一步的发展。这段时期语音识别系统最显著的特征,就是成功运用了 HMM 模型(Hidden MarkovModel,隐马尔可夫模型)和人工神经元网络。HMM 模型的广泛应用,应该归功于 AT&T 贝尔实验室拉比纳(Rabiner)等科学家的努力,他们把晦涩的 HMM 纯数学模型工程化,被更多的研究者了解和认识,从而使统计方法成为语音识别技术的主流。

20 世纪 90 年代前期,许多著名的大公司都不惜斥巨资对语音识别系统的实用化进行研究。语音识别的准确率,是语音识别技术的评估机制。20 世纪 90 年代,在实验室研究中,这项评估指标得到了不断提高。

比较有代表性的系统有:IBM 公司推出的 ViaVoice 和DragonSystem 公司 的 NaturallySpeaking,Nuance 公 司 的 NuanceVoice Platform 语 音平台等。

二、语音识别是人机交互的入口

在PC 时代,人们通过键盘和鼠标,和机器进行交流。人要想和机器交流,就需要学会打字和按键操作。进入移动互联网时代,人们通过触摸屏幕和智能手机进行交流,手指轻轻一滑,就可以完成任务需求。在未来智能时代,机器可能会像我们人类的一员,人和机器的交互,更趋同人与人之间的交互。而机器要做到像“人”一样和我们交流,它就必须具有语音识别技术。所以,语音识别将是未来人机交互的入口,如果没有这个入口,我们就会觉得这台机器不够智能。

语音识别技术的研究,对人工智能的发展产生了重大的意义。比如,AlaphaGo 最初使用的深度学习技术就是先在语音识别领域取得成功之后,才在图像识别和其他领域取得成功;语音识别中的关键模型——HMM 模型也对后来机器学习的很多分支提供了很大帮助。

三、语音识别的应用

提到语音识别的应用,人们最容易想起苹果“不会讲笑话”的Siri。像 Siri 这类智能语音助手,是科技巨头们竞相争夺的领域。Google有 Assistant,亚马逊有 Alexa,微软有 Cortana,Facebook有 Jarvis,在它们当中,已经与应用场景深度结合的智能语音识别系统,当属亚马逊配备智能助理 Alexa 的 Echo 音响。

亚马逊Echo 有一项比较突出的优势,就是远场语音识别。远场语音识别就是指解决远距离语音识别的问题,以保证真实场景下的语音识别率。如今,像 Siri 这样的大多数的语音识别都是近场识别,远场识别的错误率是近场识别错误率的两倍左右,所以在很多情况下,语音识别系统还不能满足人们的需求。

亚马逊Echo 解决远场语音识别问题,采用了麦克风阵列的方法。

麦克风阵列是由一组按一定几何结构摆放的麦克风组成的,在采集不同空间方向的声音信号时,进行空时处理,实现噪声抑制、混响去除、人声干扰抑制、声源测向、声源跟踪等功能。在提高了语音信号处理质量的情况下,提高了真实环境下的语音识别率。

亚马逊的麦克风阵列,是由七个麦克风和一个音频信号过滤系统构成的。七个麦克风组成的列阵能让 Echo 捕捉到环境中的细微声音,音频信号过滤系统过滤掉环境噪音,从而辨别出人声。因为有了这套系统装置,用户可以在家里的任何位置发出命令唤醒 Echo,甚至在 5 米之外,用户也可以唤醒 Echo 。

除了智能家居领域外,未来语音智能识别技术,在很多应用场景都有很好的机会。比如在智能车载场景中,用语音代替手势来控制汽车中的 GPS 导航、信息收发、电话接打、社交网络更新等功能。智能语音识别的应用,将可避免司机过度分散注意力,从而保证行车安全。在教育领域,语音识别辅助英语教学和中英文同声翻译,我们只需要对着智能手机,说出我们要翻译的句子,就可以得到中英文双重语音播读结果和可视的文本结果。

四、语音识别发展的瓶颈

和 5年前比起来,今天的语音识别技术,虽然准确率已经提高了20% 以上,但仍然有一些亟待解决的技术难题:一是噪音环境下的语音识别。在安静环境、近距离麦克风的应用场景下,语音识别的识别率已越过了实用的门槛。但是在噪音环境,尤其是有人声干扰的情况下,识别率并不是很高。二是方言问题。在中文语音识别中,各地方言问题一直是中文语音识别中的特色难题,因为各地方言差异比较大,并且很多方言使用群体数量偏小,能够提供给机器学习的数据量过少,这将导致机器很难通过人工智能来识别这些方言。三是理解难题。理解人们话语的意义,与判断一个人语音中的细微差别,是截然不同的两件事情。比如当我们说中文“好”的时候,计算机就很难辨别出我们表达的语气是肯定的“好”,还是疑问的“好”。

五、语音识别技术的趋势

人工智能科学家和研究者,为了解决语音识别发展中的难题,他们尝试用各种技术手段来攻克这些难题。一是迁移学习。这一方式就是把在 A 领域已经建立好的模型或者经验,迁移到 B 领域,这个方法适用于解决方言问题,可以让机器把从学习普通话中得到的知识迁移到学习方言过程中,实现比较准确的语音识别。二是快速自适应方法。这是指机器快速的、不需要人工干预的自适应方法。就好像第一次和方言口音很重的人说话,我们可能听不懂,但他们说两三句话后,我们就可以听懂了,这是一种快速并且能够保证良好性能的机器学习方法。三是预测学习法。

就是指在下面的内容还没有产生之前,机器可以通过预测的方法把内容补充完整。比如有时与人沟通的时候,我们会预测对方下一句会说什么内容。科学研究者可以把这些现象建在机器学习的模型中,从而提高语音识别的性能。

第五节

展望未来,人工智能会如何成长

《失控》的作者凯文·凯利,对人工智能的发展曾作出一系列大胆预测。在他看来,未来 10 年到 20 年,给世界带来颠覆性变化的就是人工智能。生活中的一切都将变得智能化。

在一篇写给大学毕业生的寄语中,比尔·盖茨把当今时代称为“一个非常好的时代”。比尔·盖茨庆幸自己有机会参与到那场改变世界的数字革命的同时,他还直言:在今天,如果寻找和当年那场数字革命一样能够对世界带来巨大影响的机会,我第一个考虑的就是人工智能。正如比尔·盖茨说的那样,人工智能是继数字革命后,又一个能改变世界的机会。

与此同时,关于人工智能,另外一种声音也在蔓延:来自未知的力量也让人们有些无所适从,担忧、不安甚至惶恐的情绪,也让人们深受困扰。人们不知道人工智能究竟像潘多拉的盒子那样装满了灾难,还是像一部电梯,带着人们通向更高级的人类文明。但是可以确定的是,盒子已经打开,电梯的按钮也已经按下,没有人能让人工智能的发展停下来。

当然,如今人工智能的发展趋势也并不是无迹可寻。在很多科学家和研究者看来,人工智能在接下来的几年中,将呈现出如下四个主要发展趋势:

一、人工智能技术被大规模地商业化和产品化

在智能手机方面,华为作为中国通信巨头,已经发布了自主研发的人工智能芯片,并且将这些人工智能芯片应用在旗下智能手机产品中。

苹果公司推出的 iPhone X,脸部识别等功能也采用了人工智能技术。三星最新发布的语音助手 Bixby,在软件层面对语音助手进行了升级,改变了语音系统长期停留于“你问我答”的模式。基于智能手机的人工智能,已经与人们的生活越来越密切。

在人形机器人市场,从 2015 年 6 月开始,日本软银公司开始把研发的人形情感机器人 Pepper 面向普通消费者发售,1000 台机器人很快就被抢购一空。国内创业者也因为人工智能机器人背后隐藏着的巨大商业机会,而陷入了同样的狂热中,目前国内人工智能机器人团队已经超过100 家。图灵机器人 CEO 俞志晨预言:“人们将会像挑选智能手机一样挑选机器人。”

在科学家和学者看来,售价并不是人工智能机器人难以打开消费市场的关键,因为随着产业和技术日趋成熟,成本下降是必然趋势。与此同时,市场竞争因素也将进一步拉低人工智能机器人产品的售价。人工智能机器人打开市场的关键,是吸引更多开发者,丰富产品功能和使用场景。人工智能机器人正在引起商业巨头的兴趣,这对人工智能机器人的发展,是一个很大促进。

在商业领域,人工智能机器人也进入了快速发展期。零售巨头沃尔玛已经开始与机器人公司 Five Elements 合作,将购物车升级为具备导购和自动跟随功能的机器人。中国的零售企业苏宁也与一家机器人公司合作,门店的接待和导购也升级为机器人。餐饮巨头肯德基也曾与百度合作,在餐厅引入机器人来实现智能点餐。软银集团也引入了情感机器人Pepper,软银集团负责人称:人工智能机器人在商业服务领域的全面应用,正为人工智能的大规模商用打开一条新的出路。在很多人看来,人工智能机器人在商场等公共场合的应用,会比在私人领域的应用来得更早一些。

二、人工智能的认知能力将达到人类专家顾问级别

依赖于机器的深度学习能力的提升和大数据的积累,“认知专家顾问”在高德纳(Gartner,全球极具权威的 IT 研究与顾问咨询公司)的报告中被列为未来 2-5 年被主流采用的新兴技术。

其实,在金融投资领域,人类专家顾问已经有被人工智能取代的趋势。在美国,从事智能投顾的不仅仅是 Betterment、Wealthfront 这样的科技公司,老牌金融机构也意识到人工智能对行业带来的影响。高盛和贝莱德分别收购了 Honest Dollar 与 FutureAdvisor,苏格兰皇家银行也曾宣布,用智能投顾取代 500 名传统理财师的工作。

目前,国内一家创业团队正将人工智能技术介入保险业。他们对保险产品数据库进行分析,搭建知识图谱、收集保险语料,为人工智能问答系统做数据储备。最终,把用户和保险产品连接起来。这对目前的中国保险市场而言,显然是个颠覆性的消息,因为它很可能造成大规模的销售人员失业。

关于人工智能的学习能力,凯文·凯利曾说:“使用人工智能的人越多,它就越聪明。人工智能越聪明,使用它的人就越多。”就像人类专家顾问的水平,很大程度上取决于自身的经验一样,人工智能的经验就是数据以及处理数据的经历。使用人工智能专家顾问的人越来越多,人工智能的认知能力将得到进一步提高,在未来 2-5 年,人工智能有望达到人类专家顾问的水平。

三、人工智能实用主义倾向明显

人工智能机器人尤金首次通过图灵测试,AlphaGo 接连战胜了我们人类的围棋冠军,这些史无前例的事件,让我们感觉到,人工智能已经发展到了一个很高的水平。

其实,我们谈到人工智能的时候,更关注的问题应该是:“它究竟能够用在什么地方?”“它能给人类解决哪些问题?”在人工智能技术的应用方面,国内的互联网企业,好像更加注重实用主义的发展。比如百度,它几乎把人工智能技术应用到旗下所有产品的服务中,还有阿里巴巴,也致力于将技术推向“实用化”。

凯文·凯利此前曾经作过预判:“未来我们可能会向亚马逊或是中国的公司购买智能服务。”人工智能与不同产业的结合,这让人工智能逐渐发展成为一种可以购买的商品。美籍华人吴恩达博士,他是人工智能和机器学习领域国际上最权威的学者之一,他曾把人工智能比作未来的电能。在将来,人工智能将像电一样,被我们买回家中,为我们做饭、洗衣服。在未来,我们可以用购买的人工智能来打造一个智能的家居系统。

不同产业对人工智能技术的应用,也加剧了人工智能的实用主义倾向。比如特斯拉公司就是通过人工智能技术来提升自动驾驶技术,再比如用人工智能技术为用户规划出行路线的地图导航软件。

越来越多的医疗机构用人工智能诊断疾病,更多的汽车制造公司开始利用人工智能技术研发无人驾驶汽车,也有越来越多普通人在投资、保险等决策的时候,开始使用人工智能。这一切都意味着,人工智能将进入真正的实用阶段。

四、人工智能技术将改变全球经济生态

一方面,人工智能的发展在如火如荼地进行着,另一方面,关于人工智能对人类的威胁论,也从来没有停止过。包括比尔·盖茨、埃隆·马斯克、斯蒂芬·霍金等人,都曾对人工智能发展作出警告。从目前来看,尽管人工智能对人类造成威胁的担忧好像为时过早,但是,在有些行业,人工智能正在抢劳动者的饭碗,这是不争的事实。

马云在一场大数据峰会上说:“如果我们继续以前的教学方法,我可以保证,三十年后我们的孩子们将找不到工作。”刘强东则信誓旦旦地表示:“五年后,给你送货的都将是机器人。”

硅谷一家新兴的机器人保安公司,已经和包括中国在内的 16 个国家签约使用其公司生产的 K5 监控机器人。每小时租金约为 7 美元的 K5,将主要用于商场、停车场等公共场所,可以自动巡逻并能够识别人脸和车牌。这意味着人工智能机器人,将抢走原本属于人类保安的酬劳。

在未来,人工智能导致的大规模失业,将率先从劳动密集型产业开始。如制造业,在主要依赖劳动力的阶段,其商业模式本质上是赚取劳动力的剩余价值。所以当技术成本低于雇佣劳动力的成本时,劳动力就会被无情淘汰,制造企业的商业模式也将随之发生改变。

再比如物流行业,目前很多企业已经实现了无人仓库管理和机器人自动分拣货物。在不久的未来,无人配送车、无人机也很有可能取代一部分物流配送人员的工作。

目前的中国,正处于从劳动密集型产业向技术密集型产业过渡阶段,我们无法避免地要受到人工智能技术的冲击。相对来说,经济相对落后的东南亚国家和地区,受人工智能技术冲击要小一些。

世界经济论坛 2016 年的调研数据预测:2020 年,机器人与人工智能的崛起,将导致全球 15 个主要的工业化国家 510 万个就业岗位的流失。

人工智能终将改变世界,而由其导致的大规模失业和全球经济结构的调整,显然也属于改变世界的一部分。

想爆料?请登录《阳光连线》( http://minsheng.iqilu.com/)、拨打新闻热线0531-66661234,或登录齐鲁网官方微博(@齐鲁网)提供新闻线索。齐鲁网广告热线0531-81695052,诚邀合作伙伴。

《欧•亨利短篇小说精选》在线阅读

《欧•亨利短篇小说精选》在线阅读

小人物的悲欢啼笑中,藏着世界本来的模样。[详细]
齐鲁网 2018-08-05
《寻求灵魂的现代人》在线阅读

《寻求灵魂的现代人》在线阅读

《寻求灵魂的现代人》不仅是心理学大师荣格的代表作,更是20世纪心理学体系的代表作,内容汇聚荣格的一生思想精华,对于时代的心理危机,荣...[详细]
齐鲁网 2018-06-13
《投资的逻辑:中国式股市投资心理学》在线阅读

《投资的逻辑:中国式股市投资心理学》在线阅读

股市操盘手良心奉献:别再相信巴菲特索罗斯宏观经济和价值投资高论、公司未来的盈利故事,施洛斯的有限理性、保本投资对中小散户更为简单有...[详细]
齐鲁网 2018-06-13
《忍住!别插手!让孩子独立的自我管理课》在线阅读

《忍住!别插手!让孩子独立的自我管理课》在线阅读

让孩子从3岁开始学习独立的自我管理课! 每个孩子都值得拥有独立的人生![详细]
齐鲁网 2018-06-13
《警犬汉克历险记.第一辑》在线阅读

《警犬汉克历险记.第一辑》在线阅读

一套关于成长、勇气、冒险、幽默的儿童文学作品。[详细]
齐鲁网 2018-06-13
《中国不可无岳飞》在线阅读

《中国不可无岳飞》在线阅读

用真实的历史,为您再现民族脊梁岳飞的另一种叙述[详细]
齐鲁网 2018-04-18
《小尾巴奇遇记》在线阅读

《小尾巴奇遇记》在线阅读

放飞想象力,让孩子在欢笑中成长。[详细]
齐鲁网 2018-04-18
《重建依恋:自闭症的家庭治疗》在线阅读

《重建依恋:自闭症的家庭治疗》在线阅读

北京大学自闭症研究专家易春丽重磅力作,10余年治疗经验跃然纸上,致前行路上孤独不孤单的你![详细]
齐鲁网 2018-04-12
《货币里的中国史》在线阅读

《货币里的中国史》在线阅读

货币里的中国史,透过钱眼看中国。[详细]
齐鲁网 2018-04-04
《我的二胎时代》在线阅读

《我的二胎时代》在线阅读

敢生还要会养,青年企业家董思阳育儿方法大揭秘。 [详细]
齐鲁网 2017-09-19
《朵拉的古诗奇幻之旅》在线阅读

《朵拉的古诗奇幻之旅》在线阅读

小学生新课标必背古诗推荐阅读[详细]
齐鲁网 2017-08-25
《一路顺丰》在线阅读

《一路顺丰》在线阅读

风华人物中国梦系列。与华为齐名的民族傲娇品牌,福布斯中国富豪榜真金白银的隐形富豪低调、霸气。[详细]
齐鲁网 2017-05-11
《小丝绸的历险故事》在线阅读

《小丝绸的历险故事》在线阅读

苏珊奶奶给孩子讲的励志、温情的短篇故事。[详细]
齐鲁网 2017-03-29
版权所有: 齐鲁网 All Rights Reserved
鲁ICP备09062847号 网上传播视听节目许可证1503009 互联网新闻信息服务许可证3712006002
通讯地址:山东省济南市经十路81号  邮编:250062
技术支持:山东广电信通网络运营有限公司