全部

《人工智能》在线阅读(3)

来源:齐鲁网

作者:周晓垣

2018-08-05 13:31:08

第三节

深度学习和大数据——让人工智能更“智能”

一、深度学习

深度学习是实现机器学习的一种方法,深度学习的概念源于人工神经网络的研究。

机器学习是一种实现人工智能的方法,机器学习最基本的做法,就是使用算法来解析数据、从中学习,然后对现实世界中的事件作出决策和预测。机器学习与传统的为解决特定任务而编写的软件程序不同,机器学习是利用大量的数据来“训练”,通过各种算法从数据中学习如何完成任务。

比如,1959年美国的塞缪尔设计了一个下棋程序,这个程序具有学习能力,它能在不断的对弈中提高自己的棋艺。四年后,这个程序的棋艺战胜了设计者塞缪尔。又过了三年,这个程序战胜了美国一个保持了八年连胜不败的冠军。这个程序就向人们展示了机器学习的能力,提出了许多令人深思的社会问题与哲学问题。

机器学习来源于早期的人工智能领域,传统算法包括决策树学习、推导逻辑规划、聚类、强化学习以及人工神经网络等等。

在早期机器学习中,人工神经网络是一个重要的算法。人工神经网络的原理是受我们大脑的生理结构——互相交叉相连的神经元启发。在我们大脑中,一个神经元可以连接一定距离内的任意神经元。与此不同的是,人工神经网络具有离散的层、连接和数据传播的方向。比如,我们可以把一幅图像切分成图像块,输入神经网络的第一层。第一层的每一个神经元都把数据传递到第二层,第二层的神经元完成类似的工作,把数据传递到第三层,以此类推,直到最后一层,然后生成结果。每一个神经元都为它的输入分配权重,这个权重的正确与否与其执行的任务直接相关。最终的输出由这些权重加总来决定。

其实,人工神经网络在人工智能出现的早期就已经存在了。但是在那时,神经网络对人工智能几乎没有什么贡献。主要问题是,即使是最基本的神经网络,也需要大量的运算,但是神经网络算法的运算需求难以得到满足。

后来,在以多伦多大学的杰弗里·欣顿(Geoffrey Hinton)为代表的研究团的努力下,实现了以超算为目标的并行算法的运行与概念证明。

不过直到 GPU(Graphics Processing Unit,图形处理器)得到广泛应用以后,这些努力才见到成效。

我们可以把深度学习理解为,它是多层结构的人工神经网络,这里的“深度”就是说神经网络中众多的层。

尼古拉斯·帕拉吉奥斯(Nicholas Paragios)在文章《计算机视觉研究:大萧条》中曾写道:在高度复杂以及很大程度由图片的自由度决定的问题上,深度学习一旦被赋予大量被标记的数据以及不可想象的计算能力,就能解决所有的计算机视觉问题。如果是这样的话,那么深度学习占领业界,计算机视觉研究成为边缘学科并走上计算机图形的老路(学术研究的活跃度和数量)将只是时间问题。

在人工智能迅速发展的今天,深度学习不仅是具备多层架构的感知器,而是一系列能够用来构建可组合可微分的体系结构的技术和方法。

深度学习使机器学习能够实现众多的应用,并拓展了人工智能的领域范围。深度学习摧枯拉朽般实现了各种任务,使得所有的机器辅助功能好像都变为可能。无人驾驶汽车、预防性医疗保健,甚至是更好的电影推荐,都近在眼前,或者即将实现。

二、大数据

“大数据”是一个体量特别大、数据类别特别大的数据集,并且这样的数据集,无法用传统数据库工具对其内容进行抓取、管理和处理。

大数据科学家约翰·劳萨(John Rauser)对大数据进行了简单的定义:大数据就是任何超过了一台计算机处理能力的庞大数据量。

大数据具有 4 个基本特征:一是数据体量巨大。百度资料表明,其新首页导航每天需要提供的数据超过1.5PB(1PB=1024TB)。如果将这些数据打印出来,将要用 5000 多亿张 A4 纸。有资料证实,到目前为止,人类生产的所有印刷材料的数据量仅为 200PB。二是数据类型多样。

现在的数据类型除了文本形式,更多的是图片、视频、音频等多类型的数据。三是处理速度快。数据处理遵循“1 秒定律”,可从各种类型的数据中快速获得高价值的信息。四是价值密度低。比如一小时的视频,在不间断的监控过程中,可能有用的数据仅仅只有一两秒。

大数据重要的不是数据本身,而是数据分析。有大量的数据固然好,但是如果没有分析,就不能体现数据的价值。只有通过分析才能获取有价值的信息。越来越多的应用涉及大数据,而大数据的数量、速度、多样性等属性,都呈现了大数据不断增长的复杂性。所以,在大数据领域,大数据的分析方法显得尤为重要,可是说它是决定最终信息是否有价值的决定性因素。

大数据分析的方法主要有 5 个:一是可视化分析。无论是大数据专家还是大数据普通用户,他们对于大数据分析最基本的要求就是可视化分析。因为可视化分析能够直观地呈现大数据特点,就如同看图说话一样简单明了。二是数据挖掘算法。大数据分析的理论核心就是数据挖掘算法,各种数据挖掘的算法基于不同的数据类型和格式,才能科学地呈现出数据的特点。也正是因为这些被统计学家所公认的各种统计方法,才能深入数据内部挖掘出公认的价值。另外一个方面也是因为有这些数据挖掘的算法,才能更快速地处理大数据。三是预测性分析。预测性分析是大数据分析最重要的应用领域之一,从大数据中挖掘出特点,通过科学地建立模型,然后便可以通过模型带入新的数据,从而预测未来的数据。四是语义引擎。非结构化数据的多元化给数据分析带来新的挑战,我们需要一套工具系统地去分析、提炼数据。语义引擎需要设计到有足够的人工智能,才足以从数据中主动地提取信息。五是数据质量和数据管理。大数据分析离不开数据质量和数据管理,无论是在学术研究还是在商业应用领域,高质量的数据和有效的数据管理,都能够保证分析结果的真实性和价值性。

三、基于大数据的深度学习

人工智能时代,深度学习和大数据可谓相辅相成密不可分。深度学习可以从大数据中挖掘出有价值的数据、知识或规律。可以说,只要有足够的数据作为深度学习的输入,计算机就能学会之前只有人类才能理解的概念或知识,然后再将这些概念或知识应用到新数据上。

基于大数据的深度学习,在现实生活中发挥着巨大的作用。比如计算机可以通过预先学习海量的人脸图片,掌握认识和分辨人脸的基本规律。然后,计算机可以记住全国所有通缉犯的长相,而在现实生活中,没有一个警察可以做到这一点。这样一来,只要通缉犯在公共场合一露面,计算机就可以通过监控摄像头采集的图像将通缉犯辨认出来。

大数据和深度学习一起,可以完成之前也许需要数万名警察才能完成的任务。

任何拥有大数据的领域,深度学习几乎都可以一展身手,做出高质量的人工智能应用。任何有大数据的领域,都有创业的机会。比如金融行业有大量客户的交易数据,基于这些数据的深度学习模型可以让金融行业更好地对客户进行风险防控,或针对特定客户进行精准营销;电子商务企业有大量商家的产品数据和客户的交易数据,基于这些数据的人工智能系统可以让商家更好地预测销售情况,并提前做好准备;教育机构拥有海量的课程设计、课程教学数据,针对这些数据训练出来的人工智能模型可以更好地帮助老师发现教学中的不足……

不过,大数据和人工智能的结合也有一定的潜在威胁性,会影响信息流通和社会公平。在 2016 年的美国总统大选中,有一家基于人工智能技术的公司 CambridgeAnalytica 推出了一项广告宣传活动,就用一整套分析和引导舆论的软件系统来影响选情。软件针对个人选民的不同心理推送不同的广告。这种影响人们情绪的活动,就是基于高复杂度、高精确度的大数据和机器学习。根据不同的人对选举声明不同的接受程度,该公司向其投放不同的消息,比如偏执的人会接收到令人恐惧的广告,保守的人则会接收到传统消息。而大数据的来源,就是选民在社交网络上的行为和消费习惯,他们在互联网上留下的足迹将会形成他们的行为和心理特征。美国科学家乔纳森·奥尔布赖说:“这简直就是台宣传机器。它一个个地拉拢公众,使他们拥护某个立场。如此程度的社会工程,我还是头一次见……”

另外,在大数据发挥作用的同时,大数据的应用必然会带来个人隐私保护方面的挑战。为了给你推送精准的广告信息,就要收集你的购买习惯、个人喜好等数据,这些数据中往往包含了许多个人隐私;为了获得以人类基因为基础的医疗大数据来改进疾病的诊疗,就要通过某种渠道收集基因样本,而这些数据如果管理出现问题,就可能为提供基因样本的个人带来风险;为了建立智能城市,就要监控和收集每个人、每辆车的出行信息,而这些信息一旦泄露,说不定就会成为案犯最好的情报来源……

有效合法地利用大数据,是人工智能时代的基本要求,这样既能保证大规模信息的正常流动、存储和处理,又能避免个人隐私被滥用或被泄露。

想爆料?请登录《阳光连线》( http://minsheng.iqilu.com/)、拨打新闻热线0531-66661234,或登录齐鲁网官方微博(@齐鲁网)提供新闻线索。齐鲁网广告热线0531-81695052,诚邀合作伙伴。

《欧•亨利短篇小说精选》在线阅读

《欧•亨利短篇小说精选》在线阅读

小人物的悲欢啼笑中,藏着世界本来的模样。[详细]
齐鲁网 2018-08-05
《寻求灵魂的现代人》在线阅读

《寻求灵魂的现代人》在线阅读

《寻求灵魂的现代人》不仅是心理学大师荣格的代表作,更是20世纪心理学体系的代表作,内容汇聚荣格的一生思想精华,对于时代的心理危机,荣...[详细]
齐鲁网 2018-06-13
《投资的逻辑:中国式股市投资心理学》在线阅读

《投资的逻辑:中国式股市投资心理学》在线阅读

股市操盘手良心奉献:别再相信巴菲特索罗斯宏观经济和价值投资高论、公司未来的盈利故事,施洛斯的有限理性、保本投资对中小散户更为简单有...[详细]
齐鲁网 2018-06-13
《忍住!别插手!让孩子独立的自我管理课》在线阅读

《忍住!别插手!让孩子独立的自我管理课》在线阅读

让孩子从3岁开始学习独立的自我管理课! 每个孩子都值得拥有独立的人生![详细]
齐鲁网 2018-06-13
《警犬汉克历险记.第一辑》在线阅读

《警犬汉克历险记.第一辑》在线阅读

一套关于成长、勇气、冒险、幽默的儿童文学作品。[详细]
齐鲁网 2018-06-13
《中国不可无岳飞》在线阅读

《中国不可无岳飞》在线阅读

用真实的历史,为您再现民族脊梁岳飞的另一种叙述[详细]
齐鲁网 2018-04-18
《小尾巴奇遇记》在线阅读

《小尾巴奇遇记》在线阅读

放飞想象力,让孩子在欢笑中成长。[详细]
齐鲁网 2018-04-18
《重建依恋:自闭症的家庭治疗》在线阅读

《重建依恋:自闭症的家庭治疗》在线阅读

北京大学自闭症研究专家易春丽重磅力作,10余年治疗经验跃然纸上,致前行路上孤独不孤单的你![详细]
齐鲁网 2018-04-12
《货币里的中国史》在线阅读

《货币里的中国史》在线阅读

货币里的中国史,透过钱眼看中国。[详细]
齐鲁网 2018-04-04
《我的二胎时代》在线阅读

《我的二胎时代》在线阅读

敢生还要会养,青年企业家董思阳育儿方法大揭秘。 [详细]
齐鲁网 2017-09-19
《朵拉的古诗奇幻之旅》在线阅读

《朵拉的古诗奇幻之旅》在线阅读

小学生新课标必背古诗推荐阅读[详细]
齐鲁网 2017-08-25
《一路顺丰》在线阅读

《一路顺丰》在线阅读

风华人物中国梦系列。与华为齐名的民族傲娇品牌,福布斯中国富豪榜真金白银的隐形富豪低调、霸气。[详细]
齐鲁网 2017-05-11
《小丝绸的历险故事》在线阅读

《小丝绸的历险故事》在线阅读

苏珊奶奶给孩子讲的励志、温情的短篇故事。[详细]
齐鲁网 2017-03-29
版权所有: 齐鲁网 All Rights Reserved
鲁ICP备09062847号 网上传播视听节目许可证1503009 互联网新闻信息服务许可证3712006002
通讯地址:山东省济南市经十路81号  邮编:250062
技术支持:山东广电信通网络运营有限公司