解析深度学习:卷积神经网络原理与视觉实践 - (EPUB全文下载)
文件大小:0.48 mb。
文件格式:epub 格式。
书籍内容:
解析深度学习:卷积神经网络原理与视觉实践
第一部分 绪论
第二部分 基础理论篇
第三部分 实践应用篇
A 向量、矩阵及其基本运算
B 随机梯度下降
C 链式法则
参考文献
索引
第一部分 绪论
0.1 引言
2015年10月,一场围棋的人机对决赛正在进行,但由于是闭门对弈,这场比赛在进行时可谓“悄无声息”……
围棋,起源于中国,是迄今最古老的人类智力游戏之一。它的有趣和神奇,不仅在于规则简洁而优雅但玩法却千变万化,而且还因为它是世界上最复杂的棋盘游戏之一,是在此之前唯一一种机器不能战胜人类的棋类游戏。那场对决的一方是三届欧洲围棋冠军的樊麾二段,另一方则是Google DeepMind开发的“阿尔法狗”(AlphaGo)人工智能(Artificial Intelligence,AI)围棋系统,双方以正式比赛中使用的十九路棋盘进行了无让子的五局较量。与比赛进行时的状况大相径庭的是,赛后结局并非无人问津而是举世哗然:阿尔法狗以5:0全胜的纪录击败樊麾二段,而樊麾二段则成为世界上第一个于十九路棋盘上被AI围棋系统击败的职业棋手。樊麾二段在赛后接受Nature采访时曾谈道:“如果事先不知道阿尔法狗是台电脑,我会以为对手是棋士,一名有点奇怪的高手。”霎时间消息不胫而走,媒体报道铺天盖地,莫非人类就如此这般轻易地丢掉了自己的“尊严”?莫非所有棋类游戏均已输给AI?
当然没有。樊麾一战过后不少围棋高手和学界专家站出来质疑阿尔法狗取胜的“含金量”,为人类“背书”:此役机器仅仅战胜了人类的围棋职业二段,根本谈不上战胜了围棋高手,何谈战胜人类呢!就在人们以一副淡定姿态评论这次“小游戏”时,阿尔法狗正在酝酿下一次“大对决”,因为它即将在2016年3月迎战韩国籍世界冠军李世乭九段。近十年来,李世乭是夺取世界冠军头衔次数最多的超一流棋手,所以从严格意义上讲,这才是真正的“人机大战”。
与上次不同,2016年3月这次人机“巅峰对决”堪称举世瞩目,万人空巷。不过在赛前仍有不少人唱衰阿尔法狗,特别是整个围棋界满是鄙视,基本上认为阿尔法狗能赢一盘保住“面子”就善莫大焉了。但是随着比赛的进行,结果却令人错愕。第一局李世乭输了!“是不是李世乭的状态不对,没发挥出真正的水平?”第二局李世乭又输了!“阿尔法狗还是蛮厉害的啊。不过阿尔法狗大局观应该不行,世乭九段在这方面加强,应该能赢。”第三局李世乭再次输了!赛前站在人类棋手一方的乐观派陷入了悲观。“完了!虽然比赛已输,但李九段怎么说也要赢一盘吧。”果然,第四局78手出现神之一手,李世乭终于赢了一盘,让人有了些许安慰。但末盘阿尔法狗没有再给李世乭机会,最终以4:1大胜人类围棋的顶级高手,彻底宣告人类“丧失”了在围棋上的统治地位。“阿尔法狗”则迅速成为全世界热议的话题。在阿尔法狗大红大紫的同时,人们也牢牢记住了一个原本陌生的专有名词——“深度学习”(deep learning)。
0.2 什么是深度学习
比起深度学习,“机器学习”一词大家更熟悉一些。机器学习(machine learning)是人工智能的一个分支,它致力于研究如何通过计算的手段,利用经验(experience)来改善计算机系统自身的性能。通过从经验中获取知识(knowledge),机器学习算法摒弃了人为向机器输入知识的操作,转而凭借算法自身学习到所需知识。对于传统机器学习算法,“经验”往往对应以“特征”(feature)形式存储的“数据”(data),传统机器学习算法所做的事情便是依靠这些数据产生“模型”(model)。
但是“特征”为何物?如何设计特征更有助于算法产生优质模型?……一开始人们通过“特征工程”(feature engineering)形式的工程试错方式得到数据特征。可是随着机器学习任务越来越复杂和多变,人们逐渐发现针对具体任务生成特定特征不仅费时费力,同时还特别敏感,很难将其应用于另一任务。此外,对于一些任务,人们根本不知道该如何使用特征有效表示数据。例如,人们知道一辆车的样子,但完全不知道设计怎样的像素值并配合起来才能让机器“看懂”这是一辆车。这种情况就会导致,若特征“造”得不好,最终学习任务的性能也会受到极大程度的制约,可以说,特征工程的质量决定了最终任务的性能。聪明而倔强的人类并没有屈服:既然模型学习的任务可以通过机器自动完成,那么特征学习这个任务自然也可以完全通过机器自己实现。于是,人们尝试将特征学习这一过程也让机器自动地“学”出来,这便是“表示学习”(representation learning)。
表示学习的发展大幅提高了人工智能应用场景下任务的最终性能,同时由于其具有自适应性,这使得人们可以很快将人工智能系统移植到新的任务上去。“深度学习”便是表示学习中的一个经典代表。
深度学习以数据的原始形态(raw data)作为算法输入,由算法将原始数据逐层抽象为自身任务所需的最终特征表示,最后以特征到任务目标的映射(mapping)作为结束。从原始数据到最终任务目标“一气呵成”,并无夹杂任何人为操作。如图1所示,相比传统机器学习算法仅学得模型这一单一“任务模块”,深度学习除了模型学习外,还有特征学习、特征抽象等任务模块的参与,借助多层任务模块完成最终学习任务,故称其为“深度”学习。神经网络算法是深度学习中的一类代表算法,其中包括深度置信网络(deep belief network)、递归神经网络(recurrent neural network)和卷积神经网络(Convolution Neural Network,CNN),等等。特别是卷积神经网络,目前在计算机视觉、自然语言处理、医学图像处理等领域可谓“一枝独秀”,它也是本书将侧重介绍的一类深度学习算法。有关人工智能、机器学习、表示学习和深度学习等概念间的关系可由图2所示的韦恩图来表示。
图1 传统机器学习算法与深度学习概念性对比。图中阴影标注的模块表示该模块可由算法直接从数据中自学习所得
图2 人工智能、机器学习、表示学习、深度学习和卷积神经网络(CNN)之间的 ............
以上为书籍内容预览,如需阅读全文内容请下载EPUB源文件,祝您阅读愉快。
书云 Open E-Library » 解析深度学习:卷积神经网络原理与视觉实践 - (EPUB全文下载)