Python机器学习核心算法编程实例 - (EPUB全文下载)
文件大小:0.19 mb。
文件格式:epub 格式。
书籍内容:
Python机器学习核心算法编程实例
第1章 机器学习绪论
第2章 线性模型
第3章 树回归
第4章 K-means聚类算法
第5章 朴素贝叶斯
第6章 数据降维
第7章 支持向量机
第8章 随机森林
第9章 人工神经网络
第10章 协同过滤算法
第11章 基于矩阵分解的推荐算法
第12章 集成学习
第13章 数据预处理
参考文献
反侵权盗版声明
第1章 机器学习绪论
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身性能。
机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,其主要使用的方法是归纳、综合,而不是演绎。
1.1 机器学习的定义
机器学习算法是一类从数据中自动分析、获得规律,并利用规律对未知数据进行预测的方法。在算法设计方面,机器学习理论关注可以实现的、行之有效的学习算法。很多推论问题是无程序可循的,所以部分机器学习研究开发容易处理的近似算法。
机器学习已经有了十分广泛的应用,如数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人等。
1.1.1 概论
自从计算机被发明以来,人们就想知道它们能不能学习。如果我们理解了计算机学习的内在机制,即怎样使它们根据经验来提高机制,那么影响将是空前的。想象一下,在未来,计算机能从医疗记录中学习,获取治疗新疾病的有效方法;住宅管理系统分析住户的用电模式,以降低能源消耗;个人软件助理跟踪用户的兴趣,并为其选择最感兴趣的在线新闻……对计算机学习的成功理解将开辟出全新的应用领域,并使其计算能力和可定制性上升到新的层次。同时,透彻地理解机器学习的信息处理算法,也有助于更好地理解人类的学习能力。
目前,人们还不知道怎样才能使计算机的学习能力和人类相媲美。然而,一些针对特定学习任务的算法已经产生。关于学习的理论认识已逐步形成。人们开发出了很多实践性的计算机程序来实现不同类型的学习,一些商业化的应用也已经出现。例如,对于语音识别这样的课题,至今为止,基于机器学习的算法明显胜过其他方法。在数据挖掘领域,机器学习算法理所当然地得到应用,从包含设备维护记录、借贷申请、金融交易、医疗记录等类似信息的大型数据库中发现有价值的信息。随着人们对计算机理解的日益成熟,机器学习必将在计算机科学和技术中扮演越来越重要的角色。
通过一些特定的成就,我们可以看到这门技术的现状:计算机已经能够成功地识别人类的讲话(Waibel 1989;Lee 1989)、预测脑炎患者的康复率(Cooper et al.1997)、检测信用卡欺诈、在高速公路上驾驶(Pomerleau 1989)、以接近人类世界冠军的水平对弈西洋双陆棋游戏(Tesauro 1992,1995)。已有了很多理论成果能够对训练样例数量、假设空间大小、假设错误率三者间的基本关系进行刻画。我们正在开始获取人类和动物学习的原始模型,用于理解它们和计算机学习算法之间的关系。在过去的十年中,无论是应用、算法、理论,还是生物系统的研究,都取得了令人瞩目的进步。
机器学习的几种应用主要表现在以下方面:
1.识别人类讲话
所有成功的语音识别系统都使用了某种形式的机器学习技术。例如,Sphinx 系统可学习特定讲话者的语音识别策略,从检测到的语音信号中识别出基本的音素(phoneme)和单词。神经网络学习方法和隐式马尔可夫模型(hidden Markov model)的学习方法在语音识别系统中也非常有效,它们可以让系统自动适应不同讲话者、词汇、麦克风特性和背景噪声等。类似技术在很多信号解释课题中有应用潜力。
2.驾驶车辆
机器学习算法已被应用于训练计算机控制,使其在各种类型的道路上正确行驶。例如,ALVINN系统(Pomer leau 1988)已经利用它学会的策略独自在高速公路的其他车辆之间奔驰,并以70英里(1英里约为1.6千米)的时速行驶了90英里。类似技术可能在很多基于传感器的控制问题中得到应用。
3.分类新的天文结构
机器学习算法已经被应用于从各种大规模数据库中发现隐藏的一般规律。例如,决策树学习算法已经被美国国家航空航天局(NASA)用来分类天体,数据来自第二帕洛马天文台太空调查(Fayyad et al.1995)。这一系统现在被用于自动分类太空调查中的所有天体,其中包含3TB的图像数据。
4.以世界级的水平对弈西洋双陆棋
最成功的博弈类(如西洋双陆棋)计算机程序基于机器学习算法。例如,世界上最好的西洋双陆棋程序TD-Gammon(Tesauro 1992,1995)是通过和自己对弈一百万次以上来学习策略的。现在它的水平与人类的世界冠军相当。类似技术被应用于许多实际问题,这需要高效地搜索庞大的空间。
1.1.2 机器学习发展历程
机器学习是人工智能研究较为年轻的分支,它的发展过程大体可分为4个阶段。
第一阶段是从20世纪50年代中叶到60年代中叶,属于热烈时期。
第二阶段是从20世纪60年代中叶到70年代中叶,称为冷静时期。
第三阶段是从20世纪70年代中叶到80年代中叶,称为复兴时期。
机器学习的最新阶段始于1986年。机器学习进入新阶段主要表现在下列几个方面:
(1)机器学习已成为新的边缘学科并在高校形成一门课程。它综合应用心理学、生物学和神经生理学及数学、自动化和计算机科学,形成机器学习理论基础。
(2)结合各种学习方法,以取长补短的多种形式集成学习系统的研究正在兴起。特别是连接学习与符号学习的耦合,可以更好地解决连续性信号处理中知识与技能的获取,使求解问题受到重视。
(3)机器学习与人工智能各种基础问题的统一性观点正在形成。例如,学习与问题求解结合进行、知识表达学习的观点与智能系统SOAR的组块学习结合。类比学习与问题 ............
以上为书籍内容预览,如需阅读全文内容请下载EPUB源文件,祝您阅读愉快。
书云 Open E-Library » Python机器学习核心算法编程实例 - (EPUB全文下载)