大数据存储:MongoDB实战指南 - (EPUB全文下载)
文件大小:0.26 mb。
文件格式:epub 格式。
书籍内容:
大数据存储:MongoDB实战指南
第一部分 基础知识
第二部分 深入理解MongoDB
第三部分 监控与管理MongoDB
第四部分 应用实践
附录 常见问题
版权
第一部分 基础知识
这一部分主要介绍 MongoDB 方面的基础知识,熟悉关系数据库的读者能够快速地认识到 MongoDB 是什么以及与其他数据库的区别,这一部分的基础知识很重要,贯穿整本书,建议多实践和测试。
第1章 本章介绍了大数据、云计算的基本概念以及云存储与 MongoDB的关系,还介绍了 MongoDB 是什么、它的特点以及如何在各种平台上部署MongoDB等,最后介绍了MongoDB部署启动后一些关键的进程。
第2章 本章介绍了各种查询操作,这是数据库上最常用的一个操作。MongoDB的查询与关系数据库的语法区别很大,但它们很多设计思想是相同的,查询选择器相当于关系数据库中经常用到的where语句,查询选项相当于过滤出需要返回的字段。最后介绍了一种特殊对象的查询操作,这在关系数据库中是没有的。
第3章 本章介绍了查询用到的索引以及利用索引对查询的优化,这个思想和关系数据库也是一致的,利用索引来提高查询效率。
第4章 本章介绍了对 MongoDB 插入、删除、修改操作,至此一系列完整的增删改查的操作都介绍完了,对于一般的应用程序开发都能支持了。
第1章 大数据与云计算
1.1 什么是大数据
对于各种规模大小的组织机构而言,由于数据爆炸式的增长,传统的数据处理技术变得越来越难适应,需要有变革的技术来存储、分析这些大数据。谁能够掌握这些存储、分析技术,谁就有可能成为未来市场的主导者。财富500强公司在这个方面已走在前列,他们认识到大数据不仅仅是一门技术,而且是未来商业的发展趋势,并且已经开始从创新的大数据业务中受益。例如,企业能够分析用户的Web点击习惯,总结出用户喜好,进而有针对性地开展促销;政府部门能够利用大数据预测疾病的传播趋势,进而提前进行干预。
具体来说,大数据技术涉及到数据的创造、存储、获取和分析,数据的主要特点有以下几个。
数据量大。一个典型的PC机在2000年前后其存储空间可能有10GB,今天Facebook一天增加的数据量就将近有 500TB;一架波音 737 的飞机围绕美国飞行一周将会产生240TB 的数据;移动互联网的发展,智能手机的普及,人们每时每刻都在产生数以百万计的数据。
数据变化快。高速的股票交易市场,产生的数据以微秒计算;基础设施系统、实施系统每秒都产生大量的变化的日志,每秒都处理大量的并发。
数据多样性。大数据的类型不仅仅是简单的数字、日期和字符串,它可能包含地理数据、3D数据、音视频以及无结构的文档,而且这么多类型的数据可能需要保存在一起。
大数据技术的战略意义不仅在于掌握庞大的数据信息,而且也在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键在于提高对数据的“存储和加工能力”,通过“加工”实现数据的“增值”。大数据技术能够利用修改过的硬件取代原来高消耗和昂贵的老系统。由于许多大数据技术是开源的,它们实施起来更快且更便宜,例如,将它的数据存储技术迁移到MongoDB上来。
1.2 什么是云计算
云计算的定义有多种说法,对于到底什么是云计算,我们至少可以找到100种解释。目前广为接受的是美国国家标准与技术研究院定义:云计算是一种按使用量付费的模式,这种模式提供可用的、便捷的、按需的网络访问,进入可配置的计算资源共享池(资源包括网络、服务器、存储、应用软件、服务),这些资源能够被快速提供,只需投入很少的管理工作,或与服务供应商进行很少的交互,本质上就是虚拟化技术的延伸,以服务的形式提供客户。按照服务的形式,目前主要有如下3种形式的云计算。
1.IaaS:基础设施即服务
IaaS(Infrastructure-as-a-Service):基础设施即服务。消费者通过Internet可以从完善的计算机基础设施获得服务,例如硬件服务器租用。
2.SaaS:软件即服务
SaaS(Software-as-a- Service):软件即服务。它是一种通过Internet提供软件的模式,用户无需购买软件,而是向提供商租用基于Web的软件,来管理企业经营活动。例如:阳光云服务器。
3.PaaS:平台即服务
PaaS(Platform-as-a- Service):平台即服务。PaaS 实际上是指将软件研发的平台作为一种服务,以SaaS的模式提交给用户。因此,PaaS也是SaaS模式的一种应用。但是PaaS的出现可以加快SaaS的发展,尤其是加快SaaS应用的开发速度,例如软件的个性化定制开发。
1.3 大数据与云计算
从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式计算架构。它的特色在于对海量数据的挖掘,但它必须依托云计算的分布式处理,也就说大数据就像做饭用的一堆原材料,云计算就像做饭用的工具。云计算解决了大数据的运算工具问题,而对大数据的存储我们需要相应的云存储工具。云存储是在云计算概念上延伸和发展出来的一个新的概念,是指通过集群应用或分布式文件系统等功能,将网络中大量的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。所以云存储是一个以数据存储和管理为核心的云计算系统,本书介绍的MongoDB就可以当作一个云存储系统使用。
1.4 什么是MongoDB
MongoDB是一个可扩展、开源、表结构自由、用C++语言编写且面向文档的数据库,旨在为Web应用程序提供高性能、高可用性且易扩展的数据存储解决方案。
MongoDB 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富、最像关系数据库的 NoSQL 数据库;它支持的查询语言非常强大,其语法有点类似于面向对象的查询语言,可以实现类似关系数据里单表查询的绝大部分功能,而且还支持对数据建立索引。
Mo ............
以上为书籍内容预览,如需阅读全文内容请下载EPUB源文件,祝您阅读愉快。
书云 Open E-Library » 大数据存储:MongoDB实战指南 - (EPUB全文下载)