大数据技术原理与应用【第五讲】NoSQL数据库：5.6 文档数据库MongoDB

文档数据库介于关系数据库和NoSql之间；

是最像关系数据库的一款产品，也是当前最热门的一款产品。

1.MongoDB简介:

1）

2）文档类型BSON（Binary JSON），结构类似JSON

3）特点:
操作比较简单容易
可以针对任何属性的索引实现更快的排序
水平可扩展性
丰富的查询表达式，
替换已完成文档指定的字段
批量处理，聚合

4）术语:

每一行记录对应一个文档
文档集合对应就是表

（实例：两行记录对应两个文档）

5）

关系数据库需要多表连接查询；
文档数据库散布在多个表的数据用一个文档即可锁定，并发性更高；

关系数据库设计实例：

6）数据库:

7）文档：

例如：key是"site"，value是“dblab.xmu.edu.cn"

8)RDMS与MongoDB对应的术语

服务端与客户端：

9）集合:
（文档组）关系数据库的三条记录变成三个文档，形成文档组

2.MongoDB安装:

3.使用MongoDB Shell访问MongoDB:
创建数据库：不用create，直接use，没有的话会自动创建
想看创建好的数据库：showdbs
创建集合：用shell命令时不用单独创建集合；但编程时需要单独创建集合

4.使用JAVA程序访问MongoDB:

1）环境配置

2）连接数据库：MongoDB默认端口号为 27017

3)创建集合（用shell命令时不需要创建集合）

4）插入文档

慕课链接：https://www.icourse163.org/learn/XMU-1002335004?tid=1003965001#/learn/content

原文地址：https://www.cnblogs.com/musecho/p/10993372.html

时间： 2024-08-02 03:17:28

大数据技术原理与应用【第五讲】NoSQL数据库：5.6 文档数据库MongoDB的相关文章

大数据技术原理与应用——大数据处理架构Hadoop

Hadoop简介 Hadoop是Apache软件基金会旗下的一个开源分布式计算平台,为用户提供了系统底层细节透明的分布式基础架构. Hadoop是基于Java语言开发的,具有很好的跨平台特性,并且可以部署在廉价的计算机集群中. Hadoop的核心是分布式文件系统(Hadoop Distributed File System,HDFS)和MapReduce. Hadoop被公认为行业大数据标准开源软件,在分布式环境下提供了海量数据的处理能力. Hadoop的特性 Hadoop是一个能够对大量数据进

大数据技术原理与应用笔记

1.支持大数据的技术: 存储设备容量不断增加(1PB=1024TB) 计算,CPU处理能力不断提升网络带宽不断增加 2.大数据特性:4V (1)大量化(volume) 大数据摩尔定律:数据一直一每年50%的速度增长 1ZB=1024EB,1EB=1024PB,1PB=1024TB 结构化数据/非结构化数据 (2)快速化(velocity) (3)多样化(variety) (4)价值(value) 价值密度低 3.大数据影响: 全样而非抽样效率而非精确相关而非因果 4.大数据应用: 谷歌预测

大数据技术原理与应用【第五讲】NoSQL数据库：5.3 NoSQL的四大类型

5.3 NoSQL的四大类型 5.3.1 键值数据库和列族数据库可以分为四大类产品:键值数据库,列族数据库,文档数据库,图数据库 (代表) 1.键值数据库: 用的多:redis云数据库:SimpleDB典型应用:要求的数据模型非常简单,不涉及到存储结构化信息:要求非常好的写性能:涉及非常频繁的读写操作.内容缓存,如:会话,配置文件,参数,购物车等存储配置,用户数据信息等移动应用. 优点: (扩展性好)数据规模扩大时,往里面增加结点,理论上有无上限的扩展空间: (灵活性好)任何类型的数据都可

大数据技术原理与应用：【第五讲】NoSQL数据库

5.1 NoSQL概论 5.2 NoSQL与关系数据库的比较 5.3 NoSQL的四大类型 5.4 NoSQL的三大基石 5.5 从NoSQL到NewSQL数据库‘ 5.6 文档数据库MongoDB 原文地址:https://www.cnblogs.com/musecho/p/10991272.html

大数据技术原理与应用——分布式文件系统HDFS

分布式文件系统HDFS 分布式文件系统分布式文件系统把文件分布存储到多个计算机节点上,成千上万的计算机节点构成计算机集群. 分布式文件系统在物理结构上是由计算机集群中的多个节点构成的,一类叫主节点(Master Node)或被称为名称节点(NameNode) 另一类叫从节点(Slave Node)或被称为数据节点(DataNode) HDFS简介 HDFS要实现以下目标: 兼容廉价的硬件设备流数据读写支持大数据集简单的文件模式强大的跨平台兼容性 HDFS的局限性不适合低延迟数据访问(

大数据技术原理与应用：【第二讲】大数据处理架构Hadoop

2.1 Hadoop概论创始人:Doug Cutting 1.简介: 开源免费; 操作简单,极大降低使用的复杂性; Hadoop是Java开发的; 在Hadoop上开发应用支持多种编程语言.不限于Java: Hadoop两大核心:HDFS+MapReduce HDFS:海量数据存储 MapReduce:海量数据的处理 2.起源: 原本是文本搜索库,模仿谷歌的搜索引擎: 融入了谷歌相关技术:分布式文件系统GFS:分布式并行编程框架MapReduce: 3.成名史:数据排序的傲人成绩 4.特性:

《大数据技术原理与应用》学习

http://study.163.com/course/courseMain.htm?courseId=1002887002 先看了11章Spark 逻辑回归,需要迭代多,所以尤其适用Spark,100多倍企业的应用: 1. 批量数据处理(数分钟与数小时,ETL),比如MapReduce 2. 基于历史数据的交互查询,比如Impala,Hive还不是 3. 实时数据流处理,比如Storm.比如返利的实时数据,以前通过数据库备库方式来处理,扩展性差. 而Spark提供了一站式解决. 一句话概括R

大数据笔记（十三）——常见的NoSQL数据库之HBase数据库（A）

一.HBase的表结构和体系结构 1.HBase的表结构把所有的数据存到一张表中.通过牺牲表空间,换取良好的性能. HBase的列以列族的形式存在.每一个列族包括若干列 2.HBase的体系结构主从结构: 主节点:HBase 从节点:RegionServer 包含多个Region,一个列族就是一个Region HBase在ZK中保存数据 (*)配置信息.HBase集群结构信息 (*)表的元信息 (*)实现HBase的HA:high avaibility 高可用性二.搭建HBase的本地模式

大数据行业人士必知10大数据思维原理

大数据思维原理是什么?简单概括为10项原理,当样本数量足够大时,你会发现其实每个人都是一模一样的. 一.数据核心原理从"流程"核心转变为"数据"核心大数据时代,计算模式也发生了转变,从"流程"核心转变为"数据"核心.Hadoop体系的分布式计算框架已经是"数据"为核心的范式.非结构化数据及分析需求,将改变IT系统的升级方式:从简单增量到架构变化.大数据下的新思维--计算模式的转变. 例如:IBM将使用以