上手DocumentDB On Azure (一)

  • 什么是Document?

    DocumentDB基于PaaS(Platform-as-a-Service),是Microsoft配置在Azure上的一个数据服务

    它通过:数据库账户,数据库,数据集来发挥作用.一个数据库账户下可以拥有多个数据库,每个数据库有可以拥有多个数据集合.

  • 如何配置

    DocumentDB 中的一致性级别:DocumentDB配置中有这个设置,暂且不管它是干什么的,先用默认再说。

    DocumentDB 中的一致性级别

来自 <https://www.azure.cn/documentation/articles/documentdb-consistency-levels/>


创建好DoucmentDB之后Azure的仪表板(Dashboard)如下:


因为Azure的版本也在不停的更新,特别是DashBoard布局的更新,可能本笔记中的样式已经不一样了,内容大概相同就行。(2017-5-14)

  • 在控制ConsoleApp中链接数据库

    如何查到DocumentDB的Uri和PrimaryKey?

    打开"键"页面后一片空白不要怕,点击"读写键"就出来了。读写键和只读键的区别应该是App端使用的键不同,访问数据库的权限也不同吧。



参照MongoDB来看DoucmentDB的链接创建过程:


MongoDB


DoucmentDB


DataRepositoryObject通常是通过Database来操作数据库的


DataRepositoryObject通常包含如下


创建Client;

利用Client.GetDatabase()方法拿到Database对象;


创建Client
DocumentDB有2个方法,

  • .ReadDatabaseAsync(Uri databaseuri)
  • .CreateDatabaseAsync(Database db)

他们的返回值类型都是ResourceResponse<Database>>类型

这里还涉及了UriFactory和Database两个类

  • UriFactory在Documents.Client下
  • Database在Documents下

通过对GetDatabaseAsync()方法的调用,来开看一下


ResourceResponse<Database>的成员1


ResourceResponse<Database>的成员2

再看UriFactory.CreateDatabaseUri()返回的是个什么鬼Uri:啥也没有,估计也只有个OriginalString能用


这一步操作完成后,我们再Dashboard中已经可以看到我们刚刚建好的数据库了:


  • 创建数据集

    数据集由数据本身所占用的空间和索引数据所需要的索引缓存空间共同组成.创建一个数据集时,需要配置数据的索引策略.

    如何从DoucumentDB中查询和操作数据,DocumentDB的索引策略是定义在DocumentCollection一级别的.

    也就是说,在一个DocumentDatabase里,不同的数据集可以有不同的索引规则.

    索引策略包含了:索引模式,索引路径的限制,索引使用的数据类型和精度

    作为数据库小白的我,所能理解到的关于索引的概念是:

    以下边的Vessel类型数据为例:

VesselObject

{


"id":


#int


"name":


#string


"type":


#enum -handy,-panama, -cape, -other


"Imo":


#int


"nationality":


#string


"size":{"loa":,"wid":}


#{double,double}


"description"


#string

}

  • 索引规则直接影响了基本库的大小(就是在Azure上为目标数据存储所开辟的基本的空间),这是因为同样的数据(),如果只支持id索引,那么这个数据集的索引层就会小的多,而增加了imo和type和nationality索引后,索引层就会大很多.
  • 索引规则直接影响了cpu开销:一次查询如果索引是根据vsl的id,假设有100条数据,那么Azure的cpu开销是要比根据某个string值遍历所有vslitem.description所造成的开销小的多得多.
  • 索引规则同时也影响了网络流量的大小:比如现在要查找一个vsl,中国籍,handysize,船宽22米以下的船,如果索引只支持ID索引,那么不得不返回所有记录给客户端,或1个也不返回(因为无法匹配数据);如果只支持nationality和type的索引,那么将返回所有中国籍的handy,假设共计200条;如果全部条件索引都支持,那么将返回10条船.因此而产生的流量也是不同的.

那么磁盘空间的大小,计算资源的开销和流量三种资源都会影响Azure的计费.因此如何合理配置collection的indexpolicy属性就显得十分重要了.

DocumentDB的索引策略和索引模式和索引精度DocumentDB的IndexingPolicy&IndexingMode&IndexingPrecision

索引模式:public enum IndexingMode: Consistent,Lazy,None


数据库索引模式

DocumentDB 支持三种索引模式,可通过索引策略对 DocumentDB 集合进行配置:一致、延迟和无。

一致︰如果将 DocumentDB 集合的策略指定为"一致",针对指定 DocumentDB 集合的查询将按照为点读取指定的一致性级别进行(即强、有限过期性、会话或最终)。索引会作为文档更新(即插入、替换、更新和删除 DocumentDB 集合中的文档)的一部分进行同步更新。一致索引支持一致的查询,但代价是可能降低写入吞吐量。这种减少受需要索引的唯一路径和"一致性级别"的影响。一致的索引模式适用于"快速写入、立即查询"工作负荷。

延迟︰若要实现最大的文档引入吞吐量,可为 DocumentDB 集合配置延迟一致性;也就是说,查询最终是一致的。DocumentDB 集合处于静止状态时(即为用户请求提供服务时没有完全利用集合的吞吐量),将以异步方式更新索引。对于需要无阻碍文档引入的"现在引入、稍后查询"工作负荷,可能适合"延迟"索引模式。

无︰索引模式标记为"无"的集合没有与之关联的索引。如果 DocumentDB 用作键值存储,并且只通过其 ID 属性访问文档,则通常使用该模式。

来自 <https://www.azure.cn/documentation/articles/documentdb-indexing-policies/>

 

官方介绍简直不是人话啊,看了半天撸出个大概的意思就是数据改变之后什么时候可以在索引层查得到,一致就是不论系统忙不忙,任何数据的改变都即刻更新到索引层,延迟就是不忙的时候更新,一会儿就能查到;无就是对数据值的改变根本不反应到索引层,只通过数据的键能检索到数据.

而更多关于索引策略参见:

索引路径来自 <https://docs.microsoft.com/zh-cn/azure/documentdb/documentdb-indexing-policies>

索引数据类型、种类和精度来自 <https://docs.microsoft.com/zh-cn/azure/documentdb/documentdb-indexing-policies>

按照Guidance中的方法执行完后,可以看到新建的collection的属性如下图,其中默认的IndexingMode为Consistent.


再来看Azure的Dashboard,新建的数据集显示出来了.


  • 创建数据
  • 增改删查
时间: 2024-07-29 06:26:10

上手DocumentDB On Azure (一)的相关文章

上手DocumentDB On Azure(四)

因为同时学习python crawler,所以临时决定把asp.net app的部分先拿出来,顺便学习和熟练DoucmentDB相关知识. 本节教程参考: ASP.NET MVC 教程:使用 DocumentDB 开发 Web 应用程序 来自 <https://www.azure.cn/documentation/articles/documentdb-dotnet-application/> 准备工作包括: 确保你已经有了Azure账户; 在你的Azure上已经有可供使用的DocumentD

上手DocumentDB On Azure (二)

无需像传统的JsonDataSerializer一样将每一个属性标上[DataMember]Attribute,只需重写Tostring方法,Newtonsoft.Json.JsonConvert.SerializeObject(this)会自动将Object属性写成Json文档,但需为键属性指定 [JsonProperty(PropertyName = "id")]. 注意: 当DataObject存在继承关系时,JsonConvert只会序列化当前类的属性,而忽略其父类的属性,因此

Azure DocumentDB对比MongoDB

(此文章同时发表在本人微信公众号"dotNET每日精华文章") 今天推荐的文章对Azure DocumentDB和MongoDB的进行了比较,也给出了一些使用建议. 我想很多朋友都应该知道Azure,不过估计也有很多人不知道微软还推出了自己的NoSQL数据库产品.当然这个产品仅限以PaaS的方式来在Azure中提供.DocumentDB去年秋天开始预览,这个正式上线(按照Azure的说法是Generally Available).当然,在NoSQL市场上,混战激烈,尤其MongoDB占

Azure 8月众多新版本公布

Azure 8月新发布:IoT 中心S3 版,Azure 热/冷存储层,DocumentDB,SQL Server Stretch Database, MySQL 5.7, Cloud Foundry, Azure云助手, Wosign根证书更换. Azure IoT 中心 S3 版正式发布 Azure IoT Hub S3 版旨在帮助企业解决客户使用大量设备生成大量数据并需要频繁传输消息这一现状.S3 版的每个单元每天最多可传输三亿条消息.Azure IoT Hub S3 是 Azure Io

开发者为何对Service Fabric爱不释手?值得关注!

有了它,人人都可开发高可用高伸缩应用.今天小编就为大家介绍一款开发者的"利器"--Service Fabric . 在介绍它之前,先来了解一下它的背景. Service Fabric 是一款应用程序平台,可用于构建基于微服务的应用程序.其核心部分是一个分布式系统平台,用于构建可扩展的可靠应用.在便于封装可部署代码的同时,还内置了微服务最佳实践案例. 快速上市:通过 Service Fabric,开发人员可将重点放在创建可为应用程序增加商业价值的功能上,从而避免了为在基础结构中处理可靠性

物联网平台构架系列 (四):Amazon, Microsoft, IBM IoT 平台导论 之 平台

最近研究了一些物联网平台技术资料,以做选型参考.脑子里积累大量信息,便想写出来做一些普及.作为科普文章,力争通俗易懂,不确保概念严谨性.我会给考据癖者提供相关英文链接,以便深入研究. -- 冯立超 HiwebFrank 4. 平 台 由于物联网的地域分布广.设备数量众多的特点,物联网解决方案必须借助公有云平台来实现. 物联网解决方案须具备如下功能: - 从设备收集数据 - 分析移动中的数据流 - 存储和查询大型数据集 - 可视化实时和历史数据 - 与后端办公系统集成 - 管理设备 下图是微软给出

物联网平台构架系列 (五):Amazon, Microsoft, IBM IoT 解决方案导论 之 安全

最近研究了一些物联网平台技术资料,以做选型参考.脑子里积累大量信息,便想写出来做一些普及.作为科普文章,力争通俗易懂,不确保概念严谨性.我会给考据癖者提供相关英文链接,以便深入研究. -- 冯立超 HiwebFrank 5. 安 全 我想用遥控器把隔壁邻居家的电视给关了! 不知是否可以,但至少,我拿着一个空调遥控器可以到各个房间开关空调. 如果物联网设备没有任何安全措施,那么状况将无法设想. 如何做到全方位安全? 微软早在2003年就提出了可信赖的计算 Trustworthy Computing

2016年01月MVP开始申请了~[截止时间:10月23日]

51CTO与微软中国合作长期为用户提供申请"微软最有价值专家"的平台希望有兴趣.资历的朋友以及正在朝这个方向努力的朋友能够积极参与只要您想参与我们将为您向微软推荐 微软最有价值专家MVP一年评选4次分别为每年的1月.4月.7月.10月.2016年1月的MVP申请截止时间是2015年10月23日. 申请MVP的午饭请下载2016年1月MVP申请表填好后发送到[email protected].我们会在每次MVP申请开始时把用户提交的申请表格推荐到微软中国相关部门 [调整说明]目前的奖励类

通过php的MongoDB driver连接Azure的DocumentDB PaaS

Azure的DocumentDB是NoSQL类型的数据库.它还可以和目前流行的mongodb兼容,采用mongodb的driver可以直接连接Azure的DucumentDB. 目前在国内的Azure上,DocumentDB已经正式商用了,兼容mongodb的版本目前还在preview阶段. 本文将介绍如何创建,并通过php的mongodb的driver连接documentDB. 一 在Azure的管理界面上创建DocumentDB: 1 点击portal左上角的"+"号,然后输入do