SharePoint 2013 对二进制大型对象(BLOB)进行爬网

原文:SharePoint 2013 对二进制大型对象(BLOB)进行爬网

  本文是参考MSDN文档做的示例,SharePoint 2013搜索二进制对象(BLOB),通过外部内容类型的方式将外部数据与SharePoint相关联,修改BCD模型,使SharePoint能够爬网外部数据中的文件流。

  步骤,首先就是使用SPD创建外部内容类型,并为外部内容类型添加各种操作;然后,将BCD模型导出,添加方法后重新导入;最后,配置爬网,对外部内容类型进行爬网。

1、首先,用Designer 2013打开站点,点击左上角按钮,创建外部内容类型;

2、输入外部内容类型的名称,点击“单击此处发现外部数据并定义操作”;

3、在外部内容类型的操作设计器中,点击添加连接;

4、而后的外部数据源类型选择SQL Server;

5、再然后填写SQL Server连接的相关属性,如下图添加,即可:

6、如下图,添加连接以后,会显示数据库相关表和视图,下面,我们创建所有操作;

7、如下图,可以看到创建、读取项、更新、删除、读取列表等操作,当然,某些情况,我们也会一一创建,这里为了省事儿,我一起创建;

8、可以看到我们数据源的元素,我们全部显示出来,并且ID是主键,点击下一步;

9、进入筛选器参数配置,如下图,我们点击添加筛选器参数,参见步骤10:

10、如下图,添加筛选器后,选中,点击右侧的“单击以添加”,弹出“筛选器配置”对话框,选中限制,点击确定,而后在右侧默认值选中1000;

  特:要说明的是,这个限制是防止返回大量数据的,如果限制了1000,数据量超过1000后会报错,需要修改这个设置;

11、创建完毕后,点击完成,查看下图:可以看到外部内容类型的操作和字段;

12、创建完毕后,选中导出BCD模型,如下图,点击确定,选中路径,保存即可;

13、使用VS打开导出的BCD模型,方便编辑;

  特别:如果你对于BCD模型不是很熟悉,建议先看看文章后面附的MSDN链接,多理解下每个节点,大致有什么意思。哪里是属性,哪里是变量声明,哪里是方法,这样对于配置起来,会事半功倍的。

14、修改导出的BCD模型,添加新的方法,用来爬网BLOB;

15、修改完成后,进入管理中心,删除现有的BCD模型,导入我们修改以后的,如下图:

16、进入搜索应用程序,添加内容源,并对内容源进行完全爬网;

17、查看爬网日志;

  详细日志

18、测试搜索程序;

  如博客介绍,SharePoint 2013搜索BLOB,如果可以行程解决方案,对搜索SharePoint系统外数据库中的文件,会有很大的帮助,本文参考MSDN文档,如有任何问题,可以参照附录的文档查看。

  好了,就这样吧,好歹搞一搞,就又该睡觉了,还好今天还算有收获,大家晚安~~

修改BCD模型添加的方法的Xml

<Method Name="GetData">

<Properties>

<Property Name="RdbCommandText" Type="System.String">SELECT FileDate FROM T_BlobDate where [email protected]</Property>

<Property Name="RdbCommandType" Type="System.Data.CommandType, System.Data, Version=4.0.0.0, Culture=neutral, PublicKeyToken=b77a5c561934e089">Text</Property>

</Properties>

<Parameters>

<Parameter Direction="In" Name="@ID">

<TypeDescriptor TypeName="System.Int32" IdentifierName="ID" Name="ID" />

</Parameter>

<Parameter Name="StreamData" Direction="Return">

<TypeDescriptor TypeName="System.Data.IDataReader, System.Data, Version=4.0.0.0, Culture=neutral, PublicKeyToken=b77a5c561934e089" IsCollection="true" Name="StreamData">

<TypeDescriptors>

<TypeDescriptor TypeName="System.Data.IDataRecord, System.Data, Version=4.0.0.0, Culture=neutral, PublicKeyToken=b77a5c561934e089" Name="StreamData Element">

<TypeDescriptors>

<TypeDescriptor TypeName="System.Byte[]" Name="FileDate" />

</TypeDescriptors>

</TypeDescriptor>

</TypeDescriptors>

</TypeDescriptor>

</Parameter>

</Parameters>

<MethodInstances>

<MethodInstance Name="FileDate" ReturnParameterName="StreamData" Type="StreamAccessor" ReturnTypeDescriptorPath="StreamData[0].FileDate" Default="true">

<Properties>

<Property Name="MimeTypeField" Type="System.String">ContentType</Property>

<Property Name="FileNameField" Type="System.String">DisplayName</Property>

</Properties>

</MethodInstance>

</MethodInstances>

</Method>

外部内容类型的数据库库结构

参考链接

如何:基于 SQL Server 表创建外部内容类型

http://msdn.microsoft.com/zh-cn/library/office/ee557243.aspx

如何:在 SharePoint 中创建外部列表

http://msdn.microsoft.com/zh-cn/library/office/ee558778.aspx

如何:在 SharePoint 2013 中对二进制大型对象 (BLOB) 进行爬网

http://msdn.microsoft.com/zh-cn/library/office/gg294168.aspx

XML Snippet: Modeling a StreamAccessor Method

http://msdn.microsoft.com/en-us/library/ff464410.aspx

时间: 2024-12-26 20:48:43

SharePoint 2013 对二进制大型对象(BLOB)进行爬网的相关文章

SharePoint 2013 使用 RBS 功能将二进制大型对象 BLOB 存储在内容数据库外部。

为每个内容数据库设置 BLOB 存储 启用并配置 FILESTREAM 之后,请按照以下过程在文件系统中设置 BLOB 存储.必须为要对其使用 RBS 的每个内容数据库设置 BLOB 存储. 设置 BLOB 存储 确认执行这些步骤的用户帐户是要为其配置 RBS 的每个数据库上 db_owner 固定数据库角色的成员. 依次单击"开始"."所有程序"."Microsoft SQL Server 2008"和"SQL Server Mana

HTML5中的二进制大对象Blob(转)

HTML5中的Blob对象和MYSQL中的BLOB类型在概念上是有点区别的.MYSQL中的BLOB类型就只是个二进制数据容器.而HTML5中的Blob对象除了存放二进制数据外还可以设置这个数据的MINE类型,这相当于对文件的储存,其它很多二进制对象也是从这个对象继承的. 一个Blob对象就是一个包含有只读原始数据的类文件对象.Blob对象中的数据并不一定得是JavaScript中的原生形式.File接口基于Blob,继承了Blob的功能,并且扩展支持了用户计算机上的本地文件. 创建Blob对象的

SharePoint 2013 图像呈现形式介绍

由于图像呈现形式依赖 SharePoint Server 2013 中的其他功能,因此需确保您满足本节中的先决条件,才能执行本文中的过程.先决条件包括: • 发布网站集 您要在其中添加图像呈现形式的网站集必须已事先使用发布门户或产品目录网站集模板进行创建.或者,您必须在要使用图像呈现形式的网站集上启用发布功能.有关详细信息,请参阅 TechNet 库中的发布到 Internet.Intranet 和 Extranet 网站的概述. • 配置的 BLOB 缓存 基于磁盘的 BLOB 缓存用于控制二

SharePoint Server 2013 中的爬网最佳做法

了解在 SharePoint Server 2013 中爬网的最佳做法 搜索系统对内容进行爬网,以构建一个用户可以对其运行搜索查询的搜索索引.本文包含有关如何最有效地管理爬网的建议. 本文内容: 使用默认内容访问帐户对大部分内容进行爬网 有效使用内容源 对用户配置文件进行爬网,然后再对 SharePoint 网站进行爬网 使用连续爬网确保搜索结果为最新 使用爬网规则排除已爬网的不相关的内容 对 SharePoint Web 应用程序的默认区域进行爬网 降低对 SharePoint 爬网目标进行爬

BEGINNING SHAREPOINT&#174; 2013 DEVELOPMENT 第9章节--客户端对象模型和REST APIs概览 Windows Phone

BEGINNING SHAREPOINT? 2013 DEVELOPMENT 第9章节--客户端对象模型和REST APIs概览 Windows Phone 和.NET托管代码和JavaScript CSOMs一样,CSOM库对于Windows Phone和Silverlight同样可用.

BEGINNING SHAREPOINT&#174; 2013 DEVELOPMENT 第9章节--客户端对象模型和REST APIs概览 REST和ODATA

BEGINNING SHAREPOINT? 2013 DEVELOPMENT 第9章节--客户端对象模型和REST APIs概览 REST和ODATA REpresentational State Transfer (REST)是设计通过Internet网络简单消费数据的普遍模式.

BEGINNING SHAREPOINT&#174; 2013 DEVELOPMENT 第9章节--客户端对象模型和REST APIs概览 客户端对象模型API范围

BEGINNING SHAREPOINT? 2013 DEVELOPMENT 第9章节--客户端对象模型和REST APIs概览 客户端对象模型API范围 本章之前提到过,客户端对象模型应用中一个不足就是缺乏对SP APIs和访问功能的支持不足.

BEGINNING SHAREPOINT&#174; 2013 DEVELOPMENT 第9章节--客户端对象模型和REST APIs概览 总结

BEGINNING SHAREPOINT? 2013 DEVELOPMENT 第9章节--客户端对象模型和REST APIs概览 总结 构建可以沟通远程系统的解决方案通常要求系统提供强大的远程API支持.

BLOB二进制对象(blob.c/h)

BLOB二进制对象(blob.c/h) 数据结构 struct blob_attr { uint32_t id_len; /** 高1位为extend标志,高7位存储id, * 低24位存储data的内存大小 */ char data[]; } __packed; struct blob_attr_info { unsigned int type; unsigned int minlen; unsigned int maxlen; bool (*validate)(const struct bl