【翻译自mos文章】 怎么对Microsoft (Office) Word Document 2007 索引化?

怎么对Microsoft (Office) Word Document 2007 索引化?

来源于:How To Index a Microsoft (Office) Word Document 2007 ? (文档 ID 752710.1)

适用于:

Oracle Text - Version: 11.1.0.7 to 11.2.0.3 - Release: 11.1 to 11.2

Information in this document applies to any platform.

目标

本文解释了对一个表中 含有 Microsoft Word 2007 document (new Microsoft formatting,DOCX格式)的 blob 列进行索引化的方法。

从Oracle Database 11.1.0.7开始,Oracle Text使用Oracle Outside In HTML Export技术(额外注:Oracle Outside In HTML Export技术来源于Oracle 公司的如下产品线:Middleware > Content Management > Oracle Outside In Technology > )进行文档过滤,该技术替代了Autonomy Inc公司授权给Oracle公司的filtering technology。

因此,这将会允许从Oracle Database 11.1.0.7+开始来对Microsoft (Office) Word 2007 documents进行索引化。

Kindly refer to the Appendix B of Oracle Text Reference for a complete list of filter-supported document formats in 11.1.0.7.

Oracle Text Reference 11g Release 1 (11.1)

Part Number B28304-03

http://download.oracle.com/docs/cd/B28359_01/text.111/b28304/afilsupt.htm#i634493

B.2 Supported Document Formats

解决方案:

请按照下面的步骤来完成对 Microsoft Word 2007 document的搜索

Step 1 - Within the /tmp directory place all the files to be used from this note.

docx1.sql
docx2.sql
test.txt
test.docx

--如上4个文档已经上传到csdn资源中,地址如下:

http://download.csdn.net/download/msdnchina/9480052

Step 2 - Create the necessary schema and privileges

connect system/manager       or as any privileged user...

create user testdocx identified by testdocx;
grant connect, resource, create any directory to testdocx;
connect testdocx/testdocx

Step 3 - Create the necessary objects (refer to the docx1.sql script)...

SQL> @/tmp/docx1.sql

Step 4 - Check a couple of terms inside the documents (refer to the docx2.sql script) ...

SQL> @/tmp/docx2.sql
时间: 2024-10-11 02:51:11

【翻译自mos文章】 怎么对Microsoft (Office) Word Document 2007 索引化?的相关文章

【翻译自mos文章】使用Windows操作系统的Dell Pcserver,Oracle db报错:ORA-8103

翻译自mos文章:使用Windows操作系统的Dell Pcserver,Oracle db报错:ORA-8103 ORA-8103 using Windows platform and DELL servers (Doc ID 1921533.1) Applies to: Oracle Database - Personal Edition - Version 11.1.0.6 to 12.1.0.2 [Release 11.1 to 12.1] Oracle Database - Stand

【翻译自mos文章】在win2003 sp1下,遇到无法解释的数据库性能下降

翻译自mos文章:在win2003 sp1下,遇到无法解释的数据库性能下降 Unexplained Database Slowdown Seen on Windows 2003 Service Pack 1 (Doc ID 464683.1) Applies to: Oracle Server - Enterprise Edition - Version 9.2.0.1 to 11.1.0.6 [Release 9.2 to 11.1] z*OBSOLETE: Microsoft Windows

【翻译自mos文章】从远程机器连接到windows上的db时报错ora-12170

从远程机器连接到windows上的db时报错ora-12170 参考原文: Windows: ORA-12170 Attempting to Connect from Remote Client (Doc ID 748461.1) 适用于: Oracle Net Services - Version 9.2.0.1 to 11.2.0.3 [Release 9.2 to 11.2] z*OBSOLETE: Microsoft Windows Generic Windows Microsoft W

【翻译自mos文章】找到'cursor: pin S wait on X' 等待事件的阻塞者session(即:持有者session)

找到'cursor: pin S wait on X' 等待事件的阻塞者session(即:持有者session) 来源于: How to Determine the Blocking Session for Event: 'cursor: pin S wait on X' (Doc ID 786507.1) 适用于: Oracle Database - Enterprise Edition - Version 10.2.0.1 to 11.2.0.3 [Release 10.2 to 11.2

【翻译自mos文章】SGA_TARGET与SHMMAX的关系

SGA_TARGET与SHMMAX的关系 参考原文: Relationship Between SGA_TARGET and SHMMAX (文档 ID 1527109.1) 适用于: Oracle Database - Enterprise Edition - Version 10.1.0.2 to 11.2.0.3 [Release 10.1 to 11.2] Information in this document applies to any platform. 目的: 解释了参数文件中

【翻译自mos文章】在11gR2 rac环境中,文件系统使用率紧张,并且lsof显示有很多oraagent_oracle.l10 (deleted)

在11gR2 rac环境中,文件系统使用率紧张,并且lsof显示有很多oraagent_oracle.l10 (deleted) 参考原文: High Space Usage and "lsof" Output Shows Many 'oraagent_oracle.l10 (deleted)' in GI environment (Doc ID 1598252.1) 适用于: Oracle Database - Enterprise Edition - Version 11.2.0.

【翻译自mos文章】使用buffer memory 参数来调整rman的性能。

使用buffer memory 参数来调整rman的性能. 本文翻译自mos文章:RMAN Performance Tuning Using Buffer Memory Parameters (Doc ID 1072545.1) rman 性能调整的目的是分辨一个特定的backup or  restore job的瓶颈. 并使用使用rman命令.初始化参数 或者对physical media的调整来提高整体的性能. 由于数据库容量持续变大,在客户的环境中,几十到几百TB的数据库很常见, serv

【翻译自mos文章】11gR2 OUI 在 PREREQUISITE CHECKS 时 hang住

翻译自mos文章:11gR2 OUI 在 PREREQUISITE CHECKS 时 hang住 适用于: Oracle Server - Enterprise Edition - Version 8.0.6.0 to 11.2.0.2.0 [Release 8.0.6 to 11.2] Information in this document applies to any platform. This can occur on any Unix/Linux platform 症状: 11gR2

【翻译自mos文章】升级到11.2.0.4之后在alert日志中出现 NUMA 警告信息

注:与本文有关的文章为:http://blog.csdn.net/msdnchina/article/details/43763927 升级到11.2.0.4之后在alert日志中出现 NUMA 警告信息 翻译自mos文章:NUMA warning message appear after upgrade to 11.2.0.4 (文档 ID 1600824.1)1 适用于: Oracle Database - Enterprise Edition - Version 11.2.0.4 and