C# 实现将多个word文档合并成一个word文档的功能

  前段时间项目上遇到这么一个需求,需要将多个OCR识别的word文档合并成一个,于是就在网上找了找,自己修改了一下。在这里跟大家分享一下,希望有用的到的。

  要做多word文档合并,首先要导入Microsoft.Office.Interop.Word这个dll。我觉得很多人会在这个问题上纠结很久,因为找不到这个dll,当然我也这里找了很久才找到,最终我的解决办法是这样的。如果在VS的引用下的COM组件中找不到这个dll,那么,你就在你的电脑上查找这个文件,如果找到了,你可以直接把它复制到你项目中,然后用浏览的方式直接找到这个dll引用就可以了。另外网上还有人说添加Microsoft Office 11.0 Object Library这个引用,看你具体需要吧,如果用得着,那就添加,用不着就没必要。如果你电脑上查找不到Microsoft.Office.Interop.Word.dll,那么可能是你的office安装的有问题,就往这方面解决。好了,引用了这个dll后就可以写代码了。

  这里网上有一个封装好的类,稍微修改了一下,还不错,所以就直接拿来给大家参考。其实我觉得开发没必要什么都亲力亲为,我们程序员的工作任务是解决实际的问题,而并不是写代码。

 public class WordClass
    {
        Microsoft.Office.Interop.Word.Application objApp = null;
        Document objDocLast = null;
        Document objDocBeforeLast = null;
        public WordClass()
        {
            objApp = new Application();
        }
        #region 打开文件
        public void Open(string tempDoc)
        {
            object objTempDoc = tempDoc;
            object objMissing = System.Reflection.Missing.Value;

            objDocLast = objApp.Documents.Open(
               ref objTempDoc, //FileName
               ref objMissing, //ConfirmVersions
               ref objMissing, //ReadOnly
               ref objMissing, //AddToRecentFiles
               ref objMissing, //PasswordDocument
               ref objMissing, //PasswordTemplate
               ref objMissing, //Revert
               ref objMissing, //WritePasswordDocument
               ref objMissing, //WritePasswordTemplate
               ref objMissing, //Format
               ref objMissing, //Enconding
               ref objMissing, //Visible
               ref objMissing, //OpenAndRepair
               ref objMissing, //DocumentDirection
               ref objMissing, //NoEncodingDialog
               ref objMissing //XMLTransform
               );
            objDocLast.Activate();
        }
        #endregion

        #region 保存文件到输出模板
        public void SaveAs(string outDoc)
        {
            object objMissing = System.Reflection.Missing.Value;
            object objOutDoc = outDoc;
            objDocLast.SaveAs(
            ref objOutDoc, //FileName
            ref objMissing, //FileFormat
            ref objMissing, //LockComments
            ref objMissing, //PassWord
            ref objMissing, //AddToRecentFiles
            ref objMissing, //WritePassword
            ref objMissing, //ReadOnlyRecommended
            ref objMissing, //EmbedTrueTypeFonts
            ref objMissing, //SaveNativePictureFormat
            ref objMissing, //SaveFormsData
            ref objMissing, //SaveAsAOCELetter,
            ref objMissing, //Encoding
            ref objMissing, //InsertLineBreaks
            ref objMissing, //AllowSubstitutions
            ref objMissing, //LineEnding
            ref objMissing //AddBiDiMarks
            );
        }
        #endregion

        #region 循环合并多个文件(复制合并重复的文件)
        /// <summary>
        /// 循环合并多个文件(复制合并重复的文件)
        /// </summary>
        /// <param name="tempDoc">模板文件</param>
        /// <param name="arrCopies">需要合并的文件</param>
        /// <param name="outDoc">合并后的输出文件</param>
        public void CopyMerge(string tempDoc, string[] arrCopies, string outDoc)
        {
            object objMissing = Missing.Value;
            object objFalse = false;
            object objTarget = WdMergeTarget.wdMergeTargetSelected;
            object objUseFormatFrom = WdUseFormattingFrom.wdFormattingFromSelected;
            try
            {
                //打开模板文件
                Open(tempDoc);
                foreach (string strCopy in arrCopies)
                {
                    objDocLast.Merge(
                    strCopy, //FileName
                    ref objTarget, //MergeTarget
                    ref objMissing, //DetectFormatChanges
                    ref objUseFormatFrom, //UseFormattingFrom
                    ref objMissing //AddToRecentFiles
                    );
                    objDocBeforeLast = objDocLast;
                    objDocLast = objApp.ActiveDocument;
                    if (objDocBeforeLast != null)
                    {
                        objDocBeforeLast.Close(
                        ref objFalse, //SaveChanges
                        ref objMissing, //OriginalFormat
                        ref objMissing //RouteDocument
                        );
                    }
                }
                //保存到输出文件
                SaveAs(outDoc);
                foreach (Document objDocument in objApp.Documents)
                {
                    objDocument.Close(
                    ref objFalse, //SaveChanges
                    ref objMissing, //OriginalFormat
                    ref objMissing //RouteDocument
                    );
                }
            }
            finally
            {
                objApp.Quit(
                ref objMissing, //SaveChanges
                ref objMissing, //OriginalFormat
                ref objMissing //RoutDocument
                );
                objApp = null;
            }
        }
        /// <summary>
        /// 循环合并多个文件(复制合并重复的文件)
        /// </summary>
        /// <param name="tempDoc">模板文件</param>
        /// <param name="arrCopies">需要合并的文件</param>
        /// <param name="outDoc">合并后的输出文件</param>
        public void CopyMerge(string tempDoc, string strCopyFolder, string outDoc)
        {
            string[] arrFiles = Directory.GetFiles(strCopyFolder);
            CopyMerge(tempDoc, arrFiles, outDoc);
        }
        #endregion

        #region 循环合并多个文件(插入合并文件)
        /// <summary>
        /// 循环合并多个文件(插入合并文件)
        /// </summary>
        /// <param name="tempDoc">模板文件</param>
        /// <param name="arrCopies">需要合并的文件</param>
        /// <param name="outDoc">合并后的输出文件</param>
        public void InsertMerge(string tempDoc, List<string> arrCopies, string outDoc)
        {
            object objMissing = Missing.Value;
            object objFalse = false;
            object confirmConversion = false;
            object link = false;
            object attachment = false;
            try
            {
                //打开模板文件
                Open(tempDoc);
                foreach (string strCopy in arrCopies)
                {
                    objApp.Selection.InsertFile(
                    strCopy,
                    ref objMissing,
                    ref confirmConversion,
                    ref link,
                    ref attachment
                    );
                }
                //保存到输出文件
                SaveAs(outDoc);
                foreach (Document objDocument in objApp.Documents)
                {
                    objDocument.Close(
                    ref objFalse, //SaveChanges
                    ref objMissing, //OriginalFormat
                    ref objMissing //RouteDocument
                    );
                }
            }
            finally
            {
                objApp.Quit(
                ref objMissing, //SaveChanges
                ref objMissing, //OriginalFormat
                ref objMissing //RoutDocument
                );
                objApp = null;
            }
        }
        /// <summary>
        /// 循环合并多个文件(插入合并文件)
        /// </summary>
        /// <param name="tempDoc">模板文件</param>
        /// <param name="arrCopies">需要合并的文件</param>
        /// <param name="outDoc">合并后的输出文件</param>
        public void InsertMerge(string tempDoc, string strCopyFolder, string outDoc)
        {
            string[] arrFiles = Directory.GetFiles(strCopyFolder);
            List<string> files = new List<string>();
            for (int i = 0; i < arrFiles.Count(); i++)
            {
                if (arrFiles[i].Contains("doc"))
                {
                    files.Add(arrFiles[i]);
                }
            }
            InsertMerge(tempDoc, files, outDoc);
        }
        #endregion

        #region 合并文件夹下的所有txt文件

        /// <summary>
        /// 合并多个txt文件
        /// </summary>
        /// <param name="infileName">文件存在的路劲</param>
        /// <param name="outfileName">输出文件名称</param>
        public void CombineFile(string filePath, string outfileName)
        {
            string[] infileName = Directory.GetFiles(filePath, "*.txt");
            int b;
            int n = infileName.Length;
            FileStream[] fileIn = new FileStream[n];
            using (FileStream fileOut = new FileStream(outfileName, FileMode.Create))
            {
                for (int i = 0; i < n; i++)
                {
                    try
                    {
                        fileIn[i] = new FileStream(infileName[i], FileMode.Open);
                        while ((b = fileIn[i].ReadByte()) != -1)
                            fileOut.WriteByte((byte)b);
                    }
                    catch (System.Exception ex)
                    {
                        Console.WriteLine(ex.Message);
                    }
                    finally
                    {
                        fileIn[i].Close();
                    }
                }
            }
        }
        #endregion
    }

  使用这个类,我们可以把一个目录下的所有word文档合并成一个,也可以把一个目录下的所有txt文件合并成一个。

时间: 2024-10-13 04:45:46

C# 实现将多个word文档合并成一个word文档的功能的相关文章

如何在线把一个HTML页面转换成一个PDF文档?

http://blog.csdn.net/seiyagoo/article/details/46554133 http://blog.csdn.net/seiyagoo/article/details/46554135 http://blog.csdn.net/seiyagoo/article/details/46554141 http://blog.csdn.net/seiyagoo/article/details/46554151 http://blog.csdn.net/seiyagoo/

利用Lucene将大文档切割成多个小文档,(可运行)

这段代码,具体用的时候,我是修改了括号里的参数的类型,我想写的方法就是一个源文件 ,一个目的文件,利用源文件调用方法,然后生成目标文件. 对原有的大文件进行切割,切割的大小是自己限定的最大的大小, 文件名字的序号就是: 从自然数的顺序,依次递增. 代码如下: 如需使用需要修改自己原文件的目录. package comOne; import java.io.BufferedReader; import java.io.BufferedWriter; import java.io.File; imp

懒人办公|30秒搞定PDF文档合并

在日常办公学习中,经常遇到多个PDF文件的情况,一个个点击查看非常麻烦,而且发邮件给客户也不方便,需要添加多个附件,那么问题如何解决呢?其实很简单,仅需将多个PDF合并成一个PDF文档即可,接下来和小编一起学习一下PDF合并技巧吧. 1. PDF365--在线PDF合并 在浏览器直接输入:PDF365.cn,或者百度搜索"PDF365"进入网站: 选择"PDF合并"功能,进入PDF合并页面. 直接拖拽需要合并的PDF文档,或者点击"选择文件"按钮

【jacob word】使用jacob,合并多个word为一个word文件

将几个word文件合并到一个word文件,使用注意点: 1.后面附项目运用的jar包jacob-1.9, 2.并且jacob运用中,需要将附件内的jacob.dll放到windows/system32下 语法介绍: 将一个关于JACOB的代码分成下面几个步骤: 1) ActiveXComponent ax = new ActiveXComponent("a1")://构建ActiveX组件实例 其中的a1的值和你需要调用的ActiveX控件有关 MS控件名 a1的值 InternetE

C# 合并及拆分Word文档

本文简要分析一下如何如何使用C#简单实现合并和拆分word文档.平时我们在处理多个word文档时,可能会想要将两个文档合并为一个,或者是将某个文档的一部分添加到另一个文档中,有的时候也会想要将文档拆分.在Word中,合并或拆分文档最简单的方式就是打开一个原文档的副本文件,复制我们需要的部分,删除不需要的部分,然后再保存文档.使用这种方法在文档比较多或者比较大时手动操作起来比较费时,以下是使用C#实现合并一个Word文档的某一个section到另一个文档或者合并两个完整的Word文档到一个单独的文

C# 导出word文档及批量导出word文档(3)

在初始化WordHelper时,要获取模板的相对路径.获取文档的相对路径多个地方要用到,比如批量导出时要先保存文件到指定路径下,再压缩打包下载,所以专门写了个关于获取文档的相对路径的类. 1 #region 获取文档的相对路径 2 public class WordFilePath 3 { 4 #region 返回文件带路径值 5 /// <summary> 6 /// 返回文件带路径值 7 /// </summary> 8 /// <param name="Fil

C# 如何合并、拆分Word文档

概述 出于方便文档管理.存储.传输等目的,我们常会想要将某些文档拆分为多个子文档,或者将多个文档合并为一个文档.在本文中,将介绍对Word文档进行拆分.合并的方法.下面的示例中将包含以下要点: 合并Word文档1.1 新建一页合并到文档1.2 紧接上文合并到文档 拆分Word文档2.1 按分节符拆分2.2 按分页符拆分 所用工具 Free Spire.Doc for .NET 6.3 Visual Studio 示例操作 一.合并Word文档(一)以新建一页合并到文档[C#] using Spi

如何把Excel中的每一行都存储为一个TXT文档

当Excel中有多行数据时,恰巧我们也需要把每一行数据都存储成一个txt文档,那么我们要手工一个一个Ctrl+c-->Ctrl+v-->Ctrl+s吗?答案是肯定不行的哇,因为本人需要处理一个存储了6万多条数据的文档,为了珍爱生命,那么本人就利用office里的VBA来投机取巧了! 首先利用快捷键Alt+F11,打开Excel的VBA,输入如下代码: Private Sub CommandButton1_Click()     Application.ScreenUpdating = Fals

Jsoup入门-解析和遍历一个html文档

解析和遍历一个HTML文档 如何解析一个HTML文档: String html = "<html><head><title>First parse</title></head>" + "<body><p>Parsed HTML into a doc.</p></body></html>"; Document doc = Jsoup.parse(ht