asp.net word内容读取到页面

1、添加Microsoft.Vbe.Interop.dll引用。

2、以下方法可以简单的读取到word文档文字内容,不包括图片、格式等。

private string ReadWordFile(string file)
    {
        string filePath = Server.MapPath(file);
        if (System.IO.File.Exists(filePath))
        {
            Microsoft.Office.Interop.Word.ApplicationClass wordApp = new Microsoft.Office.Interop.Word.ApplicationClass();
            object fileobj = filePath;
            object nullobj = System.Reflection.Missing.Value;
            //打开指定文件(不同版本的COM参数个数有差异,一般而言除第一个外都用nullobj就行了)
            Microsoft.Office.Interop.Word.Document doc = wordApp.Documents.Open(ref fileobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj,
                ref nullobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj, ref nullobj);
            //取得doc文件中的文本
            string outText = doc.Content.Text;             //关闭文件
            doc.Close(ref nullobj, ref nullobj, ref nullobj);             //关闭COM
            wordApp.Quit(ref nullobj, ref nullobj, ref nullobj);             //返回
            return outText;
        }

        return null;
    }

3、把word文档正确展示出来,把word转换成html文档,然后读取出来。

private void ChangeWordToHtml(string docFilePath, string htmlFilePath)
    {
        ApplicationClass word = new ApplicationClass();
        Type wordType = word.GetType();
        Documents docs = word.Documents;

        Type docsType = docs.GetType();
        object file = docFilePath;
        Document doc = (Document)docsType.InvokeMember("Open", BindingFlags.InvokeMethod, null, (object)docs, new Object[] { file, true, true });

        //判断与文件转换相关的文件是否存在,存在则删除。(这里,最好还判断一下存放文件的目录是否存在,不存在则创建)
        if (File.Exists(htmlFilePath))
        {
            File.Delete(htmlFilePath);
        }

        //每一个html文件,有一个对应的存放html相关元素的文件夹(html文件名.files)
        if (Directory.Exists(htmlFilePath.Replace(".html", ".files")))
        {
            Directory.Delete(htmlFilePath.Replace(".html", ".files"), true);
        }

        Type docType = doc.GetType();
        object saveFileName = htmlFilePath;
        docType.InvokeMember("SaveAs", BindingFlags.InvokeMethod, null, doc, new object[] { saveFileName, WdSaveFormat.wdFormatHTML });

        // 退出 Word
        wordType.InvokeMember("Quit", BindingFlags.InvokeMethod, null, word, null);
    }
private string LoadFileContent(string fileName)
    {
        if (fileName != "")
        {
            string path ="~/path/";
            string docFilePath = Server.MapPath(path + fileName);
            string htmlFilePath = Server.MapPath(path + fileName.Split(‘.‘)[0] + ".html");
            ChangeWordToHtml(docFilePath, htmlFilePath);
            if (File.Exists(htmlFilePath))
            {          //确保读取html文件时对当前文件操作的上一进程结束
                Thread.Sleep(2000);    
                string content = File.ReadAllText(htmlFilePath, Encoding.Default);
                return content;
            }
        }
        return null;
    }
时间: 2024-10-11 21:27:08

asp.net word内容读取到页面的相关文章

java读取word内容

暂时只写读取word内容的方法. 依赖的jar: poi-3.9-20121203.jarpoi-ooxml-3.9-20121203.jarxmlbeans-2.3.0.jar package com.word; import java.io.File; import java.io.FileInputStream; import java.io.InputStream; import org.apache.poi.POIXMLDocument; import org.apache.poi.P

如何在ASP.NET Web站点中统一页面布局[Creating a Consistent Layout in ASP.NET Web Pages(Razor) Sites]

如何在ASP.NET Web站点中统一页面布局[Creating a Consistent Layout in ASP.NET Web Pages(Razor) Sites] 一.布局页面介绍[About Layout Pages] 很多网站有些内容需要显示在各个页面中,比如Header,Footer或者告诉用户已经登录的部分.ASP.NET允许你创建一个单独的文件来包含文本.标签和代码的内容块,从而搭建一个风格整齐的网站.接下来你就可以将这个内容块插入到任何你想要让它展示的页面中.采用这种方法

Asp.net文章内容分页

#region Html内容分页处理函数 /// <summary> /// Html内容分页处理函数 /// </summary> /// <param name="strBody">要分页的内容</param> /// <param name="strSplitString">分隔字符串</param> /// <param name="pageIndexName"

HTML、ASP、PHP 强制不缓存页面

不缓存页面对于数据实时性要求很强的功能来说很重要,以下是 HTML.ASP.PHP 强制不缓存页面的代码. HTML 强制页面不缓存代码 <!-- no cache headers --> <meta http-equiv="Pragma" content="no-cache"> <meta http-equiv="no-cache"> <meta http-equiv="Expires&quo

[译]ASP.NET Core 2.0 布局页面

问题 如何在ASP.NET Core 2.0项目中共享可见元素.代码块和指令? 答案 新建一个空项目,首先添加GreetingService服务和UserViewModel模型: public interface IGreetingService { string Greet(string firstname, string surname); } public class GreetingService : IGreetingService { public string Greet(stri

学习ASP.NET Core Razor 编程系列五——Asp.Net Core Razor新建模板页面

学习ASP.NET Core Razor 编程系列目录 学习ASP.NET Core Razor 编程系列一 学习ASP.NET Core Razor 编程系列二——添加一个实体 学习ASP.NET Core Razor 编程系列三——创建数据表及创建项目基本页面 学习ASP.NET Core Razor 编程系列四——Asp.Net Core Razor列表模板页面 上一篇文章中我们学习了列表页面的结构,@page与@model两个关键Razor指令,以及页面布局应该修改哪里.这一篇文章我们来

c#用NPOI将excel文件内容读取到datatable数据表中

将excel文件内容读取到datatable数据表中,支持97-2003和2007两种版本的excel 1.第一种是根据excel文件路径读取excel并返回datatable 1 /// <summary> 2 /// 将excel文件内容读取到DataTable数据表中 3 /// </summary> 4 /// <param name="fileName">文件完整路径名</param> 5 /// <param name=

Blob 存儲文件,读取到页面显示

<body><% //获取图片对象(根据主键)的sql语句String showImage = " select * "+ " from 存放图片的表 "+ " where id='1' " ; BufferedInputStream inputImage = null; try{ //conn为一个Connection对象Statement st = conn.createStatement(); //获取结果集ResultS

asp.net word ecxel类型文件在线预览

首先得引用COM: Microsoft Excel 10 Object Library Microsoft Word 10 Object Library 或者是 10以上的类库 我现在用的是:资源下载: http://download.csdn.net/detail/panfuy/3247641 或者附件 Microsoft Excel 10 Object Library Microsoft Word 10 Object Library 代码如下: C#代码   using System; us