.net 后台读取pdf的值

在网上找了内容

下载了这个插件

引用在了项目中

然后找到pdf中的位置 进行读取

  string pdfPath = Server.MapPath("~/ViewPatPdf.pdf");
                PDDocument doc = PDDocument.load(pdfPath);
                PDFTextStripper stripper = new PDFTextStripper();
                string txt = stripper.getText(doc);
                Response.Write(txt);

上面是第一种

下面用itextsharp进行读取

下载itextsharp.dll进行引用

然后写方法

 public string ReadPdfFile(string fileName)
        {
            StringBuilder text = new StringBuilder();
            PdfReader pdfReader = new PdfReader(fileName);
            for (int page = 1; page <= pdfReader.NumberOfPages; page++)
            {
                ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy();
                string currentText = PdfTextExtractor.GetTextFromPage(pdfReader, page, strategy);
                currentText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(currentText)));
                text.Append(currentText);
            }
            pdfReader.Close();
            return text.ToString();
        }

filename也是pdf的路径

然后就可以读取出来了

这个读取pdf上面的内容,纯粹的把pdf上面的内容进行读取

时间: 2024-10-07 08:02:45

.net 后台读取pdf的值的相关文章

.NET中TextBox控件设置ReadOnly=true后台取不到值三种解决方法

.NET中TextBox控件设置ReadOnly=true后台取不到值三种解决方法 当TextBox设置了ReadOnly=true后要是在前台为控件添加了值,后台是取不到的,值为空,多么郁闷的一个问题经过尝试,发现可以通过如下的方式解决这个问题.感兴趣的朋友可以了解下 当TextBox设置了ReadOnly="true" 后,要是在前台为控件添加了值,后台是取不到的,值为“空” 原理没想通,说不清楚微软是出于什么考虑的,不过有时是要我们能通过前台脚本来填充值,并不希望用户修改其控件内

asp.Net2.0中TextBox设置只读后后台获取不到值的解决方法

http://www.cnblogs.com/yxyht/archive/2013/03/02/2939883.html ASP.NET中TextBox控件设置ReadOnly="true"H或Enabled=false后台取不到值 当TextBox设置了ReadOnly="true" 后,要是在前台为控件添加了值,后台是取不到的,值为“空”  . 方法一:不设置ReadOnly属性,通过onfocus=this.blur()来模拟,如下: <asp:Text

ASP.NET中TextBox控件设立ReadOnly=&quot;true&quot;后台取不到值

SP.NET中TextBox控件设置ReadOnly="true"H或Enabled=false后台取不到值 当TextBox设置了ReadOnly="true" 后,要是在前台为控件添加了值,后台是取不到的,值为“空”  .    方法一:不设置ReadOnly属性,通过οnfοcus=this.blur()来模拟,如下: <asp:TextBox ID="TextBox1" runat="server" οnfοcu

Ajax的post方法,模拟 从后台读取数据小demo

$(document).ready(function() { //定义一个函数 function timer() { $.post("1.json", function(data, status) { //var strHtml = ""; var $ul = $('#ul1'); // 服务器返回的信息, 有两个一个success, error console.log(status); // 成功循环数据, 添加到页面中 if(status == "su

后台读取applicationContext.xml引发的奇葩问题

SpringMVC整合ibatis时,写了一个测试方法,运行正常,当运行另一个方法时报找不到对应的路径.此处无法理解,为什么同样规则的请求,第一次能够拦截第二次却提示找不到对应的处理方法. 后来将添加的第二个方法逐一注释掉,才发现在Dao层中读取applicationContext.xml时,为了让dao层的各方法共用一个applicationContext.xml,我将读取它的代码提取了出来,作为成员变量 处理了.后将每个dao方法添加同样的读取代码后,程序正常运行.添加代码如下: Appli

struts2中从后台读取数据到&lt;s:select&gt;

看到网上好多有struts2中从后台读取数据到<s:select>的,但都 不太详细,可能是我自己理解不了吧!所以我自己做了 一个,其中可能 有很多不好的地方,望广大网友指出 结果如图 public class Books implements java.io.Serializable { // Fields private String bookId; private String bookType; private String bookName; private String bookA

后台接受ajax传递值的实例代码

后台接受ajax传递值的实例代码: 使用ajax可以实现无刷新数据交互,下面是一段后台代码接收ajax传递值的实例代码供需要的朋友参考,希望能够带来帮助. ajax代码如下: $(function (){   timestamp=0;   $("#chatform").submit(function (){     var message=$("#msg").val();     var name=$("#author").val();    

前台JS设置Cookies后台读取刚设置的Cookies

今天在整理代码的时候,发现以前做到一半的功能没有实现.今天完善一下,并无私的将代码分享给大家. 前台代码: 1 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> 2 3 <html xmlns="http://www.w3.org/1999/xht

Python读取PDF内容

晚上翻看<Python网络数据采集>这本书,看到读取PDF内容的代码,想起来前几天集搜客刚刚发布了一个抓取网页pdf内容的抓取规则,这个规则适用的是已经把pdf内容合到html里的情况. 现在这个python版本的代码,是读取pdf文件内容(互联网上的或是本地的),觉得这个很有参考价值,就发个贴记录下来.这段代码主要是用了一个第三方库PDFMiner3K把PDF读成字符串,然后用StringIO转换成文件对象. from urllib.request import urlopen from p