java PPT 转成PDF,中文乱码解决

ppt转成pdf,原理是ppt转成图片,再用图片生产pdf,过程有个问题,不管是ppt还是pptx,都遇到中文乱码,编程方框的问题,其中ppt后缀网上随便找就有解决方案,就是设置字体为统一字体,pptx如果页面是一种中文字体不会有问题,如果一个页面有微软雅黑和宋体,就会导致部分中文方框,怀疑是poi处理的时候,只读取第一种字体,所以导致多个中文字体乱码。

百度和谷歌都找了很久,有看到说apache官网有人说是bug(https://bz.apache.org/bugzilla/show_bug.cgi?id=54880),但他们回复说是字体问题,这个问题其实我觉得poi可能可以自己做,读取原来字体设置成当前字体,不过性能应该会有很多消耗,反正我估计很多人跟我一样花费大量时间找解决方案,网上几乎没有现成的方案。自己也是一步步尝试,最终找到解决办法,ppt格式的就不说了网上找得到,pptx后缀的网上我是没找到。

问题前的pptx转成图片:

解决后的pptx转成图片:

解决方法:

图取每个shape,将文字转成统一的字体,网上找到的那段代码不可行,我自己改的方案如下:

             for( XSLFShape shape : slide[i].getShapes() ){
                    if ( shape instanceof XSLFTextShape ){
                        XSLFTextShape txtshape = (XSLFTextShape)shape ;
                        System.out.println("txtshape" + (i+1) + ":"  + txtshape.getShapeName());
                        System.out.println("text:" +txtshape.getText());
                        
                        for ( XSLFTextParagraph textPara : txtshape.getTextParagraphs() ){
                            List<XSLFTextRun> textRunList = textPara.getTextRuns();
                            for(XSLFTextRun textRun: textRunList) {
                                textRun.setFontFamily("宋体");
                            }
                        }
                    }
                }

完整代码如下(除了以上自己的解决方案,大部分是网上摘抄):

public static void convertPPTToPDF(String sourcepath, String destinationPath, String fileType) throws Exception {
        FileInputStream inputStream = new FileInputStream(sourcepath);
        double zoom = 2;
        AffineTransform at = new AffineTransform();
        at.setToScale(zoom, zoom);
        Document pdfDocument = new Document();
        PdfWriter pdfWriter = PdfWriter.getInstance(pdfDocument, new FileOutputStream(destinationPath));
        PdfPTable table = new PdfPTable(1);
        pdfWriter.open();
        pdfDocument.open();
        Dimension pgsize = null;
        Image slideImage = null;
        BufferedImage img = null;
        if (fileType.equalsIgnoreCase(".ppt")) {
            SlideShow ppt = new SlideShow(inputStream);
            inputStream.close();
            pgsize = ppt.getPageSize();
            Slide slide[] = ppt.getSlides();
            pdfDocument.setPageSize(new Rectangle((float) pgsize.getWidth(), (float) pgsize.getHeight()));
            pdfWriter.open();
            pdfDocument.open();
            for (int i = 0; i < slide.length; i++) {
                
                TextRun[] truns = slide[i].getTextRuns();      
                for ( int k=0;k<truns.length;k++){      
                   RichTextRun[] rtruns = truns[k].getRichTextRuns();      
                  for(int l=0;l<rtruns.length;l++){      
//                       int index = rtruns[l].getFontIndex();      
//                        String name = rtruns[l].getFontName();                
                        rtruns[l].setFontIndex(1);      
                        rtruns[l].setFontName("宋体");                          
                   }      
                }      
                
                
                img = new BufferedImage((int) Math.ceil(pgsize.width * zoom), (int) Math.ceil(pgsize.height * zoom), BufferedImage.TYPE_INT_RGB);
                Graphics2D graphics = img.createGraphics();
                graphics.setTransform(at);

                graphics.setPaint(Color.white);
                graphics.fill(new Rectangle2D.Float(0, 0, pgsize.width, pgsize.height));
                slide[i].draw(graphics);
                graphics.getPaint();
                slideImage = Image.getInstance(img, null);
                table.addCell(new PdfPCell(slideImage, true));
            }
        }
        if (fileType.equalsIgnoreCase(".pptx")) {
            XMLSlideShow ppt = new XMLSlideShow(inputStream);
            pgsize = ppt.getPageSize();
            XSLFSlide slide[] = ppt.getSlides();
            pdfDocument.setPageSize(new Rectangle((float) pgsize.getWidth(), (float) pgsize.getHeight()));
            pdfWriter.open();
            pdfDocument.open();
            
            
            for (int i = 0; i < slide.length; i++) {
                for( XSLFShape shape : slide[i].getShapes() ){
                    if ( shape instanceof XSLFTextShape ){
                        XSLFTextShape txtshape = (XSLFTextShape)shape ;
                       // System.out.println("txtshape" + (i+1) + ":"  + txtshape.getShapeName());
                        //System.out.println("text:" +txtshape.getText());
                        
                        for ( XSLFTextParagraph textPara : txtshape.getTextParagraphs() ){
                            List<XSLFTextRun> textRunList = textPara.getTextRuns();
                            for(XSLFTextRun textRun: textRunList) {
                                textRun.setFontFamily("宋体");
                            }
                        }
                    }
                }
                img = new BufferedImage((int) Math.ceil(pgsize.width * zoom), (int) Math.ceil(pgsize.height * zoom), BufferedImage.TYPE_INT_RGB);
                Graphics2D graphics = img.createGraphics();
                graphics.setTransform(at);
                graphics.setPaint(Color.white);
                graphics.fill(new Rectangle2D.Float(0, 0, pgsize.width, pgsize.height));
                slide[i].draw(graphics);
                
                
//                FileOutputStream out = new FileOutputStream("src/main/resources/test"+i+".jpg");  
//                javax.imageio.ImageIO.write(img, "jpg", out);
                
                
                
                graphics.getPaint();
                slideImage = Image.getInstance(img, null);
                table.addCell(new PdfPCell(slideImage, true));
            }
        }
        pdfDocument.add(table);
        pdfDocument.close();
        pdfWriter.close();
        System.out.println("Powerpoint file converted to PDF successfully");
    }

maven配置:

<dependency>
      <groupId>org.apache.poi</groupId>
        <artifactId>poi</artifactId>
    <!--  <version>3.13</version> -->
     <version>3.9</version>
    </dependency>
    <dependency>
        <groupId>org.apache.poi</groupId>
        <artifactId>poi-ooxml</artifactId>
       <!--  <version>3.10-FINAL</version> -->
       <version>3.9</version>
    </dependency>
    
    <dependency>
          <groupId>com.itextpdf</groupId>
          <artifactId>itextpdf</artifactId>
          <version>5.5.7</version>
    </dependency>

    <dependency>
      <groupId>com.itextpdf.tool</groupId>
      <artifactId>xmlworker</artifactId>
      <version>5.5.7</version>
    </dependency>
    <dependency>
      <groupId>org.apache.poi</groupId>
      <artifactId>poi-scratchpad</artifactId>
      <!--  <version>3.12</version> -->
       <version>3.9</version>
    </dependency>
时间: 2024-10-28 21:08:08

java PPT 转成PDF,中文乱码解决的相关文章

openerp 打印报表pdf中文乱码解决办法

环境 : ubuntu 12.04 OpenErp 7.0 设置好了语言为中文简体 ,此时打印 报表,中文显示为乱码. 首先 cd /usr/share/fonts/truetype/ 按照网上的方法 下载字体库: wget http://okay.googlecode.com/files/DejaVuSans-Oblique.ttf wget http://okay.googlecode.com/files/DejaVuSans-BoldOblique.ttf wget http://okay

java中文乱码解决之道(七)-----JSP页面编码过程

我们知道JSP页面是需要转换为servlet的,在转换过程中肯定是要进行编码的.在JSP转换为servlet过程中下面一段代码起到至关重要的作用. <%@ page language="java" contentType="text/html; charset=UTF-8" pageEncoding="GBK" %> 在上面代码中有两个地方存在编码:pageEncoding.contentType的charset.其中pageEnco

java中文乱码解决之道(二)-----字符编码详解:基础知识 + ASCII + GB**

在上篇博文(java中文乱码解决之道(一)-----认识字符集)中,LZ简单介绍了主流的字符编码,对各种编码都是点到为止,以下LZ将详细阐述字符集.字符编码等基础知识和ASCII.GB的详情. 一.基础知识 在了解各种字符集之前我们需要了解一些最基础的知识,如:编码.字符.字符集.字符编码基础知识. 编码 计算机中存储的信息都是用二进制表示的,我们在屏幕上所看到文字.图片等都是通过二进制转换的结果.编码是信息从一种形式或格式转换为另一种形式的过程,通俗点讲就是就是将我们看到的文字.图片等信息按照

java中文乱码解决方法汇总

publicstaticvoidmain(String[]argv){ try{ System.out.println("中文");//1 System.out.println("中文".getBytes());//2 System.out.println("中文".getBytes("GB2312″));//3 System.out.println("中文".getBytes("ISO8859_1″));

怎样快速把ppt转换成pdf格式

怎样快速把ppt转换成pdf格式 经常处理文件的你是不是还在为ppt文本如何转入pdf文档而发愁呢?或者对密密麻麻的pdf文件内容不能快速阅览而犯愁呢?下面,小编介绍2种将ppt演示文稿里的文字转换成pdf文档的方法,以供分享. 1.号称“精准”的迅捷ppt转换成pdf转换器 优点:简单方便的快速提取ppt文字.图片的方案,轻松解决批量ppt文档文字乱码问题: 即使你的电脑里面没有安装任何的PDF阅读器软件,或者PDF转换器,您也能够轻松的把朋友发来的PDF文档中的文字内容提取出来,并且有不少要

ppt转换成pdf工具

ppt转换成pdf工具前言:朋友在微博给我留言,让我帮忙把ppt文件转换成pdf,当时也是信口开河,认为直接下载几个转换软件就能马上搞定,但是,一测试却发现,转换之后的文本不是出现了乱码就是转换不出来!想了很久才找到一个可行的方法,使用迅捷ppt转换成pdf转换器,这是一款被誉为市面上最优秀的转换器软件,我们公司在实际运用后感到很实用.很好用. 免费ppt转pdf转换器哪个好?作为目前功能最为强大的ppt转pdf转换器,迅捷ppt转成pdf转换器提供了增强转换模式,具备pdf转Word.pdf转

怎样将ppt转换成pdf软件

怎样将ppt转换成pdf软件工作或学习中,常常要把PPT转换成PDF文档,或者把PDF转换成PPT或是为了方便浏览,或是为了能够进行二次编辑,当遇到这种情况时,不妨试试以下这款PPT转换成PDF转换器,或许能帮上你的忙. 迅捷PPT转PDF转换器简介:简单方便的快速提取PPT文字的方案,轻松解决PPT文档文字不能复制和乱码问题:即使你的电脑里面没有安装任何的PPT阅读器软件,或者PPT转换器,您也能够轻松的把朋友发来的PPT文档中的文字内容提取出来,并且有不少要写论文的朋友遇到有些文档无法复制里

怎么把ppt转成pdf

怎么把ppt转成pdf前言: 如果是遇到PPT或Word等Office文件无法转换PDF时,不少用户不知从何下手,其实原因在于,要真正实现两者之间的转换,又能保证转换之后的PDF文件内容的完整性,是评价一款PPT转换成PDF转换器的是否优秀的重要标准. 软件介绍: 对此迅捷PPT转PDF转换软件在针对PPT文件进行深入研究和分析的基础上,利用最新的文件格式转换技术,顺利地实现了PPT转换成PDF这一要求.那么,到底PPT转PDF转换器的效果怎么样呢? 作为专业的PDF转换工具,PPT转换PDF转

记一次Maven发布Jar包中文乱码解决方法

Maven deploy 乱码 今天使用Maven发布Jar包时,发布功能都是正常的也成功上传到了仓库,就是项目跑越来后出中文中现了乱码: { "code": "SUCCESS", "success": true, "message": "鎿嶄綔鎴愬姛", "data": [ { "key": "app_force_login", "va