java如何实现截取PDF指定页并进行图片格式转换功能

发布时间:2021-04-15 10:39:48 作者:小新
来源:亿速云 阅读:176

这篇文章给大家分享的是有关java如何实现截取PDF指定页并进行图片格式转换功能的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。

1、引入依赖

<dependency>
  <groupId>org.apache.pdfbox</groupId>
  <artifactId>pdfbox</artifactId>
  <version>2.0.16</version>
</dependency>
<dependency>
  <groupId>org.apache.pdfbox</groupId>
  <artifactId>fontbox</artifactId>
  <version>2.0.16</version>
</dependency>

jar包下载地址:

https://mvnrepository.com/artifact/org.apache.pdfbox/pdfbox
https://mvnrepository.com/artifact/org.apache.pdfbox/fontbox

2、实现DEMO

package com.dddpeter.app;
import org.apache.pdfbox.multipdf.Splitter;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.rendering.PDFRenderer;
import javax.imageio.ImageIO;
import javax.imageio.stream.ImageOutputStream;
import java.awt.image.BufferedImage;
import java.io.*;
import java.util.List;
import java.util.ListIterator;
public class PDFUtils {
  public static String splitPdf(int pageNum, String source, String dest) {
    File indexFile = new File(source);
    File outFile = new File(dest);
    PDDocument document = null;
    try {
      document = PDDocument.load(indexFile);
      // document.getNumberOfPages();
      Splitter splitter = new Splitter();
      splitter.setStartPage(pageNum);
      splitter.setEndPage(pageNum);
      List<PDDocument> pages = splitter.split(document);
      ListIterator<PDDocument> iterator = pages.listIterator();
      while (iterator.hasNext()) {
        PDDocument pd = iterator.next();
        if (outFile.exists()) {
          outFile.delete();
        }
        pd.save(outFile);
        pd.close();
        if (outFile.exists()) {
          return outFile.getPath();
        }
      }
      document.close();
    } catch (IOException e) {
      e.printStackTrace();
    } catch (Exception e) {
      e.printStackTrace();
    }
    return null;
  }
  public static void pdfFileToImage(File pdffile,String targetPath){
    try {
      FileInputStream instream = new FileInputStream(pdffile);
      InputStream byteInputStream=null;
      try {
        PDDocument doc = PDDocument.load(instream);
        PDFRenderer renderer = new PDFRenderer(doc);
        int pageCount = doc.getNumberOfPages();
        if (pageCount > 0) {
          BufferedImage image = renderer.renderImage(0, 4.0f);
          image.flush();
          ByteArrayOutputStream bs = new ByteArrayOutputStream();
          ImageOutputStream imOut;
          imOut = ImageIO.createImageOutputStream(bs);
          ImageIO.write(image, "png", imOut);
          byteInputStream = new ByteArrayInputStream(bs.toByteArray());
          byteInputStream.close();
        }
        doc.close();
      }
      catch (IOException e) {
        e.printStackTrace();
      }
      File uploadFile = new File(targetPath);
      FileOutputStream fops;
      fops = new FileOutputStream(uploadFile);
      fops.write(readInputStream(byteInputStream));
      fops.flush();
      fops.close();
    }
    catch (Exception e) {
      e.printStackTrace();
    }
  }
  public static byte[] readInputStream(InputStream inStream) throws Exception {
    ByteArrayOutputStream outStream = new ByteArrayOutputStream();
    byte[] buffer = new byte[1024];
    int len = 0;
    while ((len = inStream.read(buffer)) != -1) {
      outStream.write(buffer, 0, len);
    }
    inStream.close();
    return outStream.toByteArray();
  }
  public static void main(String[] args) {
    String path = splitPdf(4,"D:\\data\\11.pdf","D:\\data\\out11.pdf");
    File file =new File(path);
    //上传的是png格式的图片结尾
    String targetfile="D:\\data\\out11.png";
    pdfFileToImage(file,targetfile);
  }
}

感谢各位的阅读!关于“java如何实现截取PDF指定页并进行图片格式转换功能”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!

推荐阅读:
  1. C# / VB.NET合并PDF指定页
  2. Python+selenium实现截图图片并保存截取的图片

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

java pdf

上一篇:java如何实现查找PDF关键字所在页码及其坐标

下一篇:JAVA如何实现第三方短信发送过程

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》