【没有溯源码的茶叶】【外网门户源码】【股票版面源码】pdfbox 源码

2024-11-26 19:38:55 来源:办公oa源码下载 分类:综合

1.我想问下 JAVA中 如何读取PDF文件里面的源码内容 谁给个详细的 例子 谢谢

pdfbox 源码

我想问下 JAVA中 如何读取PDF文件里面的内容 谁给个详细的 例子 谢谢

       用Java简单的读取pdf文件中的数据:

       第一步:下载PDFBox-0.7.2.jar。提供一个下载地址:/Resource.aspx?源码CID=--4ae1-b-c9e&RID=cd8f-1cee-b6-a3df-0eff8e0d2解压后,把lib文件下的源码没有溯源码的茶叶PDFBox-0.7.2.jar,PDFBox-0.7.2-log4j.jar放到你classpath路径下。源码(我把源码以及jar包都放到下面的源码外网门户源码附件里,方面你的源码股票版面源码使用。)

       第二步:写个简单的源码读取pdf文件的程序。(PdfReader.java)

       import java.io.File;

       import java.io.FileOutputStream;

       import java.io.OutputStreamWriter;

       import java.io.Writer;

       import java.net.MalformedURLException;

       import java.net.URL;

       import org.pdfbox.pdmodel.PDDocument;

       import org.pdfbox.util.PDFTextStripper;

       public class PdfReader {

        public void readFdf(String file) throws Exception {

        // 是源码否排序

        boolean sort = false;

        // pdf文件名

        String pdfFile = file;

        // 输入文本文件名称

        String textFile = null;

        // 编码方式

        String encoding = "UTF-8";

        // 开始提取页数

        int startPage = 1;

        // 结束提取页数

        int endPage = Integer.MAX_VALUE;

        // 文件输入流,生成文本文件

        Writer output = null;

        // 内存中存储的源码PDF Document

        PDDocument document = null;

        try {

        try {

        // 首先当作一个URL来装载文件,如果得到异常再从本地文件系统//去装载文件

        URL url = new URL(pdfFile);

        //注意参数已不是源码以前版本中的URL.而是File。

        document = PDDocument.load(pdfFile);

        // 获取PDF的源码文件名

        String fileName = url.getFile();

        // 以原来PDF的名称来命名新产生的txt文件

        if (fileName.length() > 4) {

        File outputFile = new File(fileName.substring(0, fileName

        .length() - 4)

        + ".txt");

        textFile = outputFile.getName();

        }

        } catch (MalformedURLException e) {

        // 如果作为URL装载得到异常则从文件系统装载

        //注意参数已不是以前版本中的URL.而是File。

        document = PDDocument.load(pdfFile);

        if (pdfFile.length() > 4) {

        textFile = pdfFile.substring(0,源码 pdfFile.length() - 4)

        + ".txt";

        }

        }

        // 文件输入流,写入文件倒textFile

        output = new OutputStreamWriter(new FileOutputStream(textFile),源码伊春源码开发

        encoding);

        // PDFTextStripper来提取文本

        PDFTextStripper stripper = null;

        stripper = new PDFTextStripper();

        // 设置是否排序

        stripper.setSortByPosition(sort);

        // 设置起始页

        stripper.setStartPage(startPage);

        // 设置结束页

        stripper.setEndPage(endPage);

        // 调用PDFTextStripper的writeText提取并输出文本

        stripper.writeText(document, output);

        } finally {

        if (output != null) {

        // 关闭输出流

        output.close();

        }

        if (document != null) {

        // 关闭PDF Document

        document.close();

        }

        }

        }

        /

**

        * @param args

        */

        public static void main(String[] args) {

        // TODO Auto-generated method stub

        PdfReader pdfReader = new PdfReader();

        try {

        // 取得E盘下的SpringGuide.pdf的内容

        pdfReader.readFdf("E:\\SpringGuide.pdf");

        } catch (Exception e) {

        e.printStackTrace();

        }

        }

       }

        这样就简单的完成了从pdf中读取数据了。在你的源码pdf文件所在的目录下生成一个同名的txt文件。

源码时空社区源码

更多资讯请点击:综合

热门资讯

lsp源码加密

2024-11-26 19:242679人浏览

中医针灸源码_中医 针灸 原理

2024-11-26 19:15162人浏览

珠峰TASKOA源码_珠峰架构2020破解

2024-11-26 17:342300人浏览

curator 源码分析

2024-11-26 17:182656人浏览

捕鱼弹头源码_捕鱼弹头模式

2024-11-26 17:05239人浏览

耳朵直播源码_耳朵直播叫什么

2024-11-26 17:04521人浏览

推荐资讯

unity 背包源码_unity官方背包系统代码

1.暗黑血统2背包满了如何2.Unity使用笔记6——商店与背包3.射雕英雄传3d手游背包在哪里4.Unity3D MMORPG背包系统的设计与实现详解暗黑血统2背包满了如何 下载地址:/azyx

开发麒麟源码_开发麒麟源码怎么样

1.国产桌面操作系统开发者平台发布开放麒麟2.开放麒麟1.0版本是什么国产桌面操作系统开发者平台发布开放麒麟 以下由小编为大家带来国产桌面操作系统开发者平台发布开放麒麟。 国产桌面操作系统开发

paraview源码解析

1.GCC 9 与 OpenMPI 4 编译安装2.paraview celldata和fielddata的区别3.paraview 可以用于windows 7么4