1 Star 0 Fork 0

zhaom / PdfTool

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
贡献代码
同步代码
取消
提示: 由于 Git 不支持空文件夾,创建文件夹后会生成空的 .keep 文件
Loading...
README

本项目是个小工具,使用了第三方库Spire的免费版本

目的

最近我有一个需求,就是把一个很大的PDF转换为word,要求是尽量不失真。但是我找了很多的在线免费转换工具,或者是有页数要求,或者是有大小要求。高级功能需要收费。

于是我考虑自己去实现,第一想到的是python,这个实现起来很简单,但是转换后的word会失真,页面的排版等等不符合要求,于是考虑采用第三方免费工具,然后写代码自己转换。

目前的话我没有做成web形式的,后期会改进。

转换思路如下:

1、免费版本转换页数要求11页

2、输入一个pdf时候,小于11页直接转换,大于11页就先切分成子pdf

3、对每一个小的pdf进行转换,最后再合并。

总体上就是一个大的pdf拆分转换再合并的问题。

其他的思路:

不使用第三方库,直接OCR技术扫描。这个技术我正在考虑当中,有兴趣的可以添加我的微信交流:

fdd15735171890

本工具特点:

1、图片不会转换

2、文字正常转换

3、数学公式正常转换

4、排版不会失真

(完全的不失真也做不到,会有微小的差别,但是和pdf基本上一样)

使用流程

1、git clone git@github.com:fengdongdongwsn/PdfTool.git

2、如果你是Eclipse或者是MyEclipse,直接导入运行即可,入口类在Main.java

3、如果你是Idea或其他的Maven环境下,在pom.xml环境中添加如下依赖:

    <repositories>
        <repository>
            <id>com.e-iceblue</id>
            <url>http://repo.e-iceblue.cn/repository/maven-public/</url>
        </repository>
    </repositories>

    <dependencies>
        <dependency>
            <groupId>e-iceblue</groupId>
            <artifactId>spire.pdf.free</artifactId>
            <version>2.6.3</version>
        </dependency>

        <dependency>
            <groupId>e-iceblue</groupId>
            <artifactId>spire.doc.free</artifactId>
            <version>2.7.3</version>
        </dependency>

    </dependencies>

然后直接运行Main类

个人说明

喜欢的给个支持吧各位老铁们:

image

空文件

简介

暂无描述 展开 收起
取消

发行版

暂无发行版

贡献者

全部

近期动态

加载更多
不能加载更多了
1
https://gitee.com/fader-zm/PdfTool.git
git@gitee.com:fader-zm/PdfTool.git
fader-zm
PdfTool
PdfTool
master

搜索帮助