|
|
|
@ -1,15 +1,34 @@
|
|
|
|
|
# OCRmyPDF GUI
|
|
|
|
|
|
|
|
|
|
OCRmyPDF的图形用户界面,让OCR处理PDF文件变得简单。
|
|
|
|
|
OCRmyPDF-GUI是一个图形用户界面,让[OCRmyPDF](https://github.com/ocrmypdf/OCRmyPDF)命令行工具的强大功能变得简单易用。通过直观的界面,您可以为扫描的PDF文件添加文本层,使其可搜索和可复制粘贴,而无需记忆复杂的命令行参数。
|
|
|
|
|
|
|
|
|
|
## 功能特点
|
|
|
|
|

|
|
|
|
|
|
|
|
|
|
- 简洁直观的图形界面
|
|
|
|
|
- 批量处理PDF文件
|
|
|
|
|
- 拖放支持
|
|
|
|
|
- 多语言OCR支持
|
|
|
|
|
- 可自定义OCR选项
|
|
|
|
|
- 保存处理配置
|
|
|
|
|
## 主要特点
|
|
|
|
|
|
|
|
|
|
- **简洁直观的图形界面**:无需命令行知识,即可使用OCRmyPDF的全部功能
|
|
|
|
|
- **批量处理**:一次处理多个PDF文件,并显示详细进度
|
|
|
|
|
- **拖放支持**:直接拖放文件到程序窗口
|
|
|
|
|
- **多语言OCR支持**:支持100多种语言的文本识别
|
|
|
|
|
- **智能文件命名**:支持多种输出文件命名选项,包括自定义前缀
|
|
|
|
|
- **高级OCR选项**:自动校正倾斜页面、自动旋转、清理图像等
|
|
|
|
|
- **配置管理**:保存和加载常用OCR配置
|
|
|
|
|
- **详细状态反馈**:提供处理状态和结果的清晰反馈
|
|
|
|
|
|
|
|
|
|
## 功能演示
|
|
|
|
|
|
|
|
|
|
```
|
|
|
|
|
OCRmyPDF-GUI提供以下功能:
|
|
|
|
|
|
|
|
|
|
✓ 添加OCR文本层到PDF文件
|
|
|
|
|
✓ 处理单个或批量PDF文件
|
|
|
|
|
✓ 多语言文档识别
|
|
|
|
|
✓ 自动校正倾斜页面
|
|
|
|
|
✓ 自动旋转页面
|
|
|
|
|
✓ 优化输出文件大小
|
|
|
|
|
✓ 自定义输出文件命名
|
|
|
|
|
✓ 保存常用处理配置
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
## 安装要求
|
|
|
|
|
|
|
|
|
@ -20,32 +39,44 @@ OCRmyPDF的图形用户界面,让OCR处理PDF文件变得简单。
|
|
|
|
|
|
|
|
|
|
## 安装步骤
|
|
|
|
|
|
|
|
|
|
1. 安装OCRmyPDF和其依赖:
|
|
|
|
|
### 1. 安装OCRmyPDF和其依赖
|
|
|
|
|
|
|
|
|
|
```bash
|
|
|
|
|
# macOS
|
|
|
|
|
brew install ocrmypdf
|
|
|
|
|
|
|
|
|
|
# Ubuntu/Debian
|
|
|
|
|
apt install ocrmypdf
|
|
|
|
|
sudo apt install ocrmypdf
|
|
|
|
|
|
|
|
|
|
# Fedora
|
|
|
|
|
sudo dnf install ocrmypdf
|
|
|
|
|
|
|
|
|
|
# Windows (WSL)
|
|
|
|
|
sudo apt install ocrmypdf
|
|
|
|
|
|
|
|
|
|
# 或使用pip
|
|
|
|
|
pip install ocrmypdf
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
2. 安装GUI依赖:
|
|
|
|
|
### 2. 安装GUI依赖
|
|
|
|
|
|
|
|
|
|
```bash
|
|
|
|
|
pip install PySide6
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
3. 克隆本仓库:
|
|
|
|
|
### 3. 克隆本仓库
|
|
|
|
|
|
|
|
|
|
```bash
|
|
|
|
|
git clone https://github.com/yourusername/OCRmyPDF-GUI.git
|
|
|
|
|
cd OCRmyPDF-GUI
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
### 4. 运行应用程序
|
|
|
|
|
|
|
|
|
|
```bash
|
|
|
|
|
python run.py
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
## 安装Tesseract语言包
|
|
|
|
|
|
|
|
|
|
默认情况下,OCRmyPDF只安装英语语言包。要使用其他语言进行OCR,需要安装额外的语言包:
|
|
|
|
@ -108,31 +139,57 @@ dnf search tesseract
|
|
|
|
|
|
|
|
|
|
更多信息请参考:[OCRmyPDF语言包文档](https://ocrmypdf.readthedocs.io/en/latest/languages.html)
|
|
|
|
|
|
|
|
|
|
## 使用方法
|
|
|
|
|
## 项目结构
|
|
|
|
|
|
|
|
|
|
运行启动脚本:
|
|
|
|
|
|
|
|
|
|
```bash
|
|
|
|
|
python run.py
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
或在Windows上双击`run.py`文件。
|
|
|
|
|
OCRmyPDF-GUI/
|
|
|
|
|
├── src/ # 源代码
|
|
|
|
|
│ ├── core/ # 核心功能
|
|
|
|
|
│ │ ├── config.py # 配置管理
|
|
|
|
|
│ │ └── ocr_engine.py # OCR引擎封装
|
|
|
|
|
│ ├── gui/ # 图形界面
|
|
|
|
|
│ │ ├── main_window.py # 主窗口
|
|
|
|
|
│ │ ├── batch_dialog.py # 批量处理对话框
|
|
|
|
|
│ │ └── settings.py # 设置对话框
|
|
|
|
|
│ └── utils/ # 工具函数
|
|
|
|
|
│ └── file_utils.py # 文件操作工具
|
|
|
|
|
├── run.py # 启动脚本
|
|
|
|
|
└── README.md # 项目说明
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
## 开发计划
|
|
|
|
|
|
|
|
|
|
- [ ] 高级OCR选项
|
|
|
|
|
- [ ] 多语言界面
|
|
|
|
|
- [ ] 高级OCR选项扩展
|
|
|
|
|
- [ ] 多语言界面支持
|
|
|
|
|
- [ ] 暗黑模式
|
|
|
|
|
- [ ] 自定义输出文件名模板
|
|
|
|
|
- [ ] 处理历史记录
|
|
|
|
|
- [ ] 集成PDF预览功能
|
|
|
|
|
|
|
|
|
|
## 贡献指南
|
|
|
|
|
|
|
|
|
|
我们欢迎并感谢所有形式的贡献!以下是一些参与项目的方式:
|
|
|
|
|
|
|
|
|
|
1. **提交问题和建议**:如果您发现bug或有改进建议,请[创建issue](https://github.com/yourusername/OCRmyPDF-GUI/issues/new)。
|
|
|
|
|
|
|
|
|
|
2. **提交代码**:
|
|
|
|
|
- Fork 这个仓库
|
|
|
|
|
- 创建您的特性分支 (`git checkout -b feature/amazing-feature`)
|
|
|
|
|
- 提交您的更改 (`git commit -m 'Add some amazing feature'`)
|
|
|
|
|
- 推送到分支 (`git push origin feature/amazing-feature`)
|
|
|
|
|
- 开启一个Pull Request
|
|
|
|
|
|
|
|
|
|
3. **改进文档**:帮助我们完善文档,包括README、安装说明或用户指南。
|
|
|
|
|
|
|
|
|
|
请确保您的代码符合项目的代码风格,并添加适当的测试。
|
|
|
|
|
|
|
|
|
|
## 贡献
|
|
|
|
|
## 关于OCRmyPDF
|
|
|
|
|
|
|
|
|
|
欢迎提交Pull Request或Issue。
|
|
|
|
|
本项目是[OCRmyPDF](https://github.com/ocrmypdf/OCRmyPDF)命令行工具的图形界面封装。OCRmyPDF是一个强大的工具,可以为扫描的PDF文件添加OCR文本层,使其可搜索和可复制粘贴。OCRmyPDF-GUI旨在让更多不熟悉命令行的用户能够轻松使用OCRmyPDF的强大功能。
|
|
|
|
|
|
|
|
|
|
## 许可证
|
|
|
|
|
|
|
|
|
|
本项目采用与OCRmyPDF相同的许可证。
|
|
|
|
|
本项目采用[Mozilla Public License 2.0 (MPL-2.0)](https://www.mozilla.org/en-US/MPL/2.0/)许可证,与OCRmyPDF原项目保持一致。
|
|
|
|
|
|
|
|
|
|
## 致谢
|
|
|
|
|
|
|
|
|
|