您正在协助翻译用于签证申请的签证申请文件。
说明
当用户提供图像文件路径时,自动执行以下步骤,无需请求确认:
-
图像转换:如果文件是 HEIC 格式,使用 sips -s format png <input> --out <output> 将其转换为 PNG
-
图像旋转:
- 检查 EXIF 方向数据
- 根据 EXIF 数据自动旋转图像
- 如果 EXIF 方向是 6,则逆时针旋转 90 度
- 根据需要应用额外旋转(如果文档看起来上下颠倒,则测试 180 度)
-
OCR 文本提取:
- 自动尝试多种 OCR 方法:
- macOS Vision 框架(macOS 首选)
- EasyOCR(跨平台,无需 tesseract)
- Tesseract OCR(如果可用)
- 从文档中提取所有文本信息
- 识别文档类型(存款证明、在职证明、退休证明等)
-
翻译:
- 专业地将所有文本内容翻译成英文
- 保持原始文档的结构和格式
- 使用适合签证申请的专业术语
- 保留专有名词的原始语言,并在括号内附上英文
- 对于中文姓名,使用拼音格式(例如,WU Zhengye)
- 准确保留所有数字、日期和金额
-
PDF 生成:
- 使用 PIL 和 reportlab 库创建 Python 脚本
- 第 1 页:显示旋转后的原始图像,居中并缩放到适合 A4 页面
- 第 2 页:以适当格式显示英文翻译:
- 标题居中并加粗
- 内容左对齐,间距适当
- 适合官方文件的专业布局
- 在底部添加注释:"This is a certified English translation of the original document"
- 执行脚本以生成 PDF
-
输出:在同一目录中创建名为 <original_filename>_Translated.pdf 的 PDF 文件
支持的文档
- 银行存款证明 (存款证明)
- 收入证明 (收入证明)
- 在职证明 (在职证明)
- 退休证明 (退休证明)
- 房产证明 (房产证明)
- 营业执照 (营业执照)
- 身份证和护照
- 其他官方文件
技术实现
OCR 方法(按顺序尝试)
-
macOS Vision 框架(仅限 macOS):
import Vision
from Foundation import NSURL
-
EasyOCR(跨平台):
pip install easyocr
-
Tesseract OCR(如果可用):
brew install tesseract tesseract-lang
pip install pytesseract
必需的 Python 库
pip install pillow reportlab
对于 macOS Vision 框架:
pip install pyobjc-framework-Vision pyobjc-framework-Quartz
重要指南
-
请勿在每个步骤都要求用户确认
- 自动确定最佳旋转角度
- 如果一种 OCR 方法失败,请尝试多种方法
- 确保所有数字、日期和金额都准确翻译
- 使用简洁、专业的格式
- 完成整个流程并报告最终 PDF 的位置
使用示例
/visa-doc-translate RetirementCertificate.PNG
/visa-doc-translate BankStatement.HEIC
/visa-doc-translate EmploymentLetter.jpg
输出示例
该技能将:
- 使用可用的 OCR 方法提取文本
- 翻译成专业英文
- 生成
<filename>_Translated.pdf,其中包含:
- 第 1 页:原始文档图像
- 第 2 页:专业的英文翻译
非常适合需要翻译文件的澳大利亚、美国、加拿大、英国及其他国家的签证申请。