乐于分享
好东西不私藏

图片转Word,一键提取文字(小白也能用)

图片转Word,一键提取文字(小白也能用)

还在手动打字吗?

  • 截图里的文字复制不了
  • 扫描件要一字一字敲
  • 发票 / 表格整理太费时间

👉 其实可以一键提取成Word


🚀 效果展示

👉 图片 ↓

👉 自动转成Word(文字可编辑)

✔ 自动识别文字
✔ 支持中英文
✔ 可直接修改内容


⚡ 使用方法(小白版)

👉 第一次稍微准备一下,后面一直能用

① 安装一次Python(下面有教程)
② 复制代码保存为 script.py
③ 把图片拖进去 → 自动生成Word

🧠 代码(不用看懂,复制就能用)

import pytesseractfrom PIL import Imagefrom docx import Documentimport sysimport os# 👉 如果你是Windows用户,需要改成你自己的路径(很重要)# 例如:C:\\Program Files\\Tesseract-OCR\\tesseract.exepytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"OUTPUT_DIR = "输出结果"def ensure_dir(path):    if not os.path.exists(path):        os.makedirs(path)def image_to_word(img_path):    image = Image.open(img_path)    # 👉 识别文字    text = pytesseract.image_to_string(image, lang="chi_sim+eng")    doc = Document()    doc.add_paragraph(text)    # 👉 输出Word文件    file_name = os.path.splitext(os.path.basename(img_path))[0] + ".docx"    output_path = os.path.join(OUTPUT_DIR, file_name)    doc.save(output_path)    print(f"已生成:{output_path}")def main():    files = sys.argv[1:]    if not files:        print("请拖入图片运行")        return    ensure_dir(OUTPUT_DIR)    for file in files:        if file.lower().endswith((".png"".jpg"".jpeg")):            image_to_word(file)if __name__ == "__main__":    main()

📦 第0步:安装Python(只需一次)

1. 打开:https://www.python.org/downloads/
2. 点击 Download Python
3. 安装时勾选【Add Python to PATH】
4. 点击 Install Now

📦 第1步:安装依赖(只需一次)

pip install pytesseract pillow python-docx

📦 第2步:安装OCR引擎(关键)

👉 这个步骤只需一次(很重要)

1️⃣ 下载 Tesseract OCR
👉 https://github.com/tesseract-ocr/tesseract

2️⃣ 安装完成后记住路径,例如:

C:\Program Files\Tesseract-OCR\tesseract.exe

3️⃣ 修改代码这一行👇

pytesseract.pytesseract.tesseract_cmd = r"你的路径"

📊 输出结果

输出结果/
└── 图片名称.docx

👉 所有图片都会自动生成Word文件


❗ 小提示

  • 图片越清晰,识别越准确
  • 扫描件 / 表格也可以识别
  • 字体复杂时可能有少量误差

🎯 一句话总结

👉 把图片拖进去,文字自动变Word