客户发来一个PDF,里面有表格。你想复制到Excel,结果——粘贴出来,全挤在一行。手动调格式,半小时没了。
我让AI写了30行代码,一键解决。
效果预览
一键复制的提示词
text
写Python脚本:提取PDF中的表格到Excel。支持输入单个PDF或文件夹,输出Excel自动保存在PDF所在目录。用pdfplumber库。核心代码(精简版)import osimport pandas as pdimport pdfplumberpath = input("请输入PDF文件或文件夹路径: ")# 获取所有PDFif os.path.isfile(path) and path.endswith('.pdf'):pdf_files = [path]out_dir = os.path.dirname(path)else:pdf_files = [os.path.join(path, f) for f in os.listdir(path) if f.endswith('.pdf')]out_dir = pathwith pd.ExcelWriter(os.path.join(out_dir, "表格提取结果.xlsx")) as writer:for pdf in pdf_files:name = os.path.basename(pdf)[:31]all_tables = []with pdfplumber.open(pdf) as f:for page in f.pages:for table in page.extract_tables():if table:df = pd.DataFrame(table[1:], columns=table[0])all_tables.append(df)if all_tables:pd.concat(all_tables).to_excel(writer, sheet_name=name, index=False)print(f"完成: {name}")print("搞定")
怎么用
终端运行
pip install pdfplumber pandas openpyxl复制代码到文件,保存为
.py运行,输入PDF文件路径或文件夹路径
打开同目录下的
表格提取结果.xlsx
避坑提醒
扫描件PDF:代码无法提取,需要先用OCR工具识别文字
复杂表格:可能识别不准,建议先用简单表格测试
夜雨聆风