我的Opencode支持读取文本版pdf和扫描版pdf了,顺带图片识别也支持了。
我是在Ubuntu24 linux系统上运行的opencode,打开终端用下面的指令安装了tesseract,就可以指挥opencode解析扫描pdf了,它会先按照每一页截图,再通过OCR识别提取英文和汉字文本生成txt文件,保存到指定目录下。
Linux终端命令:
(Windows指令可以问deepseek,豆包等)
1️⃣英文ocr识别
sudo apt install tesseract-ocr tesseract-ocr-eng
2️⃣汉字ocr识别
sudo apt install tesseract-ocr tesseract-ocr-chi-sim
用opencode试着生成storyfun全6册的教案,基本符合我的需求。跟千问生成的教案对比了下,opencode完胜。网页版千问虽然可以上传整个pdf文件,但是解析扫描版pdf还是不太行。

我还叫opencode自己记住操作保存到全局规则中,这样下次启动opencode会自动匹配调用合适的工具了。

用opencode生成教案真的挺方便,格式还美观,很适合我这种辅导不知道从哪里下手的。教案还可以打印出来,对着看一遍就有抓手了。因为教案很漂亮,娃也会很喜欢(我给娃看过网页版的马卡龙配色的html教案,娃直呼好漂亮,妈妈怎么做的),美好的东西让人心情更好,更快乐了学习效率也就更高了。
到目前为止,AI工具基本整完了,接下来等我的就是实操了。
夜雨聆风