做学术、看报告的朋友都懂,最烦的就是PDF里的内容没法直接用:
• 公式复制出来全是乱码
• 表格粘到Word里格式全崩
• 图片里的文字还要手打一遍
MinerU就是专门解决这个问题的,由上海人工智能实验室开发,完全免费开源。
我找了一篇带数学公式、三线表、数据图的学术论文PDF上传,解析出来的Markdown文件让我震惊:
• 所有LaTeX公式完美还原,可直接复制
• 表格结构完整保留,粘到Excel直接用
• 图片里的文字也被OCR识别出来了
• 连脚注、参考文献格式都给你整理好了
而且它支持84种语言,中英日文都没问题,还能批量处理。最关键的是——可以完全离线部署,数据100%在本地,不怕敏感文档泄露。
适合谁:学生党、科研人员、经常需要处理PDF文档的朋友
怎么用:搜索"MinerU官网",在线版直接上传文件,或者下载客户端本地运行
做短视频、播客、有声书的朋友,配音一直是个成本问题——专业配音员贵,付费TTS工具动不动就几十块一个月。
NowVoice直接把这个门槛干到了0。


打开网页,不用注册,不用登录,直接粘贴文字就能生成音频。我试了几个中文音色,那个"知性女声"的语气停顿、呼吸感都做得非常自然,完全听不出来是AI。
它有几个特别良心的点:
1.完全免费:没有隐藏费用,没有订阅制,没有高级版
2.免登录:打开就能用,不用填手机号邮箱
3.支持商用:生成的音频可以直接用在YouTube、抖音、广告里,没有版权问题
4.高清音质:48kHz输出,满足专业制作需求
5.长文本支持:登录后一次可以转10000字
唯一的小遗憾是没有角色对话功能,但做旁白、解说、课程配音完全够用了。如果需要更复杂的效果,可以搭配TTSMaker(也是免费的,每周3万字额度)。
适合谁:短视频创作者、播客主、自媒体人、需要做有声内容的教育工作者
怎么用:访问 nowvoice.ai,粘贴文字,选音色,一键下载MP3
夜雨聆风