四款开源工具,四个实用方向。今天推荐的每个都能直接装进你的工作流。
01
小米最近悄悄在 GitHub 上开源了一个AI编程工具——MiMo-Code,发布才四天就飙到了近 8000 星。
MiMo-Code 用 TypeScript 构建,定位是 AI 代码生成助手。虽然描述很简洁没有太多包装,但从它爆炸式的增长速度来看,社区已经给出了最直接的反馈。这个领域 Open AI 的 Codex CLI 和 Claude Code 已经有了很强的先发优势,小米这一出手,说明字节、阿里、小米这些大厂都在 AI 编程侧加速布局了。
对开发者来说,多一个选择总归是好事。而且小米的开源风格一贯务实,没有花哨的宣传文案,代码直接放出来让大家用。

🔗 https://github.com/XiaomiMiMo/MiMo-Code[1]
02
Ideogram 4 昨天正式开源了。Ideogram 在图像生成圈子里一直以「对文字渲染最好」著称——很多模型生成的图里文字是乱码,Ideogram 能清晰写出你想要的单词。
这次开源的 Ideogram 4 用的是 Apache-2.0 许可证,Python 实现,对商用非常友好。模型本身在设计领域处于前沿水平,无论是产品图、海报、还是带文字的视觉稿,质量都相当能打。有条件的可以直接在本地部署推理,社区应该很快会有 WebUI 和 ComfyUI 的整合方案。
如果你在做 AI 图像相关的项目,这个值得立刻关注。

🔗 https://github.com/ideogram-oss/ideogram4[2]
03
接着聊一个对打工人特别实用的项目——GordenPPTSkill。
这个项目的作者准备了 17 套精调过的中文 PPTX 模板,然后写了一套 Python 工具,让 AI Agent 可以直接读取模板、填写内容、生成最终的 PPT 文件。整个过程对原模板的版式结构做了保护——只替换文字内容,不破坏设计布局。
用法很简单:选一个模板,写一个 edits.json 描述你要改的内容,运行脚本就能生成一份布局完整的 PPTX。如果你习惯用 Claude Code 或 Codex,还可以把整个流程封装成一条指令,说一句「帮我生成一份关于 XX 的 10 页 PPT」就搞定。
日常做汇报、做方案、做课程材料的话,这个技能能省下大量排版时间。

🔗 https://github.com/GordenSun/GordenPPTSkill[3]
04
最后一个项目很小,但思路很巧妙——gemini-web2api。
它做的事情一句话就能说清:把 Google Gemini 网页版转换成 OpenAI 兼容的 API 接口。零认证、单文件、跨平台。你本地跑起来之后,任何支持 OpenAI API 的工具(比如 ChatGPT Next Web、Open WebUI、各种 IDE 插件)都能直接连上去用 Gemini 的模型。
Gemini 网页版目前是免费的,这个项目相当于给你的本地工具链接上了一台免费的大模型引擎。对于需要同时对比多个模型输出的场景特别有用——不用在多个网页之间切来切去了。
作者代码写得清爽,核心逻辑就是反向代理加协议转换,单文件搞定,值得参考。

🔗 https://github.com/Sophomoresty/gemini-web2api[4]
这期四个项目,从大厂的 AI 编码工具到开源的图像模型,从自动做 PPT 到免费用 Gemini,每个都能让你的工作流更顺一点。
我是大圣,咱们下期见 🐵✌️ 如果觉得有用,欢迎转发分享吧。
引用链接
[1]https://github.com/XiaomiMiMo/MiMo-Code
[2]https://github.com/ideogram-oss/ideogram4
[3]https://github.com/GordenSun/GordenPPTSkill
[4]https://github.com/Sophomoresty/gemini-web2api
夜雨聆风