乐于分享
好东西不私藏

开源桌面AI设计工具;学术论文绘图技能合集;AI代理端到端网页游戏创作框架

开源桌面AI设计工具;学术论文绘图技能合集;AI代理端到端网页游戏创作框架

关注我,记得标星⭐️不迷路哦~

✨ 1: Open CoDesign

开源桌面AI设计工具

Open CoDesign是一个开源桌面AI设计工具,其核心功能是将用户的自然语言提示词高效转化为可在本地生成和编辑的精美原型、幻灯片或营销素材,彻底打破传统AI设计工具的订阅限制与云端依赖。该项目以“你的提示、你的模型、你的电脑”为理念,支持BYOK(Bring Your Own Key)模式,兼容Anthropic、OpenAI、Gemini、Ollama等20多种主流及本地AI模型,确保用户数据隐私完全本地化处理。其关键特性包括提供可视化的Web界面进行任务管理与结果筛选、支持多任务并行监控、结合GPT-4o等模型进行深度智能分析,并能实现符合条件的商品即时通知推送,以及高度可定制化的任务筛选条件。此外,它还提供了元素级评论修改、AI智能参数调节、版本历史追溯和实时显示AI代理工作进度的能力,并内置了多种设计技能模块和审美指导,以确保输出高质量、符合设计规范的成果,最终支持HTML、PDF、PPTX、ZIP、Markdown等多种格式的本地文件导出。

地址:https://github.com/OpenCoworkAI/open-codesign

✨ 2: Paper Plot Skills

学术论文绘图技能合集

Paper Plot Skills 是一个专为学术论文设计的人工智能绘图技能工具箱,它旨在帮助用户复现和生成高质量的学术图表。该项目精选了来自真实论文的九种具有高度参考价值的绘图风格(包括柱状图、折线图、散点图和雷达图等,每种风格都包含特定的字体、填充、线条、注释和坐标轴处理等细节),旨在大幅减少绘图时的重复工作。用户可以通过两种核心方式使用它:一是选择预设风格后直接填入数据生成符合DPI要求的图表(plot-from-data),二是上传论文截图,工具能自动分析比例、字体、配色并复现为matplotlib脚本(plot-from-image)。这些技能会随着使用和复现过程不断优化。

地址:https://github.com/Trae1ounG/paper-plot-skills

✨ 3: pi-computer-use

Pi macOS 自动化工具

pi-computer-use项目专为macOS平台设计,旨在为Pi代理集成“Codex风格”的计算机操作工具,从而实现与macOS用户界面的程序化交互。其核心功能包括提供screenshotclicktype_textwait等语义化操作,通过一个Pi扩展、一套教授代理使用这些工具的技能,以及一个用于屏幕截图和辅助功能(AX)调度的本地macOS辅助程序协同实现。该项目具备两种工作模式:默认模式优先采用辅助功能(AX)控制,并在必要时提供非AX路径回退,同时内置视觉上下文;而可选的隐身模式则严格限制操作仅限于AX语义路径。为确保其功能性,项目运行要求macOS 15+系统,并强制依赖辅助功能和屏幕录制权限以获取代理的视觉感知和操作能力,首次运行时会提供权限设置引导,并以非侵入式策略执行操作,每次成功操作后返回新的屏幕截图以供后续决策。

地址:https://github.com/injaneity/pi-computer-use

✨ 4: OpenGame

AI代理端到端网页游戏创作框架

OpenGame 是一个开创性的开源智能体框架,旨在通过自然语言提示实现端到端网络游戏的创建。其主要功能在于解决大型语言模型在复杂游戏开发中常见的跨文件不一致和逻辑缺陷等难题,能够从高层设计自动生成完全可玩的网络游戏。该项目的核心要点包括其独特的“游戏技能”(Game Skill)——由负责构建稳定项目骨架的“模板技能”(Template Skill)和系统性修复集成错误的“调试技能”(Debug Skill)组成。此外,它还集成了专门针对游戏引擎进行持续预训练、监督微调和执行强化学习的“GameCoder-27B”代码大模型。为了评估生成游戏的互动可玩性,OpenGame引入了“OpenGame-Bench”这一评估基准,通过无头浏览器执行和VLM(视觉语言模型)判断来衡量游戏的构建健康度、视觉可用性和意图对齐度,使其在各类游戏生成任务中达到了新的技术水平。

地址:https://github.com/leigest519/OpenGame

✨ 5: LiteCode

轻量AI代码代理

LiteCode 是一个创新性的 AI 代码代理工具,专门为那些受限于 8k 上下文窗口的免费或本地 AI 模型而设计。它解决了开发者在利用这些模型进行大规模代码修改时遇到的挑战,允许用户通过自然语言指令在整个项目中执行代码更改,而无需依赖昂贵的超大上下文模型。其核心优势在于一套精密的自动化系统,能智能地管理 token 预算,确保每次 AI 调用仅聚焦于单个文件的相关代码,并通过三阶段架构(规划器、协调器、协调器、执行器)协调多文件编辑,实现独立任务的并行处理和依赖任务的顺序执行。LiteCode 拥有短期记忆功能,能够记住最近两次操作,从而支持如“撤销”或“继续添加”等上下文相关的指令,极大地提升了交互的流畅性。它还提供一个功能丰富的交互式终端用户界面(TUI),带有实时 token 监控、可滚动聊天历史和直观的差异预览,同时保持对 Groq、OpenRouter、Ollama 等多种主流免费或本地 LLM 的广泛兼容性。为确保准确理解项目,LiteCode 利用可读的 Markdown 格式上下文映射文件(如 project_context.md)构建项目全景,并在任何修改写入磁盘前,向用户展示详细的差异并请求确认,从而保障了代码变更的安全性和可控性。

地址:https://github.com/razvanneculai/litecode

这就是本期的内容,记得标星⭐️点赞,关注我不迷路哦~