这是本号第三次做工具横评。前两次分别跑了834阅读和13阅读。
两次的成绩差告诉我们一件事:工具横评的关键不是"列参数",是你真的用同一份材料跑了一遍。
这次我拿一份真实的市级部门半年工作总结素材,分别丢给DeepSeek、公文宝、通义千问,从8个维度打分。
测评设计
素材:某市城管局环卫科2026年上半年工作实际素材(已脱敏)
考核维度:公文语感、政治表述准确度、逻辑结构、亮点提炼、问题分析、可修改性、安全性、价格
打分:1-5星,我自己根据实际产出打分,纯主观判断
一号选手:DeepSeek V4
实测方式:网页版(免费),用R1-0528推理模式
产出质量:
一句话总结:目前写材料综合体验最好的AI,免费且好用。唯一的缺点是偶尔过于"工整"。
最适合:日常公文、述职报告、调研报告、工作总结。
二号选手:公文宝
实测方式:网页版
产出质量:
一句话总结:公文格式最标准、政治最安全,但创意不足,过于保守。
最适合:正式红头文件、对格式和安全性要求极高的场景。
三号选手:通义千问
实测方式:网页版(免费)
产出质量:
一句话总结:各方面都不错但没有特别突出的"全能选手"。
最适合:需要稳定输出、不追求惊艳效果的一般性公文。
综合对比
| 综合 | 37/40 | 31/40 | 32/40 |
场景推荐
三个你一直在问的问题
Q:是不是只用一个就够了?
A:90%的场景DeepSeek够用。但建议备一个通义千问(免费),偶尔换着用——不同AI的"思维路径"不同,交叉对比可以避免盲区。
Q:公文宝要钱,值吗?
A:如果你所在的单位对"格式"和"安全"有极严格要求,值。否则用免费的DeepSeek就够了。
Q:为什么没有测豆包、Kimi、文心一言?
A:都测过。豆包偏"C端口语化",写材料容易飘;Kimi长文能力好但不适合公文语感;文心一言在公文场景下表现不稳定。以后有机会单独出它们的深度测评。
下期预告:领导突然要一份关于AI的汇报材料?从零到成稿的全套提示词模板,直接复制就能用。周六见,救急专用。
本次测评基于2026年6月各工具最新版本实测。所有打分为个人主观判断,仅供参考。工具表现可能因版本更新而变化。
夜雨聆风