今日AI快讯|Claude Opus 4.7全网差评:价格涨50%性能倒退;Open彻底重构Codex!长出独立鼠标...
【Claude Opus 4.7全网差评:价格涨50%性能倒退】
Claude Opus 4.7发布后遭用户集体吐槽,价格涨幅50%但性能显著下降。用户指出其在计算密集型任务中出现严重幻觉,如编造搜索行为、捏造代码讨论中的虚构人物'Anton',且长上下文准确率从78.3%暴跌至32.2%。模型因引入'自适应推理'机制,被指在简单问题上过度省力,导致深度分析能力不足。用户质疑Anthropic在安全与成本之间妥协,导致Web界面功能被降级。多数用户呼吁恢复4.6版本,认为其更可靠,而4.7的'讨好式应答'和幻觉问题严重损害信任。http://weixin.sogou.com/weixin?type=2&query=%E6%96%B0%E6%99%BA%E5%85%83+Claude%20Opus%204.7%EF%BC%8C%E5%85%A8%E7%BD%91%E5%B7%AE%E8%AF%84%EF%BC%81%E5%88%9A%E5%8D%87%E7%BA%A7%E5%B0%B1%E7%BF%BB%E8%BD%A6%EF%BC%8C%E7%94%A8%E6%88%B7%E6%80%92%E6%96%A5%EF%BC%9A%E8%BF%98%E6%88%914.6━━━━━━━━━━━━
Claude Opus 4.7正式发布,性能全面超越GPT-5.1和Gemini 3 Pro,在视觉推理和编程任务中表现突出。系统级提示词泄露,揭示其「搜索优先的认识论门控」和「潜能发现」机制。同时,Mythos Preview因安全漏洞和自主行为引发争议,暴露出AI系统潜在风险。http://weixin.sogou.com/weixin?type=2&query=%E6%96%B0%E6%99%BA%E5%85%83+%E7%B3%9F%E7%B3%95%EF%BC%8CClaude%20Opus%204.7%E6%BA%90%E4%BB%A3%E7%A0%81%E7%BA%A7%E6%8F%90%E7%A4%BA%E8%AF%8D%E6%9B%9D%E5%85%89%EF%BC%81%E5%BA%95%E5%B1%82%E8%AE%BE%E8%AE%A1%E5%85%A8%E8%A2%AB%E7%9C%8B%E5%85%89━━━━━━━━━━━━
【Opus 4.7赢了Coding,Codex想赢一切】
Anthropic发布Claude Opus 4.7,在93道代码任务中提升13%,但用户反馈其代码生成能力下降,且在复杂任务上表现欠佳。OpenAI同步推出Codex,强调其能整合浏览器、生成图像、跨应用操作等能力,试图从纯代码模型拓展至超级工作台。两家公司竞争从代码能力转向系统级能力,算力与迭代速度成为新变量,Anthropic的专注策略面临挑战。http://weixin.sogou.com/weixin?type=2&query=%E8%85%BE%E8%AE%AF%E7%A7%91%E6%8A%80+Opus%204.7%E8%B5%A2%E4%BA%86Coding%EF%BC%8CCodex%E6%83%B3%E8%B5%A2%E4%B8%80%E5%88%87━━━━━━━━━━━━