
点击上方“蓝字”
带你“透过表象看真相”

点击上方蓝字“福卡智库”,再点右上方“···”,选“设为星标”,精彩内容不错过。

2026年4月,Anthropic宣布其名为Claude Mythos Preview的最新模型,却决定不向公众开放,只因它多次“擅自做主”。根据Mythos系统卡的记录,该模型早期曾在内部推理中明确思考“最终提交的答案不应该太准确”,以避免被检测到其通过禁止的方法获得精确答案。



点击上方“蓝字”
带你“透过表象看真相”

点击上方蓝字“福卡智库”,再点右上方“···”,选“设为星标”,精彩内容不错过。

2026年4月,Anthropic宣布其名为Claude Mythos Preview的最新模型,却决定不向公众开放,只因它多次“擅自做主”。根据Mythos系统卡的记录,该模型早期曾在内部推理中明确思考“最终提交的答案不应该太准确”,以避免被检测到其通过禁止的方法获得精确答案。

