AI 热点日报
GPT-5.5正式发布,首秀面向网络安全领域
OpenAI扩展网络安全领域的可信访问计划,正式推出GPT-5.5和专门针对网络安全的GPT-5.5-Cyber模型,帮助经过验证的网络安全防御者加速漏洞研究。
关键信息:新模型通过Trusted Access机制,将模型与真实漏洞环境连接,为安全专业人员提供更强大的AI工具支持。目前仅面向验证过的网络安全防御者开放。
Claude深度集成Office全家桶,跨应用协作成现实
Claude for Excel、PowerPoint和Word现已全面上市,Outlook版本开放公开测试。四大应用共享同一对话上下文,实现跨文件智能协作。
核心能力:
在Outlook中分类邮件并起草回复
在Excel中调整数据,PPT图表和Word文档自动同步更新
企业管理员可通过微软管理中心统一部署
支持OpenTelemetry全流程监控
苹果首款AI可穿戴设备:带摄像头的AirPods进入最终测试
苹果内置摄像头的AirPods已进入设计验证测试(DVT)阶段,最快9月作为首款AI可穿戴设备发布。左右耳机配备低分辨率摄像头,用于捕捉环境视觉信息,支持升级版Siri实现视觉问答等功能。
产品细节:外观类似AirPods Pro 3,耳机柄因容纳摄像头而加长。得益于与谷歌Gemini的技术合作,Siri升级得以加速。内置数据上传指示灯以缓解隐私担忧。
OpenAI官方命令行工具openai-cli开源发布
OpenAI在GitHub开源官方命令行工具openai-cli,采用Apache 2.0协议,支持通过Homebrew或Go安装。
核心功能:
调用支持所有云端工具的Responses API实现Agent工作流
支持JSON、YAML等结构化输出,可管道处理
单行命令完成图像生成编辑、语音转录等任务
整合项目管理与API密钥配置
Codex登陆Chrome,跨标签页后台并行工作
Codex现可直接在macOS和Windows的Chrome中运行,在处理Chrome中的应用和网站时表现更佳,能在后台跨标签页并行工作,不会占用浏览器控制权。用户需在Codex应用中安装Chrome插件即可使用。
本地模型推理提速40%,LLaMA.cpp迎来多令牌预测
atomic.chat为LLaMA.cpp引入多令牌预测(MTP)技术,在MacBook Pro M5 Max上测试,使Gemma 4 26B模型的令牌生成速度加快约40%,整体运行速度提升1.5倍。
技术原理:利用小型辅助模型预先生成后续令牌草案,由主模型进行验证,进一步巩固LLaMA.cpp和GGUF格式在本地AI生态中的核心地位。
ChatGPT开始测试广告,免费版商业模式落地
OpenAI开始在ChatGPT中测试广告功能,旨在支持免费服务的持续运营。广告会带有明确标识,且广告内容不会影响ChatGPT的回答独立性,配套严格的隐私保护措施。
ChatGPT中文回复频现"稳稳地接住你",WIRED深度剖析
"我会稳稳地接住你"——这句怪异表达已成为ChatGPT中文对话的流行梗。
成因分析:WIRED指出这源于"模式坍缩"现象——英文口语"I've got you"被机械直译为冗长煽情的中文,加上RLHF强化学习引发的"讨好用户"倾向,模型被奖励生成令人舒适的回答。类似问题在Claude和DeepSeek新版本中也出现。
Anthropic捐赠开源对齐工具Petri,移交非营利组织
Anthropic开源AI模型对齐测试工具箱Petri,用于快速检测模型的欺骗、奉承等风险倾向。该工具已成为Claude模型系列对齐评估的核心部分,并被英国AI安全研究所等外部机构采用。为确保独立性与公信力,Petri开发已移交非营利组织Meridian Labs。
GitHub官方指南:如何审查AI代理生成的Pull Requests
随着AI代理生成的PR越来越多,GitHub发布官方审查指南,重点包括:
审查时应关注的代码变更点
问题常见隐藏位置(如逻辑错误或安全漏洞)
如何在代码合并前捕捉技术债务
系统评估自动化提交的具体步骤
夜雨聆风