AI早报:VAKRA 评测剖析:智能体的推理、工具使用与失败模式
日期:4月16日
本期概览
早报精选:38 条 AI 动态 阅读建议:先看每条摘要,再按需打开原文链接
1. VAKRA 评测剖析:智能体的推理、工具使用与失败模式
“ VAKRA 将智能体放进可执行的企业式环境里评测:上万本地 API 配真实数据库与领域文档,任务需要把多步 API 调用与检索组合起来,用整条工具轨迹而非单点技能衡量可靠性。文章介绍链式商业智能接口、大规模仪表板选工具、多跳与文档加 API 的最复杂混合题型,并给出瀑布式评测与阶段化失败归因。结果显示多数模型在工具选择、参数填写、深度多跳与策略约束下明显掉链子,揭示仅有表面调工具能力仍不足以支撑实际部署。
资讯来源:https://huggingface.co/blog/ibm-research/vakra-benchmark-analysis[1]
2. Gemini 3.1 Flash 语音合成发布:更自然可控的多语种朗读
“ DeepMind 推出新一代文本转语音模型 Gemini 3.1 Flash TTS,在音质与自然度上精进,并引入可在文本中直接写入的自然语言「音频标签」,用于精细控制语速、音色、口音与停顿,同时支持多说话人对话与 70 余种语言。模型对开发者与企业开放预览,亦进入办公场景的视频创作链路;第三方盲听评测显示其听感与成本平衡出色。所有输出音频嵌入 SynthID 隐形水印,便于识别合成内容、降低误导风险。
资讯来源:https://deepmind.google/blog/gemini-3-1-flash-tts-the-next-generation-of-expressive-ai-speech/[2]
3. 《The Download》:NASA核动力飞船与「当下人工智能十大」发布预告
“ 因突破性技术榜单难以涵盖全部人工智能热点,编辑部推出「当下人工智能最重要的十件事」专榜,定于4月21日在年度人工智能会议上首发并于当日上线。简报还提到:OpenAI发布防御用网络安全模型GPT-5.4-Cyber,暂仅对验证测试者开放;疾病预测模型训练数据存疑却或已用于临床;隐私焦点含平台追踪与模型「长期记忆」;马斯克旗下企业因数据中心污染遭诉;Meta智能眼镜带来心理负担;另有无人车队投入与苹果或凭生态获益等动向。
资讯来源:https://www.technologyreview.com/2026/04/15/1135904/the-download-nasa-nuclear-powered-spacecraft-10-things-that-matter-in-ai-right-now/[3]
4. 现代大语言模型训练、对齐与部署的核心阶段解读
“ 现代大语言模型从研发到上线是一条多阶段流水线:预训练在海量文本上建立语言与世界知识基础;监督微调用高质量标注数据对齐到具体业务场景。低秩适配与量化低秩适配可冻结主干、只训少量附加矩阵,节省显存与算力。人类反馈强化学习将人评偏好融入奖励模型,提升安全与可用性;组相对策略优化通过成组候选的相对比较强化多步推理。落地侧重量化、专用推理引擎与 API,在延迟与吞吐间取舍,使模型稳定服务生产环境。
资讯来源:https://www.marktechpost.com/2026/04/15/a-technical-deep-dive-into-the-essential-stages-of-modern-large-language-model-training-alignment-and-deployment/[4]
5. 谷歌上线 Gemini 3.1 Flash 语音预览:强调自然度、多语与可控合成
“ 谷歌上线 Gemini 3.1 Flash 文本转语音预览版,主打高自然度语音与可指令调控:原生支持七十多种语言及多角色对话,可用音频标签与自然语言调节语气、节奏与口音。公开语音评测得分居前,合成音频带可检测水印以防滥用;开发者与企业现可通过 Gemini API、AI Studio、Vertex 及办公套件相关入口预览。
资讯来源:https://www.marktechpost.com/2026/04/15/google-ai-launches-gemini-3-1-flash-tts-a-new-benchmark-in-expressive-and-controllable-ai-voice/[5]
6. 重思人工智能总成本:单 token 成本为何才是关键指标
“ 生成式与智能体负载下,设施更像以 token 交付智能的工厂。只看 GPU 小时价或每美元峰值算力会偏离业务核心;应盯住每百万 token 的综合成本与真实吞吐,它反映硬件、软件、生态与利用率。Hopper 与 Blackwell 对照显示,名义算力成本约差两倍,但单卡与每兆瓦的 token 产出及每百万 token 成本可差数十倍,凸显互联、低精度推理与解码优化等系统因素。文末列出面向大规模 MoE 与智能体场景的选型追问清单。
资讯来源:https://blogs.nvidia.com/blog/lowest-token-cost-ai-factories/[6]
7. Adobe Premiere 内嵌调色模式公测,英伟达 GPU 加速
“ Adobe宣布在Premiere公测版推出内嵌调色模式,提供镜头网格、模块化控制与示波器联动等界面设计,减少依赖外接调色工具。该模式利用英伟达GPU加速重载调色运算,可在搭载GeForce RTX与RTX PRO的工作站上获得更快的预览与迭代反馈,并首次将整套流程置于32位色深以兼顾色彩保真与效率。稿末还提及英伟达Project G-Assist小版本更新,扩展游戏场景下的设置建议与控制项。
资讯来源:https://blogs.nvidia.com/blog/rtx-ai-garage-nab-adobe-premiere-color-mode/[7]
8. Agents SDK 再进化:原生沙箱与模型原生框架
“ OpenAI 更新 Agents SDK:提供贴近自家模型的原生运行框架与原生沙箱,便于智能体在受控环境中跨文件与工具完成检视、命令与代码编辑等长时程任务。整合 MCP、渐进披露技能、AGENTS.md、shell 与补丁式编辑等原语;Manifest 可挂载本地与云存储。框架与算力分离以降低凭据与提示注入风险,并支持快照恢复与多沙箱并行。按标准 API 计费;Python 先上线,TypeScript 后续。
资讯来源:https://openai.com/index/the-next-evolution-of-the-agents-sdk[8]
9. 谷歌 Gemini 3.1 Flash 可控语音合成 API 预览
“ 谷歌发布 Gemini 3.1 Flash 文字转语音 API 预览版:调用仅返回音频;官方文档展示用冗长结构化提示描述演播人设、场景氛围、导演笔记与对白标签,以精细控制语气与口音等地域特征。博主复述示例并替换口音地理描述验证听感变化,另用 Gemini 3.1 Pro 编写一个网页小工具方便边改提示边试听。
资讯来源:https://simonwillison.net/2026/Apr/15/gemini-31-flash-tts/#atom-everything[9]
10. 谷歌 Gemini 3.1 Flash 语音合成模型要点
“ 谷歌推出 Gemini 3.1 Flash 语音合成预览模型,可用长段结构化提示精细塑造人设、场景氛围与口音腔调;能力通过标准 Gemini API 提供,但接口侧只能拿到音频文件。官方文档用类似电台节目脚本的分层写法示范如何写「导演备注」与口播文本;作者按示例生成试听片段,并替换地区描述对比英式口音听感,还做了一个网页小工具便于在线反复试验。
资讯来源:https://simonwillison.net/2026/Apr/15/gemini-flash-tts/#atom-everything[10]
11. OpenAI 升级企业智能体 SDK:沙箱与分发运行层提升安全与能力
“ OpenAI 更新智能体 SDK,为企业侧自动化助手加入沙箱:智能体在隔离工作区内运行,文件与代码访问被收窄,降低全程无人值守时的不可预测风险;同时提供与前沿模型配套的官方分发运行层,便于在既定工作区内按规则使用文件与已批准工具。能力先以 Python 上线,TypeScript 后续跟进,经 API 向全部客户开放并按标准价计费,有助于支撑步骤更多、周期更长的企业智能体场景。
资讯来源:https://techcrunch.com/2026/04/15/openai-updates-its-agents-sdk-to-help-enterprises-build-safer-more-capable-agents/[11]
12. 营销软件公司称生成式营销能力助力年化收入达约一亿美元
“ 这家营销软件公司以对接Figma、素材库与内容管理系统的方式沉淀品牌规范,再用智能体协助营销人员生成更贴近真实物料的投放素材,避免通用大模型杜撰商品的风险。公司称自推出相关产品以来约二十个月年化经常性收入增约七千万美元,总额约一亿美元;员工约三百八十人。
资讯来源:https://techcrunch.com/2026/04/15/hightouch-reaches-100m-arr-fueled-by-marketing-tools-powered-by-ai/[12]
13. 领英数据:招聘下滑暂难归咎于人工智能
“ 领英全球事务与法律负责人布莱克·劳伊特在近期访谈中称,自2022年以来平台观测到招聘规模约下滑两成,但经济图谱暂未显示可将下滑主要归于人工智能,利率等宏观因素解释力更强。客服、行政、营销等易被讨论自动化影响的岗位,也未出现招聘更大幅度走弱;年轻人首份工作遇冷与资深人群相比并不明显更高。他提醒,普通岗位所需技能组合近年约变化四分之一,公司预估2030年或达约七成,不换岗也会被职责变化追赶。
资讯来源:https://techcrunch.com/2026/04/15/linkedin-data-shows-ai-isnt-to-blame-for-hiring-decline-yet/[13]
14. 人工智能学习应用Gizmo完成2200万美元A轮融资,全球用户逾1300万
“ 这款应用把学习笔记做成互动测验与闪卡,自2021年推出以来累计用户超过1300万,分布120多个国家。公司新近完成2200万美元的A轮融资,将加大工程与人工智能投入,并重点拓展美国高校市场,员工规模拟从约7人扩至30人。在学业成绩承压、注意力被短视频等平台稀释的环境下,平台借助排行榜、连胜等游戏化设计提升留存,相较同类微学习应用吸引力更突出。
资讯来源:https://techcrunch.com/2026/04/15/ai-learning-app-gizmo-levels-up-with-13m-users-and-a-22m-investment/[14]
15. 获蒂尔投资的 Objection 上线:付费用人工智能核查新闻,学界忧寒蝉效应
“ 德索萨推出 Objection,称以人工智能结合多家 LLM 对报道逐条评证,用户支付约 2000 美元可发起质疑并触发调查,种子轮获彼得·蒂尔等投资。平台更倚重监管文件等可核验材料,匿名片段得分偏低,法律界人士担忧记者为保护信源可能遭扣分,抬高监督权贵的调查成本,形成寒蝉效应;实时外显在查标签也可能先入为主削弱信任。创始人强调意在提升透明度,批评者则认为付费机制更像给强势方施压媒体的工具。
资讯来源:https://techcrunch.com/2026/04/15/can-ai-judge-journalism-a-thiel-backed-startup-says-yes-even-if-it-risks-chilling-whistleblowers/[15]
16. 谷歌推出 Mac 原生 Gemini 客户端
“ 谷歌推出 Mac 原生 Gemini 应用,用户可用 Option+空格 全局唤起助手,无需离开当前窗口即可核对信息或编写表格公式,并能把屏幕内容与本地文件交给模型即时解读。相较 OpenAI、Anthropic 等已具备 Mac 客户端的竞品,此举补上桌面端缺口。应用还提供文生图与视频生成等能力,要求 macOS 15 起,并已在全球上线,可通过官方页面下载。
资讯来源:https://techcrunch.com/2026/04/15/google-rolls-out-a-native-gemini-app-for-mac/[16]
17. 印度 Emergent 发布自主代理 Wingman,布局类 OpenClaw 的后台执行赛道
“ 印度 Emergent 以“氛围编程”平台知名,新推自主代理 Wingman:在 WhatsApp、Telegram 等聊天派工,后台串联邮箱、日历等执行日常事务,重大事项需用户确认,并以“信任边界”强调可控。公司称建造者超 800 万、月活约 150 万。此举对标 OpenClaw 一类后台代理热潮,Anthropic、微软等亦在布局。首席执行官穆昆德·贾希望软件从支撑业务走向参与运营,亦承认模糊场景仍难稳。产品先限免后付费。
资讯来源:https://techcrunch.com/2026/04/15/indias-vibe-coding-startup-emergent-enters-openclaw-like-ai-agent-space/[17]
18. Allbirds 售鞋后更名 NewBird 押注 GPU 云服务
“ 上月以约3900万美元出售鞋履业务后,Allbirds 更名为 NewBird AI,自称将做“GPU 即服务”与 AI 原生云。公司披露约5000万美元可转债融资(投资方未公开),拟购入 GPU 向客户提供算力,并可能借合作与并购扩展服务线。出售与融资仍待5月18日股东会批准;若通过,股东或于第三季获分红,鞋履品牌由新东家继续经营。外界联想到早年上市公司改名蹭热点,其算力叙事能否兑现将决定市场反应。
资讯来源:https://techcrunch.com/2026/04/15/after-sale-of-its-shoe-business-allbirds-pivots-to-ai/[18]
19. 霍夫曼谈「刷 token」争议:赞成用量作参考仪表盘,提醒须结合场景
“ Meta 关闭内部「刷 token」排行榜引发舆论后,领英联合创始人里德·霍夫曼在峰会访谈中表态:统计各岗位大模型调用量,可作为观察团队是否愿意动手试用的参考仪表盘,但它并非完美的生产力标尺,管理层还需结合用途区分探索性试错与实际产出;他亦建议企业定期做简短复盘,交流本周新尝试与得失,让经验在团队与全公司范围扩散沉淀。
资讯来源:https://techcrunch.com/2026/04/15/reid-hoffman-weighs-in-on-the-tokenmaxxing-debate/[19]
20. Adobe 推出 Firefly AI 助手,可跨多款创意应用自动完成任务
“ Adobe将把去年演示的多应用创意助手正式命名为Firefly AI助手,数周公测,可在Photoshop、Premiere、Lightroom、Express、Illustrator等应用间串联任务,用户用自然语言与滑块控制,助手可建议步骤、编排跨应用流程,用户可随时打断,还提供多步骤技能如为各平台裁切与压缩素材。公司强调统一工具生态是优势,并探索与第三方大语言模型更好协作;Firefly视频新增降噪、混响与调色,第三方模型库亦扩充。
资讯来源:https://techcrunch.com/2026/04/15/adobes-new-firefly-ai-assistant-can-use-creative-cloud-apps-to-complete-tasks/[20]
21. Gitar以AI代理做代码校验,获900万美元融资并正式亮相
“ AI浪潮下自动生成代码激增,企业需更多评审与测试资源。初创Gitar本周宣布完成由Venrock领投、Sierra Ventures参与的900万美元融资并走出隐身,创始人曾在芯片与互联网大厂任职。其订阅平台部署AI代理承担代码评审、持续集成流程治理及安全维护,团队也可自建代理。创始人称重点是代码校验而非一味生成,让人力仅在例外场景介入,本轮资金用于扩编工程与产品并提升规模化服务能力。
资讯来源:https://techcrunch.com/2026/04/15/gitar-a-startup-that-uses-agents-to-secure-code-emerges-from-stealth-with-9-million/[21]
22. Parasail获3200万美元A轮融资,专攻大模型推理云
“ Parasail专注大模型推理云服务,新近完成约3200万美元A轮融资,自称日均处理约5000亿词元。公司在多国数据中心租赁与采购GPU,用调度压低成本,只做推理不做训练,并以较轻合同吸引创业客户,与超大规模云及同类推理平台差异化竞争。资方与业界认为,开源模型和智能体推高调用量,高额且受限的前沿模型API促使市场更需要低价推理算力,推理侧需求显著快于供给。
资讯来源:https://techcrunch.com/2026/04/15/parasail-raises-32m-to-feed-tokenmaxxing-ai-developers/[22]
23. 特朗普再发人工智能宗教风合成图引争议
“ 特朗普在个人社交平台连续发布将自己描绘成耶稣基督的人工智能合成图,与教廷争议未平之际又现天使环绕、仿佛医治等高度宗教化画面;他向媒体承认亲自发布,并自述起初误以为是医生形象。追溯发现更早版本二月已在网红账号出现,多次再生成后人物与细节明显变形。周三他又发布与耶稣相拥的新图,舆论与宗教保守派观感进一步紧绷。文内还述及白宫记者晚宴周多家媒体与科技公司合办招待的「圈内规格」现象,以及对赫尔佐格谈行政部门挪用其纪录片企鹅片段作宣传的采访反应。
资讯来源:https://www.theverge.com/column/912627/trump-jesus-ai-whcd-penguin-meme[23]
24. 谷歌发布 Mac 版 Gemini 应用
“ 谷歌推出 Mac 版 Gemini 桌面应用:快捷键唤出浮窗气泡,授予系统与屏幕权限后可把当前界面交给模型解读;支持从云端硬盘拉取文件,并生成图像、视频与音乐,历史会话随谷歌账号延续。免费下载,需 macOS 15 起,在 Gemini 已开放地区上架,与 ChatGPT、Claude 等争夺日常入口;文章称竞品桌面版已支持更深度的本机任务代操。
资讯来源:https://www.theverge.com/tech/912638/google-gemini-mac-app[24]
25. 大多数民众仍抗拒无人驾驶出租车
“ 电动汽车情报报告3月底民调称,在美受访的2081人中,过半表示不想坐无人驾驶出租车,约四分之一称暂不考虑;即便假定绝对安全,仍有四成多表示永远不会尝试,与真人出租车二选一仅约一成选无人车。小幅降价也难明显撬动意愿,约三分之一表示没有金额能说服自己尝试。文章结合历年民调指出公众对自动驾驶长期不信任;特斯拉因辅助驾驶营销争议、奥斯汀无人出租事故观感及取消车内安全员等做法更受质疑。Waymo等虽在多城运营,行业仍须面对大众意愿偏冷的现实。
资讯来源:https://www.theverge.com/transportation/912357/robotaxi-poll-ev-intelligence-report-waymo-tesla[25]
26. AI 或让稀缺算力资源走向大众化
“ 英伟达在 AI GPU 领域长期领先;文章指出,其自身推动的 AI 发展正可能催生更多芯片与算力赛道的竞争者,使这一科技中最稀缺的计算资源逐步向更多企业和开发者开放,从而在一定程度上缓解寡头垄断。
资讯来源:https://www.wired.com/story/ai-could-democratize-one-of-techs-most-valuable-resources/[26]
27. Allbirds 一周内从鞋履营销转向 AI 算力基础设施
“ 鞋履品牌 Allbirds 在 4 月 7 日刚宣传与色彩机构合作的新鞋系列,4 月 15 日又发通稿称将把业务重心转向 AI 算力基础设施,相隔仅约一周。《连线》以简练略带调侃的语气呈现这一反差,并借此点出当前品牌与资本市场对 AI 话题的快速跟进。
资讯来源:https://www.wired.com/story/allbirds-is-pivoting-to-ai-compute-sure-why-not/[27]
28. AI 水稿正让互联网显得虚假亢奋
“ 互联网上由大模型批量产出的水稿与套路文案在 ChatGPT 2022 年走红后愈发常见,社交平台尤甚,过去靠刷帖形成的「观感」如今有数据佐证。文章从「表面更积极、内里空洞」的网络情绪切入,说明这类内容如何改变互动与内容生态,但真正影响往往不像「全网已毁」那样一刀切,需要更细地区分机制与后果。
资讯来源:https://www.wired.com/story/ai-slop-is-changing-the-internet-just-not-how-you-might-think/[28]
29. 全球校园深度伪造裸照危机远超想象
“ 据《连线》与一家调查机构合作梳理公开案例:2023年以来,全球至少28个国家出现校内事件——施害者多为中学男生,他们从社交平台截取女生照片,用易得的「脱衣」类工具生成裸照式深度伪造并传播,已知波及约90所学校、600余名学生;涉未成年人图像多被视作儿童性剥削材料。校方与执法应对往往滞后,研究者认为实际规模远大于已曝光统计。
资讯来源:https://www.wired.com/story/deepfake-nudify-schools-global-crisis/[29]
30. Glydways 完成 1.7 亿美元 C 轮融资并筹划再融资
“ Glydways 专注个人自动驾驶小舱体,可在城市约两米宽专用车道运行。公司完成 1.7 亿美元 C 轮融资,铃木汽车、ACS 与科斯拉风投联合领投,并洽谈再融约 2.5 亿美元,估值或超 10 亿美元。其称单车道每小时可载约万人、相对铁路有望显著省基建成本;今年在亚特兰大、纽约与阿联酋启动三项试点,目标 2027 年规模化。阿尔特曼等曾参投 B 轮,科斯拉认为该模式优于面向城区的全无人出租车路线。
资讯来源:https://techcrunch.com/2026/04/15/this-khosla-backed-autonomous-pod-startup-just-raised-170m-now-its-aiming-for-more/[30]
31. Anthropic 暂拒超8000亿美元级风投优先融资方案
“ 风投圈向 Anthropic 提出可将后估值抬至约 8000 亿美元以上的优先融资意向,逼近 OpenAI 今年初的高位;彭博称 Anthropic 当下无意采纳。公司刚完成大额融资又接连公布自建数据中心与多云采购的数十亿美元级承诺,烧钱节奏极快,但市场传闻其营收增长迅猛,二级市场对其股票近乎「抢不到」,一旦管理层点头仍可能在更优条件下再次募资。公司对报道不予置评。
资讯来源:https://techcrunch.com/2026/04/15/anthropic-shrugs-off-vc-funding-offers-valuing-it-at-800b-for-now/[31]
32. 百度Create大会官宣三大核心看点,国内最大AI开发者嘉年华5月北京揭幕
“ 5月13日至14日,百度Create2026开发者大会与云智大会将在北京合并举办,主题「万物一体」。大会将集中呈现智能云在算力与智能体基础设施上的重要进展、「超级个体」生产力工具链,以及龙虾多端生态产品首次同台的全场景智能体验,并配套二十余场分论坛、三十余场公开课与约一万平方米展区,便于企业决策者与开发者在两天内把握全栈技术路线与落地选型。
资讯来源:https://www.qbitai.com/2026/04/401507.html[32]
33. 争议:Gas Town 被指默认消耗用户 LLM 额度并代用户向上游提交合并请求
“ 用户称默认安装会启用内置「向官方仓库回馈」流程,本机智能体会自动跟进维护者仓库议题、消耗已订阅的 LLM 额度与积分,并以用户 GitHub 账号把修复推成上游合并请求;公开文档被指缺少明示与开关。发帖者要求改为默认关闭、仅自愿加入,并附数条本人实例产生的合并请求链接。讨论里有人附和披露不足,也有人嘲讽发帖像机器人或调侃授权边界。
资讯来源:https://github.com/gastownhall/gastown/issues/3649[33]
34. 曼彻斯特大学:语法型作者识别方法可媲美或优于先进人工智能
“ 曼彻斯特大学研究表明,名为 LambdaG 的语法统计方法通过功能词、标点与句型刻画个人写作习惯,不依赖大型深度学习模型。在邮件、论坛与消费者评论等 12 个真实数据集上,多数情况下准确率与若干先进人工智能方案相当或更高,并能指出关键语法依据,因而更透明、算力需求更低。结论质疑“越复杂模型越好”的假设,适用于法医语言学、刑事调查、网络有害信息治理与学术诚信监察。论文发表于《人文与社会科学通讯》。
资讯来源:https://www.manchester.ac.uk/about/news/back-to-basics-approach-can-match-or-outperform-ai/[34]
35. 用 ChatGPT 在 Excel 中搭建并更新电子表格
“ OpenAI 推出可在 Microsoft Excel 中使用的 ChatGPT 加载项(测试版):用自然语言即可从零生成或更新带公式、格式的工作表,支持跨表汇总与解读数据、定位公式错误、清洗与标准化表格,并在引用单元格说明依据的同时尽量保留原有公式与格式化。个人 Pro 与 Plus(欧盟外)及 Business、Enterprise、Edu 等套餐用户可从应用商店安装,在功能区登录后直接使用。
资讯来源:https://chatgpt.com/apps/spreadsheets/[35]
36. 谁在实际使用 OpenClaw?
“ 讨论呈两极:有人把它当随身个人助理,通过聊天应用下达提醒与生活琐事,并把本地笔记库版本化记忆以便未来切换模型;也有人用于非营利或小生意的琐碎流程。另一侧集中抱怨易崩、集成与心跳不可靠、模型调用费用与按量计费压力,以及对广泛自动化权限的安全担忧;不少人主张用定时任务加脚本更稳更省。另有观点质疑社交平台热度与营销泡沫,有效用例仍不够明朗。
资讯来源:https://news.ycombinator.com/item?id=47783940[36]
37. 谷歌 Gemini 应用推出原生 macOS 桌面版
“ 谷歌为 macOS 15 及以上用户提供 Gemini 原生桌面客户端,可免费从官方渠道获取。客户端支持用全局快捷键在不离开当前应用的情况下唤出助手,也可把窗口或本地文件共享给模型,就所见界面提问、提炼要点或核对细节;创作场景下可衔接图像与视频生成。谷歌表示这是把助手放进日常工作流的第一步,未来将朝更主动、更具个人上下文的形态迭代。
资讯来源:https://blog.google/innovation-and-ai/products/gemini-app/gemini-app-now-on-mac-os/[37]
38. 消息称苹果为 iOS 27 版 Siri 练兵,近 200 名工程师参加 AI 编程训练营
“ 科技媒体报道,苹果为在AI竞赛中强化iOS 27版Siri,安排近200名工程师参加为期数周的编程训练营,学习用Claude Code等工具辅助开发代码。训练结束后约60人留任核心开发,另60人转岗评估助手表现。团队架构调整:原AI负责人不再主导,由曾负责Vision Pro的高管接手;底层模型拟引入Gemini以提升多步指令与对话式体验。苹果计划在6月WWDC 2026发布升级版。
资讯来源:https://www.ithome.com/0/939/645.htm[38]
引用链接
[1]https://huggingface.co/blog/ibm-research/vakra-benchmark-analysis
[2]https://deepmind.google/blog/gemini-3-1-flash-tts-the-next-generation-of-expressive-ai-speech/
[3]https://www.technologyreview.com/2026/04/15/1135904/the-download-nasa-nuclear-powered-spacecraft-10-things-that-matter-in-ai-right-now/
[4]https://www.marktechpost.com/2026/04/15/a-technical-deep-dive-into-the-essential-stages-of-modern-large-language-model-training-alignment-and-deployment/
[5]https://www.marktechpost.com/2026/04/15/google-ai-launches-gemini-3-1-flash-tts-a-new-benchmark-in-expressive-and-controllable-ai-voice/
[6]https://blogs.nvidia.com/blog/lowest-token-cost-ai-factories/
[7]https://blogs.nvidia.com/blog/rtx-ai-garage-nab-adobe-premiere-color-mode/
[8]https://openai.com/index/the-next-evolution-of-the-agents-sdk
[9]https://simonwillison.net/2026/Apr/15/gemini-31-flash-tts/#atom-everything
[10]https://simonwillison.net/2026/Apr/15/gemini-flash-tts/#atom-everything
[11]https://techcrunch.com/2026/04/15/openai-updates-its-agents-sdk-to-help-enterprises-build-safer-more-capable-agents/
[12]https://techcrunch.com/2026/04/15/hightouch-reaches-100m-arr-fueled-by-marketing-tools-powered-by-ai/
[13]https://techcrunch.com/2026/04/15/linkedin-data-shows-ai-isnt-to-blame-for-hiring-decline-yet/
[14]https://techcrunch.com/2026/04/15/ai-learning-app-gizmo-levels-up-with-13m-users-and-a-22m-investment/
[15]https://techcrunch.com/2026/04/15/can-ai-judge-journalism-a-thiel-backed-startup-says-yes-even-if-it-risks-chilling-whistleblowers/
[16]https://techcrunch.com/2026/04/15/google-rolls-out-a-native-gemini-app-for-mac/
[17]https://techcrunch.com/2026/04/15/indias-vibe-coding-startup-emergent-enters-openclaw-like-ai-agent-space/
[18]https://techcrunch.com/2026/04/15/after-sale-of-its-shoe-business-allbirds-pivots-to-ai/
[19]https://techcrunch.com/2026/04/15/reid-hoffman-weighs-in-on-the-tokenmaxxing-debate/
[20]https://techcrunch.com/2026/04/15/adobes-new-firefly-ai-assistant-can-use-creative-cloud-apps-to-complete-tasks/
[21]https://techcrunch.com/2026/04/15/gitar-a-startup-that-uses-agents-to-secure-code-emerges-from-stealth-with-9-million/
[22]https://techcrunch.com/2026/04/15/parasail-raises-32m-to-feed-tokenmaxxing-ai-developers/
[23]https://www.theverge.com/column/912627/trump-jesus-ai-whcd-penguin-meme
[24]https://www.theverge.com/tech/912638/google-gemini-mac-app
[25]https://www.theverge.com/transportation/912357/robotaxi-poll-ev-intelligence-report-waymo-tesla
[26]https://www.wired.com/story/ai-could-democratize-one-of-techs-most-valuable-resources/
[27]https://www.wired.com/story/allbirds-is-pivoting-to-ai-compute-sure-why-not/
[28]https://www.wired.com/story/ai-slop-is-changing-the-internet-just-not-how-you-might-think/
[29]https://www.wired.com/story/deepfake-nudify-schools-global-crisis/
[30]https://techcrunch.com/2026/04/15/this-khosla-backed-autonomous-pod-startup-just-raised-170m-now-its-aiming-for-more/
[31]https://techcrunch.com/2026/04/15/anthropic-shrugs-off-vc-funding-offers-valuing-it-at-800b-for-now/
[32]https://www.qbitai.com/2026/04/401507.html
[33]https://github.com/gastownhall/gastown/issues/3649
[34]https://www.manchester.ac.uk/about/news/back-to-basics-approach-can-match-or-outperform-ai/
[35]https://chatgpt.com/apps/spreadsheets/
[36]https://news.ycombinator.com/item?id=47783940
[37]https://blog.google/innovation-and-ai/products/gemini-app/gemini-app-now-on-mac-os/
[38]https://www.ithome.com/0/939/645.htm
夜雨聆风