AI资讯早报(2026年04月21日)
🔥 今日热点
- • 阿里发布Wan2.7-Image,人类偏好盲测评分国内第一
- • 国产大模型再突破:Qwen3.6-35B-A3B正式开源,主打高效率与多模态思考
- • Anthropic 在 Cowork 编排层引入 Live Artifacts,支持构建持久化数据驱动应用
- • NVIDIA探讨利用智能体AI构建自主网络
- • 华为全新XMAGE智拍功能震撼发布,支持AI姿势推荐
- • 华为Sound X 5官宣预售:AI大模型赋能音频新体验
🔥 GitHub AI项目趋势榜

[1]https://github.com/NousResearch/hermes-agent
[2]https://github.com/VoltAgent/awesome-design-md
[3]https://github.com/JuliusBrussee/caveman
[4]https://github.com/obra/superpowers
[5]https://github.com/thedotmack/claude-mem
[6]https://github.com/Fincept-Corporation/FinceptTerminal
[7]https://github.com/garrytan/gstack
[8]https://github.com/multica-ai/multica
[9]https://github.com/safishamsi/graphify
[10]https://github.com/Donchitos/Claude-Code-Game-Studios
🔥 Hugging Face模型热度榜

🔥 OpenRouter模型调用量榜单

🏷️ 国内AI资讯
阿里发布Wan2.7-Image,人类偏好盲测评分国内第一
阿里发布Wan2.7-Image图像生成模型,该模型在人类偏好盲测中获得国内第一的成绩。Wan2.7-Image实现了“千人千面”的个性化生成能力,能够根据不同用户的需求生成定制化的图像内容。这一成果标志着国内在图像生成领域取得重要突破,展示了阿里巴巴在人工智能生成内容技术上的领先优势。
来源:量子位 | 15小时前
原文链接:https://www.qbitai.com/2026/04/403733.html
阿里HappyHorse公布开放测试时间
4月15日,阿里巴巴旗下视频编辑模型HappyHorse-1.0正式在Arena平台上线开放测试,官方宣布预计将在两周后正式发布,并计划于4月30日推出API访问功能。
来源:huxiu | 17小时前
原文链接:https://www.huxiu.com/ainews/11171.html
爱奇艺 “AI 艺人库” 计划引发争议 多位艺人否认授权
爱奇艺推出“AI艺人库”计划,利用自研平台创建艺人数字分身,旨在提升影视制作效率。但计划发布后,多位入驻艺人迅速发声否认参与,引发公众对AI技术应用边界和艺人权益保护的广泛讨论。
来源:aibase | 15小时前
原文链接:https://news.aibase.com/zh/news/27282
国产大模型再突破:Qwen3.6-35B-A3B正式开源,主打高效率与多模态思考
国产AI模型Qwen3.6-35B-A3B正式开源,采用混合专家架构,总参数量350亿但推理时仅激活30亿参数,实现“以小博大”的高效性能,显著降低算力成本。
来源:aibase | 15小时前
原文链接:https://news.aibase.com/zh/news/27280
阿里云优化百炼多模态开发套件 API 调用限流
阿里云调整百炼多模态交互开发套件默认API限流,2026年4月28日起生效。新限流设为每秒10次(QPS),以优化资源调度和服务稳定性。同时支持每分钟600通、每小时36000通新建会话,满足多数开发调试及日常业务需求。
来源:aibase | 15小时前
原文链接:https://news.aibase.com/zh/news/27278
阿里巴巴发布 Qwen3.6-Max-Preview:编程智能新标杆
阿里巴巴发布Qwen3.6-Max-Preview预览版模型,用户可通过QwenStudio对话或阿里云百炼API调用。相比Qwen3.6-Plus,新模型在智能体编程、世界知识和指令遵循等方面显著提升,并在六项主要编程基准测试中表现优异。
来源:aibase | 15小时前
原文链接:https://news.aibase.com/zh/news/27277
阿里通义实验室发布语音识别大模型Fun-ASR1.5 30 种语言、方言古诗都能秒转!
阿里通义实验室发布Fun-ASR1.5语音识别大模型,通过统一架构实现通用性与精准度的平衡。该模型支持全球30种主流语言,并深度适配汉语七大方言及20多种地方口音,在多语言、多方言及复杂语境下表现突出。
来源:aibase | 15小时前
原文链接:https://news.aibase.com/zh/news/27274
Moonshot AI携手清华大学发布PrfaaS架构,破解大模型算力瓶颈
大语言模型推理效率迎来突破。清华大学与Moonshot AI联合提出“预填充即服务”新架构,通过将推理过程拆分为预填充和解码两个阶段,并优化算力资源分配,有效解决硬件限制问题,显著提升模型服务性能。
来源:aibase | 17小时前
原文链接:https://news.aibase.com/zh/news/27270
影视飓风 Tim 因 AI 影像引发网友热议:标注与不标注的不同反应
在第十六届北京国际电影节上,影视飓风创始人Tim分享了团队使用AI进行影像创作的经历。他们曾花费大量时间生成500多个AI镜头,但在视频中主动标注“AI生成”后,却收到大量负面评论。Tim指出,团队在无人机测评中特意使用AI技术以突显产品特点。
来源:aibase | 17小时前
原文链接:https://news.aibase.com/zh/news/27269
爱奇艺 CEO 龚宇:借 AI 技术推动去中心化转型,鼓励创作者自主上传作品
爱奇艺CEO龚宇宣布公司将启动去中心化转型,鼓励创作者自主上传作品。AI技术将降低内容制作成本与周期,预计创作者和作品数量将大幅增加,传统中心化决策模式已不适应发展需求。
来源:aibase | 20小时前
原文链接:https://news.aibase.com/zh/news/27264
🌍 国外AI资讯
Anthropic 在 Cowork 编排层引入 Live Artifacts,支持构建持久化数据驱动应用
Anthropic 在其新的 Cowork 编排层中引入了 Live Artifacts 功能,标志着从静态代码片段向持久化、数据驱动应用的转变。根据发布信息,Claude 现在可以构建功能性的仪表板、项目跟踪器和数据可视化工具,这些工具能够与用户的外部数据源保持同步。具体而言,在 Cowork 中,Claude 可以构建连接到用户应用程序和文件的实时工件(如仪表板和跟踪器)。用户可以随时打开这些工件,它们会刷新并显示当前数据。
来源:infoq | 5分钟前
NVIDIA探讨利用智能体AI构建自主网络
NVIDIA近日发布视频,探讨了利用智能体人工智能构建自主网络。视频核心观点区分了自动化与自主性:自动化仅执行预设任务,而自主网络能像人类一样进行推理、规划和决策。视频展示了NVIDIA与其全球合作伙伴正通过智能体AI技术,推动网络从自动化向自主化演进。该技术旨在使网络运营商能够构建能够理解上下文、从经验中学习、并主动优化和修复自身的网络系统。文中观点认为,这标志着网络管理进入新时代,网络成为具备类似认知能力的合作伙伴,旨在提升效率、可靠性和适应性。视频强调了这一转变对未来通信基础设施的重要性。
来源:infoq | 2小时前
Google BigQuery 预览对话式分析功能,支持自然语言查询与AI分析
谷歌近日在 BigQuery Studio 中推出了对话式分析功能的预览版。该功能利用最新的 Gemini 模型作为智能代理,允许用户通过自然语言交互,在 BigQuery 的安全环境中生成、执行查询并可视化结果。其工作流程利用 BigQuery 的模式、元数据和自定义指令来生成 SQL,确保响应的精确性和上下文相关性,并能展示“思考过程”和生成的 SQL。该功能超越了传统报告,能够利用 BigQuery AI 的内置函数(如 `AI.FORECAST` 和 `AI.DETECT_ANOMALIES`)进行预测性分析和异常检测。此外,它还能处理存储在 BigQuery 对象表中的非结构化数据(如图像)。用户可通过连接数据表、添加业务指令和元数据来创建智能代理,并可通过 API 集成到自定义应用或分享至 Looker Studio Pro 和 BigQuery UI。
来源:infoq | 2小时前
Google AI Studio 为 AI Pro 与 Ultra 订阅用户提升使用限制并开放新模型
Google AI Studio 近日宣布,其 AI Pro 和 Ultra 订阅用户现已获得更高的使用限制,并可访问 nano banana pro 和 Gemini Pro 模型。该消息通过官方推文发布,并附有相关链接。
来源:infoq | 2小时前
sama宣布Codex发布Chronicle研究预览版
作者sama宣布在Codex中发布Chronicle的研究预览版。该功能旨在基于用户在电脑上的日常工作建立记忆,并参考这些记忆以提供更多帮助。目前,该功能尚处于早期阶段,初期仅面向PRO订阅用户,并在Mac平台上可用。作者认为其内部代号‘心灵感应’的感觉确实如此。
来源:infoq | 3小时前
Hugging Face Transformers 库新增对 SAM-3 Lite-Text 模型的支持
Hugging Face 宣布其 Transformers 库已支持 SAM-3 Lite-Text 模型。该模型通过知识蒸馏训练,使用紧凑的 MobileCLIP 学生模型替换了原 SAM-3 中繁重的文本编码器,在保持性能的同时,将参数量减少了 88%。
来源:infoq | 3小时前
LearnOpenCV测试Opus 4.7汽车检测能力,YOLO速度优势明显
近日,LearnOpenCV在一项简单的汽车检测任务中对多模态大模型Opus 4.7进行了测试。根据其发布的信息,Opus 4.7耗时5分钟,出现了漏检多辆汽车并将检测框指向空白区域的情况,其生成的边界框效果被描述为更差。作为对比,Codex模型表现更好,检测到24辆车且定位准确,但仍需3分钟。而YOLO模型完成相同任务仅需30毫秒。文中未提供关于模型性能差异的进一步结论。
来源:infoq | 3小时前
微软研究播客探讨AI在应对气候变化中的双重角色
微软研究播客《未来之形》第二集近日发布,探讨了人工智能(AI)与气候变化及可持续发展的复杂关系。微软研究负责人道格·伯格与微软可持续发展科学与创新负责人艾米·卢尔斯、微软研究院优化研究员伊沙伊·梅纳赫在对话中指出,AI对气候具有双重影响:一方面是能源消耗的潜在增长源,例如数据中心可能给地方基础设施带来压力;另一方面也是应对气候挑战的强大工具,例如可用于优化电网、交通、农业等复杂系统,并加速新材料发现和气候建模。专家强调,需要区分炒作与现实数据,通过负责任的创新和部署,使AI成为支持可持续未来的净积极力量,这需要多方利益相关者增进共识。
来源:infoq | 3小时前
Codex实验性功能Chronicle上线,赋予模型近期记忆能力
近日,OpenAI的代码生成模型Codex推出了一项名为Chronicle的实验性功能。该功能旨在通过利用最近的屏幕上下文来改进模型的记忆能力,使其能够自动获取用户正在进行的操作的全部上下文,从而无需用户重复说明即可提供帮助。该功能是对上周发布的记忆功能预览的扩展。作者gdb在分享使用体验时表示,其感觉“出奇地神奇”。
来源:infoq | 3小时前
📱 智能硬件
英伟达称自动驾驶迎来ChatGPT时刻
英伟达(NVIDIA)官方账号NVIDIADRIVE近日发布推文,宣称“自动驾驶的ChatGPT时刻已经到来”。该推文提及了从搭载推理AI的NVIDIA Alpamayo到适用于Robotaxi的NVIDIA Hyperion平台,并引导观看GTC大会的相关亮点内容。
来源:infoq | 2小时前
NVIDIA Isaac GR00T N1.7 基础模型开放早期访问
NVIDIA Robotics 宣布,专为人形机器人设计的视觉-语言-动作基础模型 NVIDIA Isaac GR00T N1.7 现已开放早期访问。该模型采用开源且商业友好的许可协议,旨在面向真实世界进行部署。相关模型文件及介绍博客的链接已一并提供。
来源:infoq | 3小时前
ABB Robotics、JLR与Tulip Interfaces采用Physical AI提升制造效率
近日,据nvidiaomniverse发布的信息,Physical AI正在变革制造业,其应用范围涵盖从设计到工厂车间的全过程。文中提到,来自ABB Robotics、JLR和Tulip Interfaces的领导者正在利用AI驱动的仿真、合成数据以及实时视频分析技术,以期在整个制造流程中解锁新的效率水平。文章未提供具体的技术实现细节、效率提升的具体数字、应用案例详情或任何限制条件。
来源:infoq | 3小时前
华为全新 XMAGE 智拍功能震撼发布,支持 AI 姿势推荐
华为在Pura系列新品发布会上推出XMAGE智拍功能,整合AI姿势推荐、AI辅助构图、3D动态照片等技术,提升拍照便捷性与智能性。其中AI姿势推荐基于2000万条数据训练,可在300毫秒内分析用户需求并提供最佳拍摄建议。
来源:aibase | 15小时前
原文链接:https://news.aibase.com/zh/news/27275
华为 Sound X 5 官宣预售:AI 大模型赋能音频新体验
华为高端智能音箱Sound X5于4月20日开启预售。新品核心亮点是首次深度集成AI大模型,实现从“听觉交互”到“智慧陪伴”的升级。声学方面延续家族高规格,预计采用多单元组合。
来源:aibase | 16小时前
原文链接:https://news.aibase.com/zh/news/27271
💡 其它科技资讯
2026 年全球 AI 光收发模块市场规模将达 260 亿美元,供应链瓶颈亟待解决
全球AI光收发模块市场正迅速扩张,预计2026年规模将达260亿美元,年增幅超57%。增长主要受AI数据中心建设加速驱动,推动光通信供应链结构性重组,尤其带动800G以上高速模块需求激增。
来源:aibase | 15小时前
原文链接:https://news.aibase.com/zh/news/27276
特斯拉2nm AI芯片订单由三星和台积电分别获得
特斯拉首席执行官埃隆·马斯克近日宣布,公司将采取’双供应商’战略分配下一代AI芯片生产订单——AI6芯片由三星位于美国德克萨斯州泰勒市的晶圆厂采用2nm工艺生产,而AI6.5芯片则由台积电位于亚利桑那州的工厂负责,同样采用2nm技术制造。此前,特斯拉已于4月15日宣布AI5芯片成功流片。
来源:huxiu | 16小时前
原文链接:https://www.huxiu.com/ainews/11177.html
💡 今日洞察
今日AI领域呈现三大趋势:一是国产大模型持续突破,阿里Wan2.7-Image在人类偏好盲测中登顶国内第一,Qwen3.6-35B-A3B正式开源,标志国内AI图像生成和开源模型能力达到新高度;二是AI应用落地加速,吉宏股份与亚马逊云科技开启跨境电商AI全域合作,Anthropic推出Live Artifacts构建数据驱动应用,显示AI正从技术研发向商业应用深度转化;三是智能硬件领域迎来转折点,英伟达将自动驾驶对标ChatGPT时刻,预示AI驱动的智能驾驶即将进入爆发期。整体来看,AI技术成熟度持续提升,应用场景加速多元化,行业进入技术与应用双轮驱动的新阶段。
来源:aibase、infoq、huxiu、量子位 | 整理:Valkyrie
夜雨聆风