
—— · 要点速览 · ——
2、英伟达官宣推出全球首款完全开放的全模态物理AI模型NVIDIA Cosmos 3
3、全球最强开源生图 AI 模型:Ideogram 4.0 登场
更聚焦的科技行业交流群,捕捉每一条科技动态,诚挚邀请创业者、发烧友加入我们。微信扫码进群:

最新、最热的科技资讯;
最精准的行业资源对接;
论坛、沙龙、企业游学门票。


就在6月3日晚间,大全能源公告称,公司下属企业大全能源科技(上海)有限公司与昆山经济技术开发区管理委员会签署投资协议,拟在昆山开发区新设项目公司,建设大全智慧能源系统制造基地项目,总投资60亿元。项目分两期建设,一期投资约21亿元,二期将择机推进。新业务主要涉及智慧能源系统解决方案及相关设备(包括储能系统、固态变压器、固态断路器和固态电池等产品)的研发、制造与销售,旨在优化业务结构,培育新利润增长点。
大全能源表示,本项目旨在建设服务于智算中心(AIDC)的下一代供配电与智慧能源集成系统制造基地。随着AI算力爆发,全球智算中心市场快速扩张,对高效、紧凑、智能化的供配电系统产生刚性需求。
项目产品服务于清洁能源消纳,推动公司在新能源产业链的多元化布局,助力完善人工智能与新能源融合的产业生态。
公告显示,公司现有业务主要为高纯多晶硅的研发、生产及销售,产品主要应用于光伏行业。本项目应用领域及目标客户与公司现有产品不同,如果该项目因生产或技术经验不足无法实施、延期实施,或产品质量、产能释放未达到预期,或客户开拓未达到预期,则可能影响投资项目实现预期收益。
值得注意的是,根据大全能源2026年一季报,截至一季度末,现金及现金等价物余额为9.01亿元。一季度经营活动产生的现金流量净额为-12.45亿元,公司解释该变动主要系收入规模下降所致。2025年年报显示,公司持有的货币资金、定期存款、可转让大额存单及银行承兑汇票合计约132.3亿元。
主营业务与行业背景方面,大全能源的主要产品为高纯多晶硅,主要应用于光伏行业,处于光伏产业链的上游环节。多晶硅经过融化铸锭或拉晶切片后,可分别做成多晶硅片和单晶硅片,进而用于制造光伏电池。光伏产业上游包括多晶硅的冶炼、铸锭/拉棒、切片等环节,中游包括太阳能电池生产、光伏发电组件封装等环节,下游包括光伏应用系统的安装及服务等。
据摩根大通发布的AIDC储能专家电话会纪要,储能已是AI算力基建的“刚需生命线”,行业即将进入高速增长周期,2028年美国AIDC储能需求可能达到30-150GWh,未来4年AIDC整体储能配套率将突破75%。
此前,大全能源已流露出向新业务延伸的意向。 其投资者关系代表杨呈杰在股东会上表示,公司已设立研究院,持续开展新技术及新领域的前瞻性研究,在光伏领域的新技术方面已具备理论储备,并在光伏业务之外进行了可行性研究。具体规划上,公司关注储能,并将其作为重点方向之一。另一方面,电力需求最根本的拉动力来自算力,人工智能时代算力对电力的需求爆发式增长。在此背景下,公司将着力解决储能瓶颈,并布局供电配套硬件,包括固态变压器、固态电池、开关柜、断路器、配电柜等电力电气设备。(科创板日报)
2、英伟达官宣推出全球首款完全开放的全模态物理AI模型NVIDIA Cosmos 3
6月4日消息,在2026中国台北GTC大会上,英伟达正式官宣重磅产品——NVIDIA Cosmos 3,这款面向物理AI的开放世界基础模型,凭借全新混合Transformer架构,打通视觉推理、世界生成、动作预测三大核心能力,成为全球首款完全开放的全模态物理AI模型。与此同时,英伟达牵头成立全球开发者协作联盟,正式拉起物理AI生态阵营,宣告物理AI规模化落地时代加速到来。英伟达同步祭出生态大招,正式成立NVIDIA Cosmos Coalition全球协作联盟,集结全球顶尖世界模型研发团队与AI开发者,共同推动下一代开放世界模型的技术迭代与落地普及。(广角观察)
3、全球最强开源生图 AI 模型:Ideogram 4.0 登场
6月4日消息,Ideogram 昨日(6 月 3 日)发布博文,宣布推出 Ideogram 4.0 开放权重文文生图模型,基于跑分数据是全球最佳开源生图 AI 模型。
该模型核心规模为 9.3B 参数,延续近期开源模型的单流架构路线,让文本 tokens 与图像 tokens 共享同 1 个自注意力序列,并把设计控制放在训练和推理格式的中心。
架构方面,该模型包括 Qwen3-VL-8B-Instruct 文本编码器、可训练的 34 层单流 DiT(扩散 Transformer)、Euler 流匹配采样器,以及冻结的 KL 自动编码器。

该模型最突出的能力是文字绘制。模型可在图像中更准确地呈现较长文本,这对海报、商品图、封面和社媒素材很关键。
Ideogram 还通过训练图片中的对象和文本边界框,让模型理解元素位置关系。配合结构化 JSON(数据交换格式)字幕数据训练后,用户可更清楚地用提示词指定版式、对象位置和文本布局。

Hermes Desktop 共享 Hermes Agent 配置、API 密钥、会话、技能和记忆。用户在桌面端发起的会话,可在 CLI 或 TUI 中继续,反向切换也保持同样状态。
Hermes Agent 在国内也被称为“养马”,定位是一个能随用户使用而不断自我演进、具备长期记忆的数字员工。

Hermes Agent 可规划任务、调用工具、观察结果,并在会话间保留状态。桌面窗口提供流式回复和实时工具活动,右侧面板可预览网页、文件和工具输出。
Nous Research 强调 Hermes 具备闭环学习能力。复杂任务结束后,智能体会写入可复用技能,后续使用中这些技能会继续优化。持久记忆由智能体维护,并借助 FTS5 会话搜索、LLM 摘要和 Honcho 用户建模加强跨会话召回。
安全方面,桌面端支持 local、Docker、SSH、Singularity 和 Modal 共 5 类沙箱后端,并采用容器加固与命名空间隔离。
内置工具包括网页搜索、浏览器自动化、视觉、图像生成、文本转语音和多模型推理,也支持通过 MCP(模型上下文协议)接入外部工具。(IT之家)
周三(6月3日),Meta首席执行官扎克伯格在伦敦举行的产品发布会上通过视频表示:“几年前我曾说过,每家企业都会拥有一个AI代理,就像现在每家公司都有电子邮箱、网站和社交媒体账号一样。这一切发生的速度比我预想得更快。”
Meta在新闻稿中称,超过一百万家企业已经在WhatsApp和Messenger上使用Meta Business Agent,全天候响应客户需求。
现在,我们将Business Agent的服务扩展到全球各种规模的企业,让您只需几分钟即可完成设置并投入使用,之后便可用客户的本地语言和语气进行回复。
根据Meta的说法,这项新工具可以回答与企业业务相关的具体问题、根据企业产品目录推荐商品、预约安排并筛选潜在客户、完成销售转化等;也可以让企业决定何时由真人客服接手。
Meta表示,公司还会将该工具扩展至Instagram,届时企业可直接在Instagram上免费启用该服务。未来几个月内,Meta将推出付费订阅方案,为不同规模的企业提供多种选择。

WhatsApp产品负责人Alice Newton-Rex在接受采访时表示,Business Agent将“极大加速付费消息业务的发展”。她透露,该平台采用包括Muse Spark在内的多种AI模型。
Newton-Rex补充称,“过去通过付费消息服务,我们已经帮助企业与客户建立联系。而现在的重点是进一步提升效率,让企业能够大规模运营客户沟通业务。”
分析认为,此举是Meta试图为旗下社交应用开辟巨大新收入来源的一部分,目标是在核心广告业务之外寻找新的增长引擎。
2025年第四季度,企业付费使用WhatsApp与客户沟通所产生的收入,按年化计算已超过20亿美元。但相比Meta去年约2000亿美元的总营收,这仍只是很小的一部分。
过去一年里,扎克伯格大幅调整了Meta的AI战略,投入巨资从OpenAI、谷歌等竞争对手处挖角顶尖人才,并于今年4月发布了Muse Spark模型。
目前,多家科技巨头正逐渐放弃“无限量使用”的AI收费模式,转向按使用量计费,希望从广受欢迎但成本高昂的AI服务中实现盈利。(科创板日报)
香港生成式人工智能研发中心由香港特区政府重点创科项目“InnoHK 创新香港研发平台”资助。去年 2 月,研发中心正式发布 HKGAI V1 大模型,这是香港首个人工智能大模型。
作为香港 AI 研发的核心引擎,HKGAI V3 进一步强化对香港语境、行业场景及实际应用需求的支持,在运行效率及 Agent 持续执行能力方面均录得显著提升,包括实现了超 10 倍的 Token 压缩效率提升,以及近百倍的 Agent 无干预运行时长增长。
香港首个生产力级超级智能体同日发布。通过将香港本地知识深度内化到模型之中,HKGAI V3 的 Agent Workshop 成为香港首个生产力级超级智能体的核心载体,在测试中可单次无干预稳定运行长达 28 小时,从容完成复杂任务。
此外,该智能体针对香港本地使用习惯进行了优化,无论是理解同一句话,还是表达同一个意思,V3 的输出都更贴近香港本地的语境与习惯。

凭借本地大模型经验及多语种训练优势,HKGAI 与香港浪潮云,以及中国移动国际、中国联通国际以及中国电信国际三大电信运营商合作,将模型、智能体等 AI 能力向海外开放多样化推理算力和智能服务。
本次活动还发布了 HKGAI 政商一体机,是由 HKGAI 联合鼎桥、联想 LPS(Lenovo PCCW Solutions)共同打造,是面向政企的企业级 AI 私有化部署一体机方案。其硬件形态支持机架式服务器、塔式工作站及屏幕一体式终端,内置 HKGAI V3 大模型,实现本地推理、数据不出站,全面符合香港隐私合规要求,可广泛应用于政务、金融、医疗、企业内网等高安全需求场景。(IT之家)
8、智动未来联合蔡盼盼团队发布MINT-4B VLA模型
6月4日消息,广东智动未来联合上海创智学院蔡盼盼教授团队发布MINT-4B多模态VLA(视觉-语言-动作)大模型。该模型凭借突破性泛化能力与实机表现,在英伟达等行业巨头及国际权威专家发布的全球主流通用机器人大模型评测中跻身前三甲,技术指标优于OpenVLA、GR00T、π、UniVLA等标杆模型。 MINT系列核心创新为“复刻任务意图而非机械复刻轨迹”,独创SDAT多尺度频域分词技术,拆分顶层任务意图与底层执行细节两类特征,依托跨尺度自回归推理实现分层解码,解决传统VLA模型环境适应性差的痛点。目前该技术已搭载于小智S2人形机器人,覆盖科教研学、商业展厅等场景,配套开发、实训一体化方案降低落地成本,机型已在全国多地商用落地。(广角观察)

2、灵心巧手投资成立科技公司 含可穿戴智能设备制造业务
6月4日,科创日报—企查查APP显示,近日,灵造万物(北京)科技有限公司成立,法定代表人为袁贺,注册资本为1000万元,经营范围包含:服务消费机器人制造;工业机器人制造;智能基础制造装备制造;可穿戴智能设备制造;人工智能硬件销售等。企查查股权穿透显示,该公司由灵心巧手(北京)科技股份有限公司全资持股。 (财联社)
“短剧乘风起,跨境迎新商机。”




夜雨聆风