乐于分享
好东西不私藏

云知声首个工业级文档智能基础大模型发布;谷歌生图新王Nano Banana 2深夜突袭!性能屠榜速度飞升,价格腰斩【附实测】!

云知声首个工业级文档智能基础大模型发布;谷歌生图新王Nano Banana 2深夜突袭!性能屠榜速度飞升,价格腰斩【附实测】!

热点资讯

Hot  News

每日热点都在这里

云知声首个工业级文档智能基础大模型发布

2月26日消息,云知声今日正式发布首个工业级文档智能基座模型Unisound U1-OCR,该模型可理解文档版面、洞察深层语义,支持自动分类和业务信息抽取。

Unisound U1-OCR在多项权威测试中均获业界SOTA表现,在OmniDocBench V1.5评测中,Unisound U1-OCR以95.1分取得SOTA表现。Unisound U1-OCR采用ViT+LLM架构,其中视觉编码器部分采用NaViT架构,实现文档分辨率动态处理,模型参数规模3B量级,兼顾模型计算效率与文档深层语义信息理解的能力要求。

谷歌生图新王Nano Banana 2深夜突袭!性能屠榜速度飞升,价格腰斩【附实测】

2月27日消息,谷歌刚刚正式推出其性能最强的图片生成与编辑模型Nano Banana 2(Gemini 3.1 Flash Image),并已在谷歌旗下Gemini应用、搜索及AI Studio等全线产品中部署应用。

▲谷歌官宣Nano Banana 2发布

Nano Banana 2兼具Pro级功能与Flash级速度,在世界知识、图像质量、推理能力和主体一致性等方面实现了全面升级,在基准测试中大幅超越了GPT-Image 1.5、Seedream 5.0 Lite、Grok Imagine Image Pro等业界领先模型,配合思考模式、文本和图像搜索工具则全面超越Nano Banana Pro。

▲Nano Banana 2基准测试成绩

第一时间体验了 Nano Banana 2,发现其在多方面表现优异:生成图片的细节逼真度有所增强,指令执行精准度超预期,文字渲染能力与中国传统文化知识储备均得到提升,处理复杂场景的能力也显著提高。

以根据“60 岁亚洲渔夫”的相同提示词生成图片为例,让 Nano Banana 2 和 Nano Banana Pro 分别操作,Nano Banana 2 生成的图片效果更逼真、细节更丰富,指令遵循也更准确。

▲Nano Banana 2生成

▲Nano Banana Pro生成

60岁亚洲渔夫面部超高清特写,虚化海浪背景。脸庞布满风霜皱纹与晒斑,皮肤纹理细腻,可见毛孔与银白胡茬。侧方45°阳光照亮半张脸,双眼微眯,眼神坚毅平和,眼球映出远处海面反光。画面锐度极高,肌肤质感逼真可触。

不过Nano Banana 2仍被经典的“时钟+满杯红酒”问题难倒,在同时面临多物体+物理逻辑+光影难题等多重问题时生成仍不准确(后文第一部分详解)。同时,一些图片仍有“AI感”,无法做到完全以假乱真。不过话说回来,瑕不掩瑜,Nano Banana 2相比Nano Banana Pro跨代升级明显。

虽然效果更强、速度更快,但Nano Banana 2的价格不增反降。在谷歌AI Studio平台,Nano Banana 2相比Nano Banana Pro的输入图片的单价从2美元降至0.5美元,输出图片的单价也从0.134美元减半至0.067美元。

▲Nano Banana 2的价格不增反降

去年8月,Nano Banana(Gemini 2.5 Flash Image)席卷全球并重新定义图像生成;11月,基于Gemini 3 Pro的Nano Banana Pro更是凭借更强智能和创作控制力,成为AI生图圈接近“封神”的存在;今天,谷歌首度将两者的优势结合打造一款全新定位的模型。

按谷歌设计:**Nano Banana Pro** 适合对事实准确性要求最高的专业任务;**Nano Banana 2** 适合快速生成、精准执行指令及图像搜索集成场景。在谷歌 Gemini 应用中,Nano Banana 2 已替代 Fast、Thinking、Pro 版本里的 Nano Banana Pro;Pro 和 Ultra 订阅用户仍可按需选用 Nano Banana Pro。

OpenClaw能开箱即用了!附一手体验

2月26日报道,今日,MiniMax Agent迎来一次关键升级:一边是Expert 2.0,让任何可被描述的能力,都能成为“专家”;另一边是MaxClaw上线,把原本需要自己部署的OpenClaw,直接搬进网页端,开箱即用。

该功能支持个人与团队将专业知识封装为可复用的SOP。官方数据显示,Expert功能上线后,已创建超1.6万个专家Agent,覆盖技术开发、创意写作、办公效率、商业金融等多个领域。

MaxClaw基于OpenClaw框架在云端容器运行,无需自备服务器或API Key,基础版订阅会员即可使用。

目前,Expert与MaxClaw均已开放使用,入口在MiniMax Agent网页端。

MiniMax Agent:agent.minimaxi.com

Expert地址:agent.minimaxi.com/experts

END

图文来源于网络,如侵联删!

获取GPT4 原厂帐户

👇

微信二维码

关注我

👇

扫二维码关注我们

本站文章均为手工撰写未经允许谢绝转载:夜雨聆风 » 云知声首个工业级文档智能基础大模型发布;谷歌生图新王Nano Banana 2深夜突袭!性能屠榜速度飞升,价格腰斩【附实测】!

评论 抢沙发

1 + 2 =
  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
×
订阅图标按钮