【每日分享】AI工具和最新情报
【每日分享】AI工具和最新情报
• Cohere Transcribe(开源ASR)
26亿参数开源语音识别模型,3月26日发布,一上线即登顶HuggingFace Open ASR榜首,WER仅5.42%,击败OpenAI Whisper Large v3(7.44%)。支持14种语言包括中文,Apache 2.0许可。
https://cohere.com/transcribe
• Google Gemma 4(开源多模态模型)
4月2日发布,Apache 2.0许可史上最宽松。包含2B/4B/26B/31B四个规模,31B版本Arena AI排名全球第三开源模型(Elo 1452)。支持文本+图片+视频,256K上下文。
https://aitoolsrecap.com/Blog/ai-tools-updates-april-2026
• Microsoft MAI三件套(Transcribe/Voice/Image)
微软4月2日发布三款自研模型:MAI-Transcribe-1(25语言WER最低3.8%)、MAI-Voice-1(60倍实时音频生成)、MAI-Image-2(Arena前三,2倍速度提升)。
https://aitoolsrecap.com/Blog/ai-tools-updates-april-2026
• ElevenLabs Image & Video(测试版)
ElevenLabs从音频扩展到图片/视频生成,整合Veo/Sora/Kling/WAN/Seedance,可直接在平台内完成配音配乐LipSync。
https://aitoolsrecap.com/Blog/ai-tools-updates-april-2026
其它金额
赞赏金额
¥
最低赞赏 ¥0
1
2
3
4
5
6
7
8
9
0
.
浙江,2小时前,
夜雨聆风