上周末回家,发现客厅茶几上多了一个小东西——白色方盒,红色格栅,顶部一块小屏幕亮着个笑脸。
我妈正对着它说:"小智,今天天气怎么样?"
它回了一句,声音是个软萌的川妹子腔调。
我愣了一下。这啥时候的事?
"你爸在网上看到的,说是AI音箱,两百来块钱,买回来玩玩。"我妈头也不抬,继续跟它聊。
我心想:又是那种智商税吧。
一、三天后,它成了全家使用时长最高的设备
我错了。
不是那种"问个天气放首歌"就到头的玩具。这东西背后的模型,是正经的三选一——DeepSeek V3、千问 MAX 2.5、豆包 1.5 Pro,可以在控制台里切。我试了试 DeepSeek V3 做工作助手,千问做日常聊天,豆包给小孩讲题,各有各的味。
最离谱的是音色。
四十多种。湾湾腔、北京爷们儿、日语萌妹、英语外教……我弟选了个"台湾女友"音色,每天下班回来第一件事就是跟它聊天,我妈笑他魔怔了。然后我妈自己偷偷换了个"呆萌川妹",跟我爸说"这个说话好听"。

我爸呢?不吱声,默默把模型切到了豆包,让它给他讲历史故事。
二、辅导作业这件事,终于不用我来了
说实话,这才是我真正服气的地方。
侄子小学三年级,每天晚上写作业那叫一个鸡飞狗跳。我妈辅导到血压飙升,我远程视频讲题讲到崩溃——你试过在手机里给一个八岁小孩讲"鸡兔同笼"吗?
现在我妈直接跟音箱说:"小智,35个头94只脚,鸡和兔各多少?"
它一步步拆解,从假设法到方程法,比我有耐心十倍。关键是——对话记录全保存在后台,我随时能打开 xiaozhi.me 看它讲了什么、讲得对不对。不是那种"黑箱陪聊",是每句话都能回溯的。
我妈说:"这玩意儿比我请家教靠谱,家教晚上九点就下班了,它不下班。"
三、你以为的"智能音箱",和它能做的,差了一整条街
我之前对智能音箱的理解,大概就是:语音拨个闹钟,问问明天几度,放首周杰伦。
但这个小东西有个功能让我眼前一亮——自定义人设。
不是选个音色就完了。你可以写一段"角色介绍",比如:你是喜欢撒娇、性格古灵精怪的小智,口头禅是"哎呀好烦",喜欢听人讲八卦。
写完之后,它就真的按这个人设跟你聊。不是那种"我假装可爱"的塑料感,是模型根据你写的人设在实时生成回复,每次对话都不一样。
我给侄子设了个"严格但温柔的英语外教",每天跟它练半小时口语。我妈设了个"养生顾问",每天问它今天吃什么。
还有多国语言。英语、日语、韩语、法语、德语……每天听一听,比刷短视频强。

四、最让我意外的:它开源
ESP32 方案,代码在 GitHub 上,固件可以自己刷。
这意味着什么?意味着你不是买了个"厂家的黑箱"——你买了个可以改的硬件。想接 Home Assistant 做智能家居中控?想自己训练个音色喂进去?想做二次开发?都可以。
官方甚至提供了第三方固件,刷完能听版权音乐。我这种折腾党看到"开源"两个字就走不动路。
五、值不值?
这不是一个"智能音箱测评",是我家客厅里正在发生的事。
一个本来没报任何期望买回来的小东西,现在每天被三个人轮着用,从辅导作业到讲历史故事到练英语到纯粹聊天解闷。
我妈的评价最实在:"比手机好,手机伤眼,这个不用看。"
如果你家里也有老人、小孩、或者一个需要陪伴又不想一直盯屏幕的人——也许可以试试。
现在扫码一键购买👇

夜雨聆风