
摘要:本文解析EPFL团队研发的AI驱动的物体级视觉假肢技术,揭秘它如何用拓扑神经网络,预测大脑高级视觉区域的刺激模式,把传统的光点刺激,升级成能唤起人脸、物体感知的人工视觉,解决传统视觉假肢只能生成简单光点的痛点,为盲人重获有意义的视觉,带来了全新的方案。
引言:视觉假肢,从光点到有意义视觉的瓶颈
对于那些因为视网膜、视神经损伤,而永久失明的人来说,视觉假肢,是他们重获光明的最大希望。过去几十年,我们已经有了很多的视觉假肢技术,比如视网膜假体、视神经假体、皮层假体,这些技术,能通过电刺激大脑,让盲人重新“看到”一些东西。
但是,这些技术,一直有一个很大的瓶颈:它们,只能刺激大脑的低级视觉区域,所以,最终生成的,只是一些简单的光点,或者非常基础的形状,根本没法让盲人,看到有意义的东西,比如人脸、房子、汽车这些日常的物体。这就导致,这些假肢,虽然能让盲人感知到一些光,但是,根本没法帮他们恢复正常的生活,没法让他们认出自己的亲人,没法让他们正常地走路、认东西。
而现在,EPFL的研究团队,带来了一个全新的突破:他们用AI技术,第一次,实现了物体级的视觉假肢,能让盲人,重新看到有意义的物体,而不是简单的光点。
1. 核心痛点:传统视觉假肢,为什么只能生成光点?
传统的皮层视觉假肢,工作的原理,是绕过受损的视网膜和视神经,直接用电极,刺激大脑的视觉皮层,来“画”出图像。但是,过去,大家,都只能刺激大脑的低级视觉区域,因为,大家不知道,高级的视觉区域,要怎么刺激,才能生成复杂的感知。
低级的视觉区域,处理的是最基础的视觉信息,所以,刺激它,只能生成简单的光点,也就是我们说的光幻视(phosphenes)。而大脑的高级视觉区域,才是处理复杂的物体、人脸这些信息的,但是,我们一直不知道,要怎么刺激这些区域,才能让大脑,产生对应的感知。
而且,硬件上,也有很多的限制:电极的数量是有限的,我们没法在大脑里,放太多的电极,所以,传统的方法,根本没法生成复杂的图像。这就导致,视觉假肢,一直停留在“能看到光”的阶段,没法真正地,让盲人,恢复有意义的视觉。
2. 核心技术突破:AI模型,预测大脑的刺激模式
为了突破这个瓶颈,EPFL的NeuroAI实验室的团队,想到了用AI来解决这个问题。他们的核心思路,就是用AI模型,来模拟大脑的反应,预测,我们要怎么刺激大脑的高级视觉区域,才能让大脑,产生我们想要的物体感知。
他们用了一种叫做拓扑神经网络(topographicneuralnetwork)的模型,这个模型,能模拟大脑的视觉区域的反应,然后,他们,就用这个模型,来测试各种不同的刺激模式,看看,哪种刺激,能让大脑,产生对应的物体感知。
过去,要做这些实验,我们要花大量的时间,在动物或者人身上做实验,成本极高,而且,速度极慢。但是,现在,有了这个AI模型,我们,就能在电脑上,做所有的模拟,快速地测试成千上万种不同的刺激模式,找到最优的那个,也就是,能让大脑,产生我们想要的物体感知的刺激模式。
3. 效果验证:猴子实验,证明了技术的有效性
为了验证这个模型的有效性,EPFL的团队,和阿姆斯特丹的研究团队合作,在猴子身上,做了活体的实验。他们,把AI模型预测的刺激模式,用到了猴子的大脑里,结果发现,这个模型的预测,非常的准确。
实验的结果显示,这个刺激模式,真的能改变猴子的视觉感知,能让猴子,感知到我们想要的物体,而且,猴子的行为,也证明了,它们,真的“看到”了这些物体。这,也是第一次,我们证明了,我们,真的可以通过刺激大脑的高级视觉区域,来生成复杂的物体感知,而不是简单的光点。
“我们的模型,非常高效,它能准确地预测,哪种刺激模式,能对猴子的视觉识别行为,产生我们想要的影响,”团队的负责人MartinSchrimpf教授说,“我们的模型,不仅能选择图像,更重要的是,给定一个图像,它能告诉我们,最优的刺激模式是什么。”
4. 现存的挑战:从零生成感知,还有很长的路
当然,目前,这项技术,还处于早期的阶段,还有很多的挑战,需要我们去解决。现在,我们,还只能,在猴子已经看到了一个图像的基础上,调整它的感知,也就是,我们,还不能,从零开始,生成一个全新的感知。
比如,现在的实验里,猴子,已经看到了一个图像,然后,我们的刺激,能改变它对这个图像的感知,让它,产生我们想要的偏差。但是,我们的终极目标,是,哪怕猴子的眼睛,已经完全看不到东西了,我们,也能通过刺激,让它,从零开始,看到一个全新的物体,比如人脸、房子。
这,也是我们接下来,要解决的问题,现在,我们已经证明了,这个思路是可行的,接下来,我们,就要朝着这个终极目标,继续前进。
5. 未来展望:从视觉,到听觉,全感官的人工感知
这项技术,不仅能用到视觉假肢上,还能用到其他的感官上,比如听觉。现在,团队,已经拿到了HortonHealthFoundation的资助,接下来,他们,就要研究,这个思路,能不能用到听觉的刺激上。
我们都知道,人工耳蜗,已经很成熟了,但是,它,还是有很多的不足,它,没法完全恢复正常的听觉处理。而团队的思路,就是,用同样的拓扑模型,来预测,听觉的刺激,要怎么做,才能让人工耳蜗,更好地恢复人的听觉,让失聪的人,能重新听到更自然的声音。
这,也就意味着,这项技术,未来,能帮我们,解决很多的感官障碍的问题,不管是视觉,还是听觉,我们,都能用AI,来预测大脑的刺激模式,让人工的感官,更接近自然的感官。
结语
EPFL的这项AI视觉假肢的突破,彻底改变了视觉假肢的格局:它第一次,让我们,从传统的光点刺激,升级到了物体级的刺激,能让盲人,重新看到有意义的物体,而不是简单的光点。
这,不仅解决了传统视觉假肢的核心痛点,也为感官障碍的治疗,打开了全新的方向,未来,我们,或许很快就能看到,这项技术,真正落地,让那些失明的人,重新看到自己的亲人,重新看到这个世界,也让失聪的人,重新听到自然的声音,真正地,重获正常的生活。
本站具身智能相关资料限时免费领取,可通过以下方式获取:
点击下方推荐+分享想要下载的文章至朋友圈,至少获得20个赞
截图给“牛小喀”免费获取

扫码添加牛小喀


点击“阅读原文”查看更多
夜雨聆风