首页 > 疾病 > 百科 > 内容

比打字快5倍?科学家利用大脑电极实现将思想直接转化为语言!(3)

2019-03-05 23:42来源:互联网关注:作者:默克

  然后志愿者们听其他人说数字(一、二、三等),并听30分钟的故事,在这个过程中,声学处理软件提取了志愿者由于听语言所引起的神经活动(本质上是一组复杂的脑电信号序列)。随后,Mesgarani和他的团队开发的一个“深层神经网络”(基本上可以推断出对应神经活动的语言声音)再对这种活动进行分析,分析得到的推论又会被转换回电信号,发送到一个声音编码器(声音编码器是一个可以根据电信号的特征,如频率和其他听觉元素产生声音的合成器)。

  整个过程就像把一辆法拉利的操作手册从意大利语翻译成英语,再从英语翻译成日语,然后又从日语翻译成意大利语一样:最终的版本听起来和原版经常根本不一样,这也是之前关于大脑-计算机语音接口研究所得到的结果:一串几乎听不懂的声音。Mesgarani说:“在这之前,你甚至不能很好地根据电子数据来重建语言。”

  他的大脑-计算机界面所面临的测试是声音编码器发出的微小声音是否与故事的声音和参与者听到的数字有任何相似之处。科学家们在bioRxiv预印本网站上发表的一篇论文中称,这个大脑-计算机界面系统的语言正确率达到了75%,相比之下,早期语言BCI正确率只有一半多一点;这篇论文尚未经过同行评审,但作者已将其提交给一家期刊。

  将某人对某一特定语言表达方式的所有神经反应(多次重复)平均起来,可以提高重建合成语言的准确性,读取阵列中128个电极的更多读数也有一样的效果。

  Mesgarani说,研究的下一步是测试通过想象说话所引起的大脑信号的深层神经网络。他说,“以前的研究已经表明,”探测编码这种无声语言的信号是“可能的”;语言处理和语言合成器才是研究一直以来的瓶颈。

  他说,通过改进潜在语言BCI的后端,“对于从大脑活动中产生准确、可理解的重建语言,我们有了一个很好的框架”,他称之为“迈向下一代人机交互系统的一步……为瘫痪和闭锁综合征患者服务”。

  一开始为残疾人提供的技术可能会惠及到其他所有人(两者顺序可能会反过来)。在麻省理工学院(MassachusettsInstituteofTechnology)2017年举行的一次神经技术会议上,Facebook公司的马克?切维莱特(MarkChevillet)将该公司“打字的想法”BCI研究的指导思想描述为一个问题:“如果你能直接用大脑打字会怎么样?”

  他指导的这个项目旨在“开发一种无声的语音界面,让你以比打字快5倍的速度生成文本,即每分钟100个单词”。该公司正在研究能否非侵入性地检测到高质量的神经信号,以准确解码成音素(因为即使是最狂热的facebook用户也不太可能为了打字快点而进行脑部手术)。如果可以的话,下一步就是将这些信号输入一个将音素序列与单词配对的数据库,然后使用特定于语言的概率数据来预测这些信号最有可能表示的单词(很像Gmail里面的自动填充)。

  Chevillet在会议上说:“这不是科幻小说。”

  智客帮三大工具类软件,是千家网依托于在智能化行业领域二十年的服务经验和资源开发出的智能化软件,让整个智能化产业提升效率。

  1、报价优选——简单易用的项目报价管理软件

  

  2、安装优选——智能家居安装与售后服务平台

  

  3、集成商优选——智能化系统集成商快速查询

版权声明:除注明外均收集于互联网,如有侵权请及时联系我们处理!

热门排行
推荐文章