原题目:谷歌想用AI帮言语障碍者“措辞” 数据集是最年夜挑衅

新浪科技讯 7月12日下战书新闻,近几年AI范畴对于残障人士的存眷越来越多,企业和技巧专家致力于经由过程AI赋能信息无障碍。日前在“Google Solve with AI”运动上,Google AI产物司理先容了Google AI在针对听障和言语障碍患者人群推出的利用新进展和笼罩情形。

据Sagar Savla先容,今朝全球有 4.66 亿人患耳聋或听力障碍,这一数字在 2055 年可能会增添至 9 亿。听力受损使得人们很难与四周的世界沟通交换,这是人类社会中一项严重的挑衅。

而语音辨认 (speech recognition) 功效Live Transcribe的呈现,就是为听障人群解决实际题目。该功效可以及时主动转录对话,让人们介入到底本无法介入的对话中。

今朝,Live Transcribe利用法式支撑跨越70种说话,经由过程在手机屏幕上把实际生涯中的语音转录为文本,辅助耳聋和听障人士与他人沟通。

此外,言语障碍患者也是一个较年夜的群体。Google AI 产物司理Julie Cattiau在接收新浪科技采访时提到,Google本年启动的Euphonia项目,正在经由过程招募自愿者,积聚更年夜的残障人士说话数据库,盼望终极辅助所有的言语障碍患者进行交换。

据悉,该功效经由过程为言语障碍患者树立语音辨认模子,和可以或许辨认其他沟通方法( 如手势,眨眼等)的基于盘算机视觉的模子,让机械往懂得他们措辞的方法,用AI语音技巧帮这些患者“措辞沟通”。

在运动现场,Julie Cattiau经由过程一段视频,展现了经由过程该功效,可以相瞄准确地读掏出有说话障碍人士的表达。

不外,要让AI读懂言语障碍患者的表达,也存在必定的挑衅。Julie Cattiau在采访中表现,此刻一般的说话辨认已经有大批的数据了,有良多人在应用这个平台。可是在Euphonia这个项目中,实在没有太多人介入,良多有说话障碍的人很少愿意来介入。今朝,正在经由过程招募良多言语障碍患者自愿者,让他们朗读一些词汇,积聚表达,如许就能树立一些数据。

“这些数据现实上没有那么多,固然我们在语音辨认方面取得了很年夜的进展,但依然存在如许的挑衅”,Julie Cattiau坦言。

语音辨认对于患有某些健康状态的人来说是一项至关主要的技巧,但很多产物即使在最幻想状况下也表示平平。

据懂得,经由过程和这些非营利组织的合作,Euphonia项目团队须要记载更多患者的声音,然后将这些声音来练习人工智能,从而创立可以或许辨认这些语音的算法和频谱图。

今朝,因为没有人收集到足够年夜的数据集,语音辨认技巧可能不实用于有说话障碍的人士,而这将是Euphonia着手研讨的部门。(雪梅)


义务编纂: