研究人员已经使用人工智能来减少依赖计算机与他人交谈的非语言运动障碍患者的“沟通差距”。
来自剑桥大学和邓迪大学的团队开发了一种新的情境感知方法,可以消除50%到96%的用户为交流而键入的击键,从而缩小交流差距。
该系统针对非语言人群,使用一系列上下文“线索”(如用户的位置、一天中的时间或用户说话伙伴的身份)来帮助建议与用户最相关的句子。
非言语运动障碍者经常使用带有语音输出功能的电脑与他人交流。然而,即使没有影响打字过程的身体残疾,这些交流辅助工具仍然太慢,容易出错,无法进行有意义的对话:典型的打字速度在每分钟5到20个单词之间,而典型的说话速度在100到100个单词之间。每分钟140字。
该研究的主要作者、剑桥大学工程系的Pearl Ola Christensen教授说:“沟通率的差异被称为沟通差距。”“这种差距通常在每分钟80到135个字之间,影响了依赖电脑交流的人的日常互动质量。”
克里斯滕森和他的同事开发的方法使用人工智能,允许用户快速检索他们过去键入的句子。先前的研究表明,依赖语音合成的人和其他人一样,倾向于在日常对话中重复使用许多相同的短语和句子。然而,对于现有语音合成技术的用户来说,检索这些短语和句子是一个耗时的过程,这进一步减慢了对话过程。
在新系统中,随着人们的键入,系统将根据键入的文本和人们参与的对话的上下文,使用信息检索算法自动检索最相关的先前句子。包括关于对话的信息,例如位置、一天中的时间和对方面部的自动识别。使用经过训练的计算机视觉算法来识别来自前置摄像头的人脸,以识别其他说话者。
该系统是利用喷气发动机或医疗设备中常用的设计工程方法开发的。研究人员首先确定了该系统的关键功能,如单词自动完成和句子检索。在确定这些功能后,研究人员模拟了一个非语言人士,他从一个句子集中输入了大量的句子,这些句子代表了非语言人士想要与之交流的文本类型。
通过这种分析,研究人员可以了解检索句子的最佳方式以及一系列参数对性能的影响,例如自动完成单词的准确性以及使用许多上下文标签的影响。例如,这一分析表明,只有两个合理和准确的上下文标签可以提供大部分好处。自动完成可以起到积极的作用,但实现大部分好处并不是必须的。使用类似于网络搜索的信息检索算法来检索句子。向用户键入的单词添加上下文标签以形成查询。
这项研究首次将上下文感知信息检索与语音生成设备相结合,以帮助行动不便的人,并证明了上下文敏感人工智能如何改善行动不便的人的生活。
克里斯滕森说:“这种方法让我们希望未来有更多创新的AI注射系统来帮助行动不便的人进行交流。”“我们已经证明,注入AI用户界面可以挑战传统的用户界面设计理念和流程,从而降低不进行创新研究的机会成本。”