隔空打字成真! 新研究「空气输入法」让使用者在空中动动手指就能给智能手表输入文字

隔空打字成真! 新研究「空气输入法」让使用者在空中动动手指就能给智能手表输入文字

智能手表目前越来越普及,但是它的文字输入却只能靠语音、打字或手写。 但有时用户可能不方便说话,而且在那么小的屏幕上戳键盘实在也有点侷促。 现在,也许你可以试试「隔空打字」法。

浙江大学开发了一个名叫AirText的应用程序,只需动动手指和手腕,手表就能识别字符,且错误率低至3.9%。 另外这个应用程序还有联想和推荐字词的功能,让拼写速度更快。

隔空打字成真! 新研究「空气输入法」让使用者在空中动动手指就能给智能手表输入文字

开发 AirText 的主要挑战,在于如何让它理解手腕运动和指尖拼写动作的对应关系。 如下面这张图所展示的,拼写时手腕呈现出来的轨迹和正常字母差得还挺多的。

隔空打字成真! 新研究「空气输入法」让使用者在空中动动手指就能给智能手表输入文字

为此,研究团队借助了一个现成工具 Leap Motion,它可以用红外传感器来跟踪手势。 然后八名志愿者使用五种不同的智能手表拼出超过 25000 个字符,用 Leap Motion 收集相关的手腕和手指运动数据。

隔空打字成真! 新研究「空气输入法」让使用者在空中动动手指就能给智能手表输入文字

再将数据输入神经网络模型,进行训练,最终 AirText 可以根据用户手腕微小的动作变化推断指尖的轨迹。 接着,仅通过智能手表就可以高效、准确地将推断出轨迹,再识别为相应的字符。

为了加快拼写速度,系统也配有单词预测和推荐功能。 预测单词会显示在手表屏幕的四个方向,只要可以将手表向上下左右倾斜就能进行选择,而晃动手表则可以退格。

隔空打字成真! 新研究「空气输入法」让使用者在空中动动手指就能给智能手表输入文字

在 AirText 的准确性测试方面,衡量指标为 WER(词错误率,Word Error Rate),计算方法为:错误字 / 识别正确的字。

其中错误字涉及三种类型:漏字(用 I 表示,即校对成正确的拼写时需要再插入的字的数量)、多字(用 D 表示,即需要删除的字数量)、错字(用 S 表示,即需要替换的字数量)。

隔空打字成真! 新研究「空气输入法」让使用者在空中动动手指就能给智能手表输入文字

将 AirText 与两基线方法(IMU-CNN 和 BLSTM)相比,最终 AirText 得分最低,也就是准确性最高,三者平均分分别为 3.9%、30.9% 和 57.1%。

隔空打字成真! 新研究「空气输入法」让使用者在空中动动手指就能给智能手表输入文字

以上是单用户在单设备上的测评结果。 为了更准确,他们还测试了多用户和多设备,结果如下:

隔空打字成真! 新研究「空气输入法」让使用者在空中动动手指就能给智能手表输入文字

左图中,同一个用户使用5种不同智能手表测试AirText获得的准确率得分分别为:8.3%、7.5%、6.5%、7.7%和3.9%。 研究人员表示,7%的 WER 意味着平均每 15 个单词中有一个识别错误,这对于隔空手写来说还是可以接受的。

右图中,8位不同用户使用同一手表获得了11.2%、5.9%、4.3%、4.0%、3.6%、5.9%、4.7%和3.9%的 WER。 从中我们可以看出,与不同的设备相比,不同的用户对准确性的影响更大。 不过研究人员表示,借助模组的更新,AirTex 仍然可以针对不同用户实现较高的准确率。

然后是速度测试。 由于 BLSTM 基线的 WER 约为 57%,错误率太高,研究人员只比较了 AirText 和 IMU-CNN 两者的速度。 衡量指标是 WPM(单词 / 每分钟,Word Per Minute),其计算方式为用总体输入字数-错误字数 / 时间。

隔空打字成真! 新研究「空气输入法」让使用者在空中动动手指就能给智能手表输入文字

结果 AirText 的平均 WPM 为 8.1,而 IMU-CNN 基线的 WPM 仅为 4.6。

隔空打字成真! 新研究「空气输入法」让使用者在空中动动手指就能给智能手表输入文字

研究人员指出,此输入速度与一些触控屏幕的文字输入法相当(这些方法在实际应用中的 WPM 为 9.1、9.8WPM)。

总体来看,AirText 的准确率不错,但速度还需要进步。 慢的主要原因,是因为它每拼写一个字符就需停顿一会儿。 目前研究人员正在研究解决方式,并表示最终也可能将 AirText 商业化。

(0)
打赏 微信扫一扫 微信扫一扫

相关推荐

发表评论

登录后才能评论