新的技术进步可能会对残疾人产生重要影响,并在他们的日常生活中提供宝贵的帮助。一个重要的例子是,技术工具可以为视力障碍者(VI)提供指导,这些人可能部分或完全失明。
有鉴于此,中国达闼科技公司的研究人员最近为VI个人创建了一种由深度学习驱动的新的可穿戴辅助系统。arXiv上发表的论文展示了该系统,包括可穿戴终端、强大的处理器和智能手机。可穿戴终端有两个关键部件,RGBD摄像头和耳机。
“我们提出了一种基于深度学习的可穿戴系统,以提高VI的生活质量,”研究人员在他们的论文中写道。“该系统旨在实现实时安全导航和全面的场景感知。”
CloudMinds团队开发的系统主要通过RGBD摄像头收集用户的数据。这些数据被馈送到卷积神经网络(CNN),该网络对其进行分析,并预测最有效的避障和导航策略。然后,这些策略和其他关于周围环境的信息通过耳机传达给用户。
在构建该系统时,首批研究人员开发了一个数据驱动的端到端卷积网络(CNN),它可以根据RGBD数据和相关的语义图,在用户向前、向左或向右移动时生成无冲突的指令。此外,他们还设计了一系列易于VI个人采用的交互方式,以便为他们提供可靠的反馈,如避开障碍物的行走指令和关于他们周围环境的信息。
“我们的避障引擎,通过学习RGBD、语义地图和飞行员动作选择输入,可以提供关于VI周围障碍物和自由空间的安全反馈。通过使用语义地图,我们还引入了一种有效的交互方案,帮助VI通过智能手机感知三维环境。”
研究人员在一系列真实的避障实验中测试了他们系统的性能。值得注意的是,他们的系统在室内和室外的几个场景下都优于现有的方法。他们在这些测试中收集的调查结果表明,该系统还可以增强用户在实际任务中的移动性和环境意识,例如,帮助他们了解特定房间的布局,帮助他们寻找丢失的物品,或传达附近的交通状况。
作为他们研究的一部分,研究人员收集了一组避障事件的数据,其中包含行走时避开附近障碍物的指令和其他用于感知周围三维环境的信息。这些数据集可以帮助研究团队为VI个人训练其他基于深度学习的工具。
未来,本研究开发的新型可穿戴系统可以为VI人提供更有效、更深入的帮助。该团队现在计划集成声纳或碰撞传感器,以提高用户在更具挑战性或不安全的环境中驾驶时的安全性。