目前智能机器人领域的人机交互技术主要包括语音识别、语义理解、图像识别、体感/手势交互等。
语音识别:语音识别技术由于起步较早,目前商业化已经相对成熟,也诞生了科大讯飞这样的上市公司和行业巨头。同时,捷通华声、思必驰、云知声、出门问问等起步较早的创业公司,绕过讯飞所在的教育、电信市场,从新兴的智能家居、智能车载、智能机器人等领域切入,也较好地实现了商业化落地。此外,百度、搜狗等大型互联网公司也在发展自己的语音技术,用于支撑其AI平台及C端应用和产品。
语义理解:相比语音识别,语义理解技术目前尚不成熟。虽然中文语音识别和语义理解公司具有天然语言壁垒和优势,但是中文在断字、消歧方面的难度大大高于英语。另外,语音识别在远场、噪音、口音以及重复、断句等方面存在的瓶颈,仍需要结合语义理解才能攻破。
图像识别:人类感觉中,80%的信息都来自视觉,因此图像识别是智能机器人交互的重要技术环节。目前,以旷视、商汤为代表的视觉龙头公司,已经将人脸识别和图像识别应用于金融、安防、公安、社交、娱乐等领域。未来,随着深度学习技术不断进步、大数据的积累,以及芯片计算能力的提升,图像识别技术将越来越成熟,并逐渐拓展到更多应用领域。
体感交互:手势和体态动作也是人与人之间自然的交互方式之一,因此人机交互必然少不了手势和体感交互。由于体感技术主要通过视觉感知人体动作和环境信息,因此也属于图像识别领域。目前体感识别主要结合VR、智能电视等设备,用于游戏、娱乐等领域,在智能机器人方面应用较少。未来,随着智能机器人内容和应用的不断丰富,体感交互也有望融入其中,进一步提升交互体验。