面对你的呼喊,她充耳不闻;
面对你的疑惑,她答非所问;
面对你的命令,她颠三倒四;
这就是Siri,你的“智能”语音助手!
自2011年Siri上线以来,智能语音助手已经走过了10个年头,但用户对它的吐槽不绝于耳,比如有时会唤醒失败,或者答非所问。这些问题的背后原因是什么?智能语音助手目前处于什么水平?终极形态会是怎样?如何看待它和用户之间的关系?
近日,搜狐科技全新直播栏目《AI十二谈》首期圆满举行,清华大学计算机系长聘副教授、智能技术与系统实验室副主任黄民烈,“小冰之父”、小冰公司CEO李笛就这些问题进行了精彩的观点分享。
《AI十二谈》是搜狐科技今年下半年重磅推出的全新栏目,将针对大家日常关心、关注的人工智能的痛点问题,邀请相关专家、企业高管组成嘉宾阵容,进行知识科普,答疑解惑。
在首期直播中,黄民烈教授分析称,智能语音助手唤醒失败的原因跟没有带出关键词、算法等有关,答非所问则受到解析错误、匹配程度、语言等因素影响。他认为,未来智能语音助手发展的最理想的境界,就是人机协作,把所有的事情都交给智能助理去做还是不太靠谱。
李笛认为,目前智能语音助手还处在特别早期的阶段,而用户的期望过高。他还表示,很难定义什么是最好的智能助理,因为每个人的需求不同,但智能语音助手可以成为人的朋友。
两位嘉宾还就智能语音助手发展中的伦理、隐私等问题进行了探讨。李笛认为,目前全球范围内,AI伦理都还处于非常早期的阶段,数据到底应该怎么使用等问题都还没有明确,某种意义上只能靠自律。
黄民烈表示,智能语音助手人性化体验和法律伦理边界的平衡,主要涉及到个性化技术和持续学习两个方面,在这个过程中,需要让机器人形成正确的价值观。
智能语音助手为何会唤醒失败或答非所问?
使用过Siri等智能语音助手的朋友可能都遇到过这样的情况——呼唤它好多次,但是它却没有响应,或者答非所问,甚至给出匪夷所思的回答。
黄民烈认为,现在很多语音助手都依赖于特定的关键词做唤醒,没有带出相应关键词就无法做出响应。这还涉及到算法的鲁棒性(指系统受到持续扰动保持原来状态的能力)问题,在同样的场景、同样的声音、同样的命令下,语音识别可能会有一些小错误或者小扰动,这些再经过算法去做语义分析,可能就会跟预想的不一致,就没有办法给到正确的响应。
作为“小冰之父”,李笛认为,智能助手最好的唤醒方式是不需要唤醒词,应该像人一样,能够判断用户是不是在跟它交流,同时能够不停地边听边说边想,也就是所谓的全双工的方式。他表示,今天的AI产品或者智能语音助手还处在特别早期的阶段,目前的准确性可能还做不到像用户所期望得那样好。
对于智能助手有时会答非所问,黄民烈分析称,这主要是两方面原因。一是问题解析错误,比如语音识别错误、结构化分析对话意图出错等。另一个原因就是问题和答案的相关性与匹配度不够高,这里面的算法会综合决定答案好不好、质量高不高。
清华大学计算机系长聘副教授、智能技术与系统实验室副主任黄民烈
同时,他认为,这和语言本身也有一定关系。资源丰富的语言相对资源贫乏的语言做起来更加容易,而中文没有明确的语法和组合的规则,英文则相对来讲比较固定,因此中文自然语言处理会面临更多难点。
而在李笛看来,智能助手或人工智能交互的场景比较难做,主要因为缺少弹性空间。“搜索引擎会有多