在今天,智能语音助手已经无处不在,但它的体验却依旧有很多问题。比如说:
1.AI对话依旧不流畅,尤其是多轮对话、中长期记忆对话体验不佳,从而导致用户缺乏持续打开语音助手,提出复杂需求的意愿,久而久之降低了语音助手的使用价值。
2.语音助手的自然语言理解能力不强,逻辑推理能力不足。产生了用户必须用严格的词汇和读音才能准确进行语音交互,日常化、口语化的对话大量无法识别。这一点对于老人、孩子以及不了解AI语音交互的用户来说非常不友好。
3.语音助手仅够唤起服务,不能够生成内容。这就导致语音助手能够带给用户的价值极大降低,难以培养用户持续的语音交互习惯。
不难发现,大语言模型与生成式AI的能力,恰好可以填补语音助手的这些缺憾。但在此前,大模型的开发者普遍集中于AI厂商,距离消费终端的应用场景与软硬件体系距离较远。