先给你说一个场景: 现在大部分的 agent 应用都是智能语音问答,数字人之类的。那么语音唤醒怎么做,实时语音如何识别更加精准(用什么方案更好),话筒设备该怎么收音可以降噪,这里面涉及到的服务之间的交互该怎么设计。如果会了的话,那么现在新能源的车机也就会了,下一步就是场景交互流程的设计了。
登录后可发帖和回复
先给你说一个场景: 现在大部分的 agent 应用都是智能语音问答,数字人之类的。那么语音唤醒怎么做,实时语音如何识别更加精准(用什么方案更好),话筒设备该怎么收音可以降噪,这里面涉及到的服务之间的交互该怎么设计。如果会了的话,那么现在新能源的车机也就会了,下一步就是场景交互流程的设计了。