GoForum › 🌐 V2EX
ai 变声-思考
ffw5b7 ·
2026-01-14 17:23 ·
0 次点赞 · 2 条回复
最近看了这个帖子 https://www.v2ex.com/t/1182067#reply243 链接,让我对 AI 变声有一些思考。
其实,变声的核心在于音色的数据集。换句话说,如果想“模拟”一个人的声音,需要收集到特定条件的数据: 同一个人的语音 说话清晰,口齿分明 时长充足,通常 20–60 分钟以上
可能的采集场景: 视频博主:上传的视频或直播语音被用于训练 AI 模型 恶意行为者:多次语音沟通,甚至利用通讯录信息,模拟你的声音向家人进行诈骗
2 条回复
添加回复
你还需要 登录
后发表回复
还有专门提供的: https://huggingface.co/datasets/shunyalabs/chinese-mandarin-speech-dataset