GoForum🌐 V2EX

体验了最新的 Lyria 3 音乐模型,顺手做了个小站 (附与 Suno/Udio 的主观对比)

wersero · 2026-04-02 07:14 · 0 次点赞 · 0 条回复

最近 Google DeepMind 放出了他们第三代音乐模型 Lyria 3,试用之后感觉在音质和多模态输入上非常惊艳。于是我趁热打铁,搓了这个封装了 Lyria 3 能力的在线 AI 音乐生成站,今天来 V 站向大家自荐一下,希望能得到大家的反馈。

🌐 网站地址: https://lyria3.pro

✨ 核心亮点 & 为什么选择接入 Lyria 3 ?

和目前市面上的主流 AI 音乐工具相比,我在开发和测试过程中,发现 Lyria 3 有几个非常硬核的特性:

多模态输入(看图生音): 这是我觉得最抓人的一点。除了常规的文本 Prompt (风格、情绪、BPM 等),你现在可以直接上传一张照片。模型会自己读取画面的情绪、色调,直接谱写出贴合氛围的配乐。

真·高保真音质 (48kHz/24-bit): 懂音频的老哥应该知道,很多 AI 音乐的立体声是通过后期算法“伪造”的。Lyria 3 是从底层的波形合成阶段就原生输出 48kHz/24-bit 的立体声,声音的声场和细节非常能打。

高密度的 30 秒短曲: 相比于 Suno 动辄生成几分钟(且后期容易出现结构崩坏幻觉),Lyria 3 专注于生成 30 秒的高质量片段。非常适合直接拿来做 YouTube Shorts 、TikTok 、播客的 Intro 或 Outro 。

多语言人声 & 自动作词: 支持 8 种以上语言(包括中、英、日等),发音极其自然,没有明显的机器口音,而且自带押韵连贯的自动作词功能。

📊 与老大哥们的对比 (Suno v5 / Udio v2)

为了让大家有个直观感受,我总结了一个简单的对比:

音质表现: 竞品大多在 44.1kHz ,Lyria 3 原生 48kHz 。

交互方式: 竞品仅支持文本;我们支持文本 + 图片/视频画面。

版权安全:Lyria 3 底层强制集成了 SynthID 水印,平台生成的音乐 100% 免版税( Royalty-Free ),可以直接商用,不用担心后续被 Youtube 警告。

开发过程中难免还有一些 Bug 和体验不佳的地方,欢迎各位 V 友在帖子里或者通过网站向我吐槽,我会重点记录并优化!

🌐 网站地址: https://lyria3.pro 🌐 github: https://github.com/lyria-3-ai

感谢大家的时间!

0 条回复
添加回复
你还需要 登录 后发表回复

登录后可发帖和回复

登录 注册
主题信息
作者: wersero
发布: 2026-04-02
点赞: 0
回复: 0