随后,昆仑万维又推出 AI 流媒体 App( Melodio )和 AI 商用音乐创作平台( Mureka ),致力于让全球用户都能轻松进行音乐表达。
8 月,字节跳动携豆包音乐大模型加入 AI 音乐战局,此时,趣丸科技推出「天谱乐」已两月有余。
字节的模型一上线就全面接入豆包 App、海绵音乐 App(字节旗下 AI 音乐创作工具),向所有用户开放。用户只需输入简单的提示词,就能得到包含歌词、曲谱和演唱的完整歌曲作品,还内置十多种风格和情绪选项。
相比 Suno,海绵音乐在人声清晰度、中文发音等方面进行了优化,更能驾驭国风类音乐。
目前支持文本、图片生曲,但不包括视频输入。
相比之下,拥有海量版权的在线音乐巨头则审慎得多。针对创作者,网易云音乐和腾讯音乐分别推出了具备 AI 辅助创作功能的「天音」和「启明星」平台。
「天音」更适合专业创作者,在「一键生成」上并没展现出领先其他 AI 生成应用的优势。「启明星」接入了「琴乐大模型」,仍聚焦于纯音乐创作,并未涉足涉及人声的歌曲生成。
对此,腾讯音乐表示,歌曲生成等复杂能力可以拭目以待。作为这一轮 AI 技术下的用户平台,他们选择踊跃但理性投入。
「启明星」接入了腾讯音乐「琴乐大模型」,输入曲风、乐器、场景等关键词就会生成一段纯音乐。 商用领跑 跨界共创 技术可以跨越国界,但应用一定要满足本地用户的需求。与当前已经落地的 AIGC 应用类似,国内 AI 音乐模型的发展也更接地气。 得益于更容易获符合本土市场偏好的华语和国风音乐训练数据,国内模型能够更准确地把握中国听众的音乐审美偏好,因此在中文歌曲创作上,「天谱乐」等国产音乐大模型明显优于市场上最先进的 AI 音乐模型之一 Suno。
Suno 为杜甫《小至》创作的歌曲,无论人声吐词还是旋律,都明显「水土不服」。
同时,国内音乐大模型市场也展现出独特的竞争格局。与 Suno 等专注技术创新的初创企业不同,这里的主导者是一批深耕内容与文娱领域的互联网企业。
他们无一例外地将重点放在降低创作门槛上,帮普通人生成个性化音乐,除了想在 C 端市场快速建立起存在感,也源于自身业务的深层需求,如平台在流量增长进入瓶颈期后尽可能地留住用户。
数据显示,2023 年抖音用户投稿超过 100 亿,其中有 78% 的内容都含有 BGM ,对 30 秒到 1 分钟不等的配乐需求量巨大。传统模式下,平台要么为此支付高额版权费,要么自建 BGM 库。音乐大模型能低成本批量生成个性化 BGM,满足迫切的业务需求。
作为国内最大的兴趣社交平台之一,趣丸也顺应年轻人消费音乐的方式从「听唱」转向「唱作」,将音乐大模型整合进唱鸭等产品,通过提升用户体验来强化其社交生态。
不少从业者认为,短视频、广告宣传、直播、游戏等场景的 BGM 很可能率先被 AI 取代。这些「快餐」内容对创作专业性、音质和 IP 要求都相对较低,更注重快速生产和个性化定制,与当前 AI 音乐的技术优势完美契合。
2024 年,音乐大模型横空出世终于补齐了 AIGC 时代「创作平权」的最后一块拼图。随着技术持续迭代,国内 AI 音乐应用也正朝着双轨并行的方向演进。
以「天谱乐」为例,一方面践行着「人人都能玩点音乐」,为普通用户提供娱乐性音乐生成服务;另一方面也在为专业人士提供更加实用的创作辅助,创造更大价值。
「天谱乐」网页端已经为广告、影视和音乐从业者提供专家模式,实现更精准的参数控制。
另外在视频配乐上,镜头卡点识别功能将传统需要剪辑师手动完成的情绪匹配和卡点对齐过程自动化,极大地提升了工作效率。
「天谱乐」网页端(也是「唱鸭」的网页版AI作曲),为广告、影视和音乐从业者提供音乐专家模式,具备更精准的参数控制和更高的创作自由度。
据了解,「天谱乐」即将推出 MidiRender 功能,它像音乐界的 ControlNet,让创作过程更可控:
创作者先确定核心创意和基础旋律——比如像《星球大战》主题曲开头那样具有标志性的动机旋律,再由 AI 协助完成歌词填充和编曲工作。