1. 首页 > AI快讯

Suno V3.5 上手体验,生成音乐的门槛再一次被 AI 拉低了

这段时间,关于 Suno 的消息接二连三传来。一周前,Suno 刚刚在 X 上宣布成功完成了 1.25 亿美元的 B 轮融资,前天又发布了 Suno-V3 的进化版 Suno-V3.5。

这一版本在原来的基础上,将生成的最小片段长度扩展至 4 分钟,使创作者可以更轻松地生成完整歌曲;同时,在歌曲结构的处理上,新版本能更好地分析和构建音乐结构,使生成的音乐更加流畅自然。

这是否意味着 Suno 在改造音乐行业的路上又迈出了一大步? Suno-V3.5 的实际上手体验如何?

文章转载自公众号「数字生命卡兹克」,Founder Park 略有调整。

昨天从深圳回家,上飞机前,顺手看了一眼X,忽然看到AI音乐界的“Chatgpt” - Suno悄悄放了一个视频。

Suno可以将敲击浇水壶的声音转化为摇滚音乐—— 从任何声音创作歌曲成为了可能。

这就像AI绘画领域除了文生图以外,一个非常重要的功能就是图生图,可以基于图生图整很多的花活。带来N多的新的创作想法。

AI音频领域也是,之前suno只能文生声音,现在也开始逐渐能够由声音生成声音了,这就为AI音乐生成提供了无限的可能。

因为很多人上手AI音乐可能并不知道怎么去描述提示词,生成图片还好,至少主体内容描述还是难度不高的,但自己喜欢的歌曲风格是什么样的?只能大致说出一二,哦,是轻快的……哦,是民谣哦……

再细致的,可能就很难了。所以这个功能,非常接地气。

根据官方说法,新模型生成的长度由原来的2分钟变成了4分钟,且歌曲结构有显著优化。同时对Pro会员立刻推出,免费用户下周可用。

我们知道正常一首歌往往三四分钟,原本v3和v2的模型生成的长度很尴尬,最长只能2分钟。所以,正当你沉浸其中的时候,忽然就没了,总是有些意犹未尽。

虽然Suno偶尔可以根据你的歌词长度去做节奏的匹配,刚刚好2分钟结束的时候就唱完了。

但很多时候可能还会出现中间截止的情况,唱一半歌词还没唱完就没了,这样的话,剩下的一半怎么办?

之前Suno可以支持扩展音乐,也就是在原本的这个生成的2分钟的基础上新生成一段节奏韵律和之前非常相近的音乐,然后再把两段音乐拼起来,听着操作就非常麻烦。

麻烦倒是还好说,最重要的是,中间的过渡是硬伤。

比如我之前生成的这首歌,使用了Suno的拼接功能,你可以发现在2分钟的时候,过渡明显不自然,歌词也出现了问题。

当Suno 3.5v 可以生成4分钟的歌曲的时候,模型就有了更多的发挥空间,当然他不一定要生成4分钟的,可以生成到三分半的长度,整体体验会更加丝滑,方便,生成的歌曲也比原来更像一首完整的歌了。

所以,那必须实际上手测一下。

和大多数人一样,我文笔不太行,也不太可能在很短时间内写一个歌词,所以也得请出我们的AI朋友帮我写,想了想,就用OpenAI最新发布的Chatgpt-4o吧。

他给了这样一个歌词,还是很美的。

除了歌词,往往还需要给出音乐风格,说实话,我也不知道该以怎样的风格描述这首歌,所以,还是交给万能的AI吧。

OK,简单提取一些关键词后,万事具备。

我们进入到官网,网址在此:https://suno.com/

左侧菜单栏,第一个Home是可以查看当下热门流行的一些AI音乐,曲风,第二个Create可以进行歌曲创作,第三个Library可以查看自己历史生成的一些音乐,第四个Explore是可以探索一些有趣的曲风风格,第五个是搜索一些歌曲。

我们点击左侧菜单栏的Create。

然后开启定制模式,粘贴我们刚才生成的歌词、风格和歌曲名,选择模型。

生成速度上:

v2,v3速度差不多,大概十三秒左右。

v3.5 稍微慢一些,大概十六七秒。

总体上速度上差异不大,都蛮快的。

效果上:

v2 的感觉有点奇怪,歌曲咬字这些确实不太清晰,然后风格也有点奇怪,最后音乐时长是1分20秒。

 

但是

v3 及v3.5 生成的音乐,听到的那一瞬间,我DNA都动了!

这是v3版本,生成音乐时长2分钟。

 

这是v3.5版本,生成音乐时长3分钟。

 

其实,说实话v3、v3.5 我感觉效果上其实差不多,主要是v3本身生成质量也很高,但是v3 可以明显感觉到最后受时长限制,结束的有点仓促。

而v3.5相比结束就自然多了,缓缓淡出结束。

又尝试了一组。

v3版本。2分钟:

 

v3.5版本,3分08秒:

 

效果好太多了。

但上面的测验感觉还是太简单了。

我突然想整一些活,考验一下Suno,最近B站植物大战僵尸杂交版很火,尤其是很多大学生最近平时没事儿干就玩这个,我自己认识的几个大学生真的就在玩。

别说这个游戏本身就有点鬼畜,里面有很多好玩的植物汉堡射手,VIP至尊坚果,冰瓜大喷菇……所以我也想着能不能用 Suno 整一个鬼畜音乐!

而且这次我直接把这一坨粘贴给了他,也没有告诉他主歌,副歌怎么划分。

 

太阳花,别只是晃,阳光快到碗里来! 大蒜花,别乱引,僵尸路线要规划! 土豆雷,你快长大,前线需要你的支援! 我暴躁,我疯狂,这关怎么就过不去! 冰瓜大喷菇,冻住他们,别让僵尸前进!红眼菇,还是强,怒吼吧!伽刚特尔! 雪花寒冰菇,冷风吹,僵尸步伐要冻结!杂交版,so easy,看我无尽100波! 太阳花,别只是转,阳光快到碗里来! 大蒜花,别乱引,僵尸路线要规划! 土豆雷,你快长大,前线需要你的支援! 我暴躁,我疯狂,这关怎么就过不去! 禁忌毁灭菇,爆炸吧,僵尸全给我退散! 冰炬树桩,冷光闪耀,照亮这黑暗的夜! 汉堡射手,让僵尸尝尝,你的手艺! 杂交版,so easy,看我无尽100波! 冰车二爷,你开着冰车,怎么还加速! 三级头伽刚特尔,怎么打,也死不了! 橄榄球僵尸,冲撞不停,我的防线要崩溃!跳舞僵尸,伴舞成群,僵尸派对开起来了!冰车滑行,伽刚特尔投掷,我的脑子要被吃掉了! 我暴躁,我疯狂,这关怎么就过不去! 植物大战僵尸杂交版,我玩了一整晚, 僵尸成群,植物这么强也不够,我还是没有挺过第6波! 游戏还得继续,我要赢!

 

先看看v3的效果:

 

再看V3.5的效果:

 

除了时间增加外,3.5的音乐结构有大幅的改善,而且这内容甚至还有点逻辑。

第一个主歌都是植物,到第二个verse说不同的僵尸太难打了,然后回到副歌,然后我要赢。

如果描述僵尸很难打的部分是bridge(就是第二遍副歌之后,有的歌不是有大概4句之类的,然后再进一遍副歌),就是完美的流行歌了,不过这是词的问题了。因为词不够长。

不过也能看出来,V3.5在音乐结构上的进步。

说实话,技术的进步真的是大大降低了音乐创作的门槛。即使没有专业的音乐知识或乐器演奏技巧,我们普通人也能通过这些工具创作出高质量的音乐作品。

我觉得更重要的是,每个人都能在日常生活中可以把它用起来。

520和七夕那天,为自己的爱的人准备的一个小惊喜,或者是一个重要纪念日的留念,留下一首属于自己的独一无二的歌曲,不是一种很好的方式吗?

你说对吧。

人工通用智能(AGI)的技术力量,正以前所未有的速度重塑着产业格局,基于此 Founder Park 决定发起一场寻找中国 AGI 创新 1% 的行动:

转载联系作者并注明出处:https://www.aibox365.cn/kuaixun/6.html

联系我们

在线咨询:点击这里给我发消息

微信号:AIBox365