• 我的订阅
  • 科技

谷歌发布ai前沿成果,生成式ai迎来爆发

类别:科技 发布时间:2023-02-01 21:09:00 来源:浅语科技

谷歌发布全新AI模型——MusicLM。通过AI模型MusicLM,文字可以直接生成高保真的音乐。

这是继文字生成AI模型Wordcraft、视频生成工具ImagenVideo之后,谷歌又一次推出生成式AI模型工具,这一次谷歌将目标瞄准了音乐领域。

透过MusicLM,不难看到,这两年生成式AI赛道正在迎来爆发。01、MusicLM 挑战更复杂场景

谷歌发布ai前沿成果,生成式ai迎来爆发

谷歌最新推出的 AI 模型 MusicLM,可直接将文字、图像自动生成音乐,并且曲风多样,凡是想听的音乐,基本都能自动生成。

MusicLM并非是第一个可自动生成音乐的AI模型,此前,可视化AI工具Riffusion也能自动创作音乐,还有DanceDiffusion,此外,当前最热门的聊天机器人ChatGPT的研发者OpenAI也推出过Jukebox。

但值得注意的是,这些可自动生成音乐的AI系统,受限于技术和数据等因素,创作的音乐都比较简单,相对而言并不复杂。

和前辈们不同的是,MusicLM 可创作特别复杂和保真度特别高的音乐,也可通过图像生成音乐。这算是实现了全新突破,通过AI技术不仅可以识别乐器,融合音乐流派,还可以通过更抽象的概念生成音乐。

比如,想要街机游戏配乐,只要输入“街机游戏的主配乐,它节奏快且乐观”等文字,MusicLM便可自动生成音乐。MusicLM也可通过图像生成音乐,例如世界名作《呐喊》《格尔尼卡》《星空》等皆可作为素材来源。

不过,值得一提的是,目前谷歌只是发布了 MusicLM的研究成果,因为版权等问题,谷歌还未向公众开放MusicLM。02、AI生成音乐难在哪?

谷歌发布ai前沿成果,生成式ai迎来爆发

去年10月,谷歌在生成式AI模型上已经推出过AudioLM,只需输入短时音频,就能生成相似风格的音频。彼时AudioLM只是纯音频模型,这个技术类似于语言模型,根据提示的语音内容,自主判断并生成相似内容。

从这个角度看,AudioLM 可视为是 MusicLM 的前身。AudioLM在不进行转录或标记的情况下,可以模仿音频的音色、响度和清晰度等。但是,AudioLM生成的音频和原版并无太大区别,并未得到公开应用。

通过AI模型创作音乐,这件事并不容易,因为生成的音乐包括音频信号、环境声音、人的声音等多个维度,是由很多信号相互作用形成的,而人体每次向外发出的声音,无论声音响度大小、音色好差,都由句法、音律等组成,这是非常复杂的综合性系统。

也恰恰是这些原因,在早期的探索过程中,自动生成的音频合成痕迹明显,声音听起来并不自然,发音也都不标准。因此AI模型要想实现真正意义上的自动生成音频,依靠海量的数据训练和模拟,是必不可少的基础性步骤。

针对这些挑战,作为AudioLM的“升级版”,MusicLM的训练数据更加庞大。据了解,谷歌在28 万小时的音乐数据集中,才训练出 MusicLM,为理解深度和复杂的音乐场景提供了基础。

此外值得一提的是,针对任务缺乏评估数据等问题,谷歌专门引入了MusicCaps,用于文本到音乐的生成任务评估。03、生成式AI迎来爆发

谷歌发布ai前沿成果,生成式ai迎来爆发

此次谷歌推出MusicLM,可视为拓展AI应用的注脚,背后则是生成式AI赛道的爆发。事实上,生成式AI 一直是近两年最炙手可热的话题。

2021年,OpenAI相继发布了划时代的DALL-E、DALL-E2模型,实现了文本生成图像的跨越;去年,Meta发布了AI短视频生成模型Make-A-Video,同样可由文本内容生成视频;谷歌也发布了短视频AI生成模型ImagenVideo与Phenaki。

不止是国外,国内也有很多生成式AI应用。比如,字节跳动旗下剪映APP,可根据文字内容自动生成匹配的视频画面。去年初,网易推出了“网易天音”,也是一站式AI音乐创作平台,可将用户编辑的内容通过AI自动生成为歌曲。

可以看到,生成式AI 应用的场景越来越广泛,写作、绘画、剪视频等等,都可以通过AI技术实现。基于生成式AI广泛的应用前景,谷歌、微软、Meta等巨头们纷纷推进研发,将生成式AI技术融合到产品中,这加速了生成式AI赛道的爆发。

事实上,生成式AI高速发展并非是这两年的事,只是因技术门槛过高,其前沿动态一直在科技圈小范围流传。直到AI绘画、AI写作等频繁出圈,生成式AI得到了更广泛的关注。

生成式AI赛道爆发有必然原因,大数据和算法应用越来越成熟,模型工具越来越完善,这都加速了生成式AI应用的迭代。当前,生成式AI已经迎来爆发,未来还有巨大的发展潜力。根据Gartner统计数据,预计到2025年,生成式AI将占所有生成数据的10%,而目前的比例还不到1%。

当然,任何技术都是一把“双刃剑”,生成式AI 也面临着版权问题等挑战,此外还面临由AI 生成“错误”引发的各种损失,就目前来看,还离不开人为干预。但长期而言,生成式AI巨大的发展潜力已经成为共识。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-02-01 22:45:16

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

腾讯亮相 2023 世界人工智能大会 展示“科技向善”新成果
...开发的脸部表情及口型AI生成技术,基于多模态合成系统自动生成的脸部特征参数,进一步提升了游戏角色3D模型的拟真性,表现出更趋近于真实的脸部细节。魔方工作室群与高校合作,探索搭
2023-07-06 20:00:00
...能性磁共振成像(fMRI)数据,然后根据个体的大脑活动自动生成音乐。在这项研究中,研究人员招募了5名志愿者,让他们先听取包括蓝调、古典、乡村、迪斯科、嘻哈、爵士乐、金属、流行
2023-07-27 18:39:00
4000亿参数,国产大模型硬刚Llama 3?|钛媒体AGI
...模式下,天工3.0能够围绕简单指令进行相关问题的延伸,自动生成研究大纲、图谱、实践总结、思维导图等,例如,钛媒体App编辑让天工3.0研究“OpenAI发展历程”。在全网搜索
2024-04-19 16:00:00
中国首个音乐SOTA模型「天工音乐大模型」今日公测
...3.0」能够围绕用户的某个简单指令进行相关问题的延伸,自动生成研究大纲、图谱、实践总结、思维导图,帮助用户快速清晰地把握核心内容,完成用户复杂的研究需求。 (Query:康乾
2024-04-17 15:31:00
以假乱真,天工音乐大模型带来颠覆式AI体验
昨日,昆仑万维AI音乐生成大模型「天工SkyMusic」开启了免费邀测活动,诚邀媒体、行业专家以及感兴趣的音乐从业者们共同体验人声情感表达 SOTA 的音乐大模型产品
2024-04-03 11:35:00
“大模型+音乐”想象空间有多大?可自动谱词编曲,还能生成专属歌曲
...升歌曲品质、赋能音乐人成长。“比如,面向音乐音频的生成式大模型通过文本、图片、视频的输入,生成与内容相贴合的音频,未来应用到短视频的BGM创作、人声生成、伴奏生成等方向。”虚
2023-09-17 16:22:00
AI勇闯音乐圈:新玩家涌入,编曲有“套路”
...。而在音乐生成界面,用户可以自己填词,也可以进行AI自动生成歌词,但必须要填的是提示词,并可以自由选择音乐风格和自己想要的主题。4月18日,贝壳财经记者测试中选择了“灵魂爵士
2024-04-22 10:42:00
...新一代国产人工智能大模型“紫东太初”2.0问世 可理解生成音乐和视频 新华社北京6月16日电 在三维场景里实现精准定位,通过图像与声音的结合完成场景分析……中科院自动化
2023-06-17 07:40:00
谷歌发布音乐AI工具MusicFX:一句话就能生成一首音乐
...今年年初,谷歌MusicLM横空出世,可以直接将文字、图像自动生成音乐,并且曲风多样,凡是想听的音乐,基本都能自动生成。MusicLM是一个以文本为条件的音频生成模型,可以从
2023-12-14 17:26:00
更多关于科技的资讯:
□南京日报/紫金山新闻记者张甜甜 通讯员夏俊林娜10月31日,南京市统计局、国家统计局南京调查队发布南京经济“三季报”
2025-11-01 09:44:00
上海虹桥医院癫痫专病诊疗新高度:个性化方案,全程化守护
癫痫发作的不可预测性及其对记忆、情绪、社交、学业与工作等方面的深远影响,构成了广大患者面临的核心挑战。诊断的复杂、治疗方案的普适性困境以及持续管理的缺失
2025-11-01 10:05:00
第十季炒股大赛冠军诞生:光伏逆变器行业龙头涨幅登顶
在《大众证券报》读者俱乐部第十季炒股比赛中,选手“馨小憩”以159.84元/股推荐的阳光电源(300274),荐股涨幅19
2025-11-01 11:00:00
近日,国内首款真空高压铸造人形机器人腿部骨骼零部件在中信戴卡股份有限公司研制成功并生产下线,首批20件量产产品已发往国内客户
2025-11-01 11:10:00
视频制作:陈希河北新闻网讯(记者 李春炜)随着AI技术飞速发展,在今年的双十一期间,AI笔记本也成为爆款产品。近日,记者走进安徽合肥的联想PC设备研发和制造基地
2025-11-01 15:39:00
10月30日,“版权强企燕赵行”活动走进保定市高阳县。活动通过进企问需、校企对接、版权法律法规科普、版权服务平台及版权区块链平台推介等方式
2025-11-01 15:47:00
10月30日,在由盖世汽车主办的2025第七届“金辑奖”颁奖盛典上,东软集团凭借在智能汽车互联领域持续的产品创新与卓越的全球化实践
2025-11-01 16:16:00
钻戒定制怎么选?2025五大宝藏品牌全解析,一篇避坑
准备结婚选钻戒,却被天然钻的高价劝退?想入手培育钻戒,又怕遇到“参数虚标”“售后无保障”的问题?2025年培育钻石市场规模突破300亿元
2025-11-01 16:17:00
第三十七届中国仿真大会在合肥市庐阳区召开
大皖新闻讯 11月1日,第三十七届中国仿真大会在合肥市庐阳区召开,大会以“数智仿真、新质发展”为主题,吸引全国约千名学者与业界代表
2025-11-02 00:04:00
“科大讯飞1024科博展”亮点抢先看!现场黑科技拉满,免费开放
大皖新闻讯 想让AI陪你对弈吗?想穿越时空与孙悟空来场“智慧交锋”吗?第八届世界声博会暨2025科大讯飞全球1024开发者节科博展将于11月2日至6日在合肥体育中心启幕
2025-11-02 00:04:00
出海再提速!锦江酒店(中国区)宣布旗下7天酒店出海,同日签约10个项目
锦江酒店(中国区)规模化出海再次迎来关键节点。10月31日,其于深圳正式宣布,国民品牌7天酒店将进军东南亚市场。这是继今年8月底
2025-11-01 10:02:00
10月28日,亚洲国际动力传动与控制技术展览会(PTC ASIA 2025)在上海新国际博览中心启幕。近1800家海内外知名展商齐聚
2025-11-01 07:03:00
正式发布!视源股份牵头制定《娱乐用车载显示系统图像质量技术规范》团体标准
2025年10月23日,在全国音频、视频及多媒体系统与设备标准化技术委员会(SAC/TC 242)商用显示标准研究组第六次全会暨标准研讨会上
2025-10-31 08:20:00
中感集团煤仓安全综合解决方案亮相中国国际煤炭采矿展,以系统性创新重塑矿山作业安全
在北京举行的第21届中国国际煤炭采矿技术交流与设备展览会上,中感集团创新展示的“煤仓安全综合解决方案”引发行业高度关注
2025-10-31 08:51:00
人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲
2025中国国际数字经济博览会在石家庄国际会展中心开幕。科杰科技董事长于洋受邀出席2025首席数据官峰会论坛,并作主题为《人工智能产业决胜与 Data&
2025-10-31 08:51:00