• 我的订阅
  • 科技

谷歌发布ai前沿成果,生成式ai迎来爆发

类别:科技 发布时间:2023-02-01 21:09:00 来源:浅语科技

谷歌发布全新AI模型——MusicLM。通过AI模型MusicLM,文字可以直接生成高保真的音乐。

这是继文字生成AI模型Wordcraft、视频生成工具ImagenVideo之后,谷歌又一次推出生成式AI模型工具,这一次谷歌将目标瞄准了音乐领域。

透过MusicLM,不难看到,这两年生成式AI赛道正在迎来爆发。01、MusicLM 挑战更复杂场景

谷歌发布ai前沿成果,生成式ai迎来爆发

谷歌最新推出的 AI 模型 MusicLM,可直接将文字、图像自动生成音乐,并且曲风多样,凡是想听的音乐,基本都能自动生成。

MusicLM并非是第一个可自动生成音乐的AI模型,此前,可视化AI工具Riffusion也能自动创作音乐,还有DanceDiffusion,此外,当前最热门的聊天机器人ChatGPT的研发者OpenAI也推出过Jukebox。

但值得注意的是,这些可自动生成音乐的AI系统,受限于技术和数据等因素,创作的音乐都比较简单,相对而言并不复杂。

和前辈们不同的是,MusicLM 可创作特别复杂和保真度特别高的音乐,也可通过图像生成音乐。这算是实现了全新突破,通过AI技术不仅可以识别乐器,融合音乐流派,还可以通过更抽象的概念生成音乐。

比如,想要街机游戏配乐,只要输入“街机游戏的主配乐,它节奏快且乐观”等文字,MusicLM便可自动生成音乐。MusicLM也可通过图像生成音乐,例如世界名作《呐喊》《格尔尼卡》《星空》等皆可作为素材来源。

不过,值得一提的是,目前谷歌只是发布了 MusicLM的研究成果,因为版权等问题,谷歌还未向公众开放MusicLM。02、AI生成音乐难在哪?

谷歌发布ai前沿成果,生成式ai迎来爆发

去年10月,谷歌在生成式AI模型上已经推出过AudioLM,只需输入短时音频,就能生成相似风格的音频。彼时AudioLM只是纯音频模型,这个技术类似于语言模型,根据提示的语音内容,自主判断并生成相似内容。

从这个角度看,AudioLM 可视为是 MusicLM 的前身。AudioLM在不进行转录或标记的情况下,可以模仿音频的音色、响度和清晰度等。但是,AudioLM生成的音频和原版并无太大区别,并未得到公开应用。

通过AI模型创作音乐,这件事并不容易,因为生成的音乐包括音频信号、环境声音、人的声音等多个维度,是由很多信号相互作用形成的,而人体每次向外发出的声音,无论声音响度大小、音色好差,都由句法、音律等组成,这是非常复杂的综合性系统。

也恰恰是这些原因,在早期的探索过程中,自动生成的音频合成痕迹明显,声音听起来并不自然,发音也都不标准。因此AI模型要想实现真正意义上的自动生成音频,依靠海量的数据训练和模拟,是必不可少的基础性步骤。

针对这些挑战,作为AudioLM的“升级版”,MusicLM的训练数据更加庞大。据了解,谷歌在28 万小时的音乐数据集中,才训练出 MusicLM,为理解深度和复杂的音乐场景提供了基础。

此外值得一提的是,针对任务缺乏评估数据等问题,谷歌专门引入了MusicCaps,用于文本到音乐的生成任务评估。03、生成式AI迎来爆发

谷歌发布ai前沿成果,生成式ai迎来爆发

此次谷歌推出MusicLM,可视为拓展AI应用的注脚,背后则是生成式AI赛道的爆发。事实上,生成式AI 一直是近两年最炙手可热的话题。

2021年,OpenAI相继发布了划时代的DALL-E、DALL-E2模型,实现了文本生成图像的跨越;去年,Meta发布了AI短视频生成模型Make-A-Video,同样可由文本内容生成视频;谷歌也发布了短视频AI生成模型ImagenVideo与Phenaki。

不止是国外,国内也有很多生成式AI应用。比如,字节跳动旗下剪映APP,可根据文字内容自动生成匹配的视频画面。去年初,网易推出了“网易天音”,也是一站式AI音乐创作平台,可将用户编辑的内容通过AI自动生成为歌曲。

可以看到,生成式AI 应用的场景越来越广泛,写作、绘画、剪视频等等,都可以通过AI技术实现。基于生成式AI广泛的应用前景,谷歌、微软、Meta等巨头们纷纷推进研发,将生成式AI技术融合到产品中,这加速了生成式AI赛道的爆发。

事实上,生成式AI高速发展并非是这两年的事,只是因技术门槛过高,其前沿动态一直在科技圈小范围流传。直到AI绘画、AI写作等频繁出圈,生成式AI得到了更广泛的关注。

生成式AI赛道爆发有必然原因,大数据和算法应用越来越成熟,模型工具越来越完善,这都加速了生成式AI应用的迭代。当前,生成式AI已经迎来爆发,未来还有巨大的发展潜力。根据Gartner统计数据,预计到2025年,生成式AI将占所有生成数据的10%,而目前的比例还不到1%。

当然,任何技术都是一把“双刃剑”,生成式AI 也面临着版权问题等挑战,此外还面临由AI 生成“错误”引发的各种损失,就目前来看,还离不开人为干预。但长期而言,生成式AI巨大的发展潜力已经成为共识。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-02-01 22:45:16

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

腾讯亮相 2023 世界人工智能大会 展示“科技向善”新成果
...开发的脸部表情及口型AI生成技术,基于多模态合成系统自动生成的脸部特征参数,进一步提升了游戏角色3D模型的拟真性,表现出更趋近于真实的脸部细节。魔方工作室群与高校合作,探索搭
2023-07-06 20:00:00
...能性磁共振成像(fMRI)数据,然后根据个体的大脑活动自动生成音乐。在这项研究中,研究人员招募了5名志愿者,让他们先听取包括蓝调、古典、乡村、迪斯科、嘻哈、爵士乐、金属、流行
2023-07-27 18:39:00
4000亿参数,国产大模型硬刚Llama 3?|钛媒体AGI
...模式下,天工3.0能够围绕简单指令进行相关问题的延伸,自动生成研究大纲、图谱、实践总结、思维导图等,例如,钛媒体App编辑让天工3.0研究“OpenAI发展历程”。在全网搜索
2024-04-19 16:00:00
中国首个音乐SOTA模型「天工音乐大模型」今日公测
...3.0」能够围绕用户的某个简单指令进行相关问题的延伸,自动生成研究大纲、图谱、实践总结、思维导图,帮助用户快速清晰地把握核心内容,完成用户复杂的研究需求。 (Query:康乾
2024-04-17 15:31:00
以假乱真,天工音乐大模型带来颠覆式AI体验
昨日,昆仑万维AI音乐生成大模型「天工SkyMusic」开启了免费邀测活动,诚邀媒体、行业专家以及感兴趣的音乐从业者们共同体验人声情感表达 SOTA 的音乐大模型产品
2024-04-03 11:35:00
“大模型+音乐”想象空间有多大?可自动谱词编曲,还能生成专属歌曲
...升歌曲品质、赋能音乐人成长。“比如,面向音乐音频的生成式大模型通过文本、图片、视频的输入,生成与内容相贴合的音频,未来应用到短视频的BGM创作、人声生成、伴奏生成等方向。”虚
2023-09-17 16:22:00
AI勇闯音乐圈:新玩家涌入,编曲有“套路”
...。而在音乐生成界面,用户可以自己填词,也可以进行AI自动生成歌词,但必须要填的是提示词,并可以自由选择音乐风格和自己想要的主题。4月18日,贝壳财经记者测试中选择了“灵魂爵士
2024-04-22 10:42:00
...新一代国产人工智能大模型“紫东太初”2.0问世 可理解生成音乐和视频 新华社北京6月16日电 在三维场景里实现精准定位,通过图像与声音的结合完成场景分析……中科院自动化
2023-06-17 07:40:00
谷歌发布音乐AI工具MusicFX:一句话就能生成一首音乐
...今年年初,谷歌MusicLM横空出世,可以直接将文字、图像自动生成音乐,并且曲风多样,凡是想听的音乐,基本都能自动生成。MusicLM是一个以文本为条件的音频生成模型,可以从
2023-12-14 17:26:00
更多关于科技的资讯:
鲁南眼科自有品牌「鲁南博视」光学镜片发布会暨成人验光配镜门诊一周年成功举办
鲁网1月1日讯2025年12月31日,鲁南眼科医院成功举办自有品牌「鲁南博视」光学镜片发布会暨成人验光配镜门诊一周年庆典
2026-01-02 16:41:00
新年第一天 燕赵沐朝晖|“雄安一号”星 测试太阳翼
编者按岁序更替,华章日新。2026年是“十五五”开局之年。锐始者必图其终,成功者先计于始。新年第一天,燕赵大地欣欣向荣
2026-01-02 07:05:00
注意缺陷与多动障碍 这个疾病越来越常见 都说长大就好了 为何缠上成人?
2025年12月31日凌晨,罗永浩在微博发文回应“科技春晚”发布会迟到40分钟事件,首次公开坦承自己受注意缺陷与多动障碍(ADHD)困扰多年
2026-01-02 08:06:00
近日,湘湖首部AI动画《湘湖漫游记》第五集上线,该系列作品正式收官。本片不仅是杭州湘湖(白马湖)研究院在“文化+科技”融合上的一次重要突破
2026-01-02 06:35:00
在杭州湖滨银泰in77的B区、D区之间,复古的国王十字车站、9站台出现在现场,仿佛下一秒就有巫师推着行李箱穿墙而过;一辆编号5972的霍格沃茨特快列车静静停靠在街区中央
2026-01-02 06:35:00
2025年度票房破518亿元 动画电影成亮点 安徽全国排名第十
大皖新闻讯 国家电影局2026年1月1日公布,2025年电影票房为518.32亿元,同比增长21.95%,城市院线观影人次为12
2026-01-01 17:14:00
免费抢鲜体验!香飘飘魔芋啵啵奶茶快闪体验活动空降临沂泰盛广场 健康爆款掀起跨年打卡热潮
鲁网1月1日讯 (记者 李文静)2025年12月31日晚,国民奶茶品牌香飘飘携新品“魔芋啵啵”奶茶,在山东临沂泰盛广场开启奶茶快闪体验活动
2026-01-01 15:52:00
厦门动漫嘉年华启幕 众多热门国漫IP集中参展
厦门动漫嘉年华各项活动精彩纷呈。(记者 林铭鸿 摄)厦门网讯(厦门日报记者 林露虹)展览面积超5万平方米,汇聚众多热门国漫IP
2026-01-01 08:41:00
助力低空应急产业发展——三明市应急管理局引进低空防御项目
东南网1月1日讯 2025年12月30日,由三明市应急管理局引进,南京云麒防务科技有限公司投资的福建鹏鑫智能科技有限公司
2026-01-01 09:33:00
近日,太长高速太原收费站智慧化升级改造全面完成并投入运营。项目以数字化转型为核心,围绕高峰期通行效率低、车辆拥堵等运营痛点
2026-01-01 07:17:00
沈洁任蓟州区代理区长 扫码阅读手机版
据“掌上蓟州”微信公众号消息,天津市蓟州区第二届人民代表大会常务委员会第三十五次会议决定:沈洁为天津市蓟州区人民政府代理区长。
2025-12-31 23:10:00
东南网12月31日讯(本网记者 卢金福)元旦佳节将至,消费市场迎来新一轮热潮。面对促销活动纷至沓来、消费场景多元拓展的新形势
2025-12-31 23:29:00
皖企长鑫科技向上交所递交IPO招股书
大皖新闻讯 2025年12月30日,总部位于合肥的长鑫科技集团股份有限公司(以下简称“长鑫科技”)正式向上海证券交易所递交招股书
2025-12-31 21:33:00
大河网讯 这一年,我们没有走遍世界,但世界,走进了《Global Talk》。2025年,《Global Talk》结识了来自全球近30个国家和地区的朋友——他们带着各自的故事
2025-12-31 22:33:00
近日,上药控股山东总部携手浪潮智慧建筑,构建涵盖16大智能化系统的智慧园区体系,以智慧云平台为中枢推进全要素数字化升级
2025-12-31 22:59:00