• 我的订阅
  • 头条热搜
stabilityai推出stableaudioopen
...6日消息,StabilityAI立足StableDiffusion文生图模型,进一步向音频领域拓展,推出了StableAudioOpen,可以基于用户输入的提示词,生成高质量音频样本。StableAudioOpen最长可以创建47秒的音乐,非常适合鼓点、乐器旋律、环境音和拟声音...……更多
AI音频“扛把子”刚上谷歌V2A,第一个视频+音频全自动AI工具,完全开源免费
...动输入的提示词直接为视频配音。没过几小时,另一个AI音频克隆“扛把子”ElevenLabs就发布了文字到音频模型的API,并基于这一API做了一个Demo应用。这是当前唯一一个全自动将视频与音频相结合的AI工具,且完全开源、免费在线...……更多
谷歌VideoPoet大模型上线,生成长达10秒视频,还可自动配音 | 最前线
...一款搞视频生成的模型VideoPoet,不仅能支持根据视频加入音频效果,允许交互编辑,更重要的是,VideoPoet现在可以生成更长的视频了。简而言之,这次的模型看起来更加全能了。看过Demo后的网友们直接表示:好牛,所以什么时...……更多
万兴科技AIGC概念迷雾:60秒文生视频能力遭质疑,开月薪10万招AI人才
...”;阿里智能计算研究所也推出过EMO,也仅支持用照片和音频生成唱歌视频。那么,作为国内第一批宣称拥有60秒AI视频生成的公司,万兴科技到底成色几何?视频生成效果不及预期?天幕开放公测后,时代财经第一时间做出试...……更多
...划在今年内正式推向公众。此外,OpenAI还计划为Sora加入音频生成功能,进一步丰富视频的场景和情感表达。 而今Pika融资更重要的意义,或许在于市场的认可。王鹏称,这显示了资本市场对文生视频技术的强烈兴趣和投资意愿...……更多
deepmind公布ai为无声视频生成背景音乐
...生成无限数量的音轨,还能够通过提示词内容判断生成的音频“正向性”或“反向性”,从而令生成的声音更贴近某些特定场景。展望未来,DeepMind表示研究人员正进一步优化这款“video-to-audio”模型,计划未来能够让模型直接...……更多
4000亿参数,国产大模型硬刚Llama 3?|钛媒体AGI
...型;4000亿参数、全球最大规模的开源MOE大模型。首先谈音频模型。据美国风投机构a16z上月发布的生成式AI产品Top 100报告,ChatGPT、Gemini等通用内容生产应用仍占据消费级AI应用大头。与6个月前的排名相比,有两个新类别首次进入...……更多
第三届美图影像节发布6款产品 开启“AI工作流”新阶段
...用美图自研DiT技术架构,涵盖图像大模型、视频大模型、音频大模型和文本大模型,拥有更好的扩展性与更大的参数量,在语义理解、画面稳定性、动态连续性、主体一致性、内容可控性以及生成时长等方面,获得全方位提升。...……更多
AI视频进入有声时代!谷歌发布视频生成音频技术,效果惊艳网友!
...王炸。北京时间6月18日凌晨,Google Deepmind发布了视频生成音频(Video-to-Audio,V2A)技术的进展,可以为视频创建戏剧性的背景音乐,逼真的音效,甚至是人物之间的对话。V2A技术支持为AI生成视频“配乐”,Google还特别强调了官...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...AI技术为基础的多媒体创作垂类大模型,由视频大模型、音频大模型、图片大模型、语言大模型组成,聚焦数字创意垂类创作场景。2月2日,万兴科技在互动平台表示,天幕大模型主要基于公司在数字创意领域二十年的产品开发...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta、DeepMind和谷歌等为核心,发了不少达到SOTA的模型。这不,立刻有学者写了篇论文,...……更多
谷歌发布音乐AI工具MusicFX:一句话就能生成一首音乐
...音乐,基本都能自动生成。MusicLM是一个以文本为条件的音频生成模型,可以从文本描述中生成高保真的音乐。该模型采用层次化的序列到序列的方法,这使它能够生成几分钟内一致的音乐。MusicLM使用三种模型来提取作为条件自...……更多
音乐社交还能怎么玩 Soul App以AIGC创新互动想象
...了自研的个性化音乐创作引擎“伶伦”,具备业内领先的音频深度学习能力。基于该引擎,Soul于2023年上线了“Soul次元歌手”活动,帮助每个人打造自己的AI歌手分身,让很多热爱音乐但不一定会唱歌的人,也能实现“唱歌自由...……更多
全面进化的骁龙,打响端侧AI时代的发令枪
...持设备端运行参数量超过130亿的大模型。第一代S7及S7Pro音频平台是首款支持高通扩展个人局域网(XPAN)技术和超低功耗Wi-Fi连接的音频平台,相比前代平台,AI性能提升达近100倍,计算性能提升达6倍,能够在家庭、楼宇或园区...……更多
...官米拉·穆拉蒂(Mira Murati)介绍,GPT-4o可以接收文本、音频和图像的任意组合作为输入,并实时生成文本、音频和图像的任意组合进行输出,其中“o”代表“omni全能”。一直以来,多模态人机交互便是AI领域重点研究发力方向...……更多
AIGC音乐的中场战事:从技术、产品到商业规则
...绍了他们最新的AIGC音乐生成模型Lyria。相较于AI生成对话音频,AI音乐模型需要“同时生成声音的长序列”,难点在于“保持音乐在听感上的连续性”。这一全新的AI模型更加成熟,见长于“用乐器和人声生成高质量音乐、完成包...……更多
Sora冲击波 抢人“饭碗”促生新职业?
...字人”是腾讯智影最核心的功能,用户只需要输入文本或音频内容,几分钟内即可生成数字人播报视频。腾讯智影还接入了数字人直播,智影数字人可以直接替代真人,实现7×24小时不间断开播。字节跳动同样正在加码AI视频领...……更多
AI 爆改《蟑螂药》,实操过程仅需一句话
...耳熟能详的段子被爆改成音乐,能发生些什么?用AI生成音频的流程和步骤,是不是和文生内容的一样?这篇文章,我们来看下作者的分享。想必你也被响彻大街小巷的《蟑螂药》广告词和它那魔性的旋律洗脑,听完久久萦绕在...……更多
趣丸科技副总裁兼CTO谢睿:多模态智能激发应用新场景 | 新质生产力·AI Partner大会
...趣丸科技在人工智能方面的最新探索成果,以及赋能智能音频和数字安全方面的一些思考。首先,请允许我简单介绍一下趣丸科技。我们是一家成立于2014年的国家高新技术企业,可能有些朋友对我们的兴趣社交产品TT语音和TT电...……更多
Sora为何没能诞生在中国?
...看到世界上的种种物理现象。OpenAI一定会在文本、图像、音频、视频等多模态领域发展。视频是发展多模态最重要的一步,包含了世界运转的基本规律。”Sora生成的视频效果仍令刘子纬感到震撼。刘子纬3年前便开始研究AI视频...……更多
文博会观察:大模型为文化产业发展提供新机遇
...栈式AI交互技术产业生态,聚焦生成式3D大模型、生成式音频大模型、生成式动作大模型与对话大模型的自研和规模化落地。当前,大模型在文化产业中的落地应用正在加速探索,但面临训练数据存在局限性,版权问题还未妥善...……更多
...表示,相比单模态,多模态大模型同时处理文本、图片、音频以及视频等多类信息,与现实世界融合度高,更符合人类接收、处理和表达信息的方式,与人类交互方式更加灵活,表现得更加智能,能够执行更大范围的任务,有望...……更多
Pika、阿里同日炫技!国产视频大模型奋起直追
...形同步功能Lip sync,可以为视频中的人物说话匹配口型,音频生成部分由AI语音克隆创企ElevenLabs提供技术支持。而就在同一天,阿里推出更炸裂的视频生成框架EMO(Emote Portrait Alive)。两者都有对口型的功能,相比较而言,目前...……更多
谷歌发布ai前沿成果,生成式ai迎来爆发
...,谷歌在生成式AI模型上已经推出过AudioLM,只需输入短时音频,就能生成相似风格的音频。彼时AudioLM只是纯音频模型,这个技术类似于语言模型,根据提示的语音内容,自主判断并生成相似内容。从这个角度看,AudioLM 可视为是...……更多
人工智能热度攀升市场广阔
...业带来了更多可能。文生视频模型Sora相比其他大模型,生成的视频足够长,真实性更高,是制作高质量视频的得力助手。中信证券在研报中称,Sora模型有望加速文生视频应用在各行业的渗透率。据其测算,到2025年,国内文生视...……更多
你的下一个美少女偶像何必是真人 娱乐圈AIGC要内测了
...要开启内测了。最新消息,丝芭传媒旗下酝酿已久的AIGC生成工具APP“鹦鹉人”,将在6月26日启动技术测试,其核心产品——图形化智能社交基座美踏元宇宙也即将开放首轮用户内测。官方信息显示,鹦鹉人和美踏元宇宙是丝芭...……更多
Sora冲击波
...技术不仅涉及文本到图像的转换,还需要处理时序信息和音频同步。这需要复杂的深度学习模型,如生成对抗网络(GANs)和变分自编码器(VAEs)等,以捕捉视频中的动态变化和细节。不过OpenAI也承认,目前Sora还存在着一定的短...……更多
stabilityai发布sd3medium开源模型
...详情。StabilityAI还表示计划在未来将其产品扩展到视频和音频生成领域。提示词如下:Aphotographofan18-year-oldJapanesewomanhitchhiking,holdingacardboardsignthatreads\'東京駅まで\'(ToTokyoStation)……更多
不够惊艳?还是更务实?谷歌对上OpenAI,能否打好翻身...
...最新多模态大模型GPT-4o(o代表omini,全能),支持文本、音频和图像的任意组合输入,并生成文本、音频和图像的任意组合输出,可实现人类级别响应。从已有的演示视频来看,谷歌AI助手的回应速度似乎比GPT-4o稍慢一些,语音...……更多
以假乱真,天工音乐大模型带来颠覆式AI体验
...探索方向中,“情感AGI”的重要意义。相比文本和图片,音频内容是理解人类情感最好的方式,而音乐又是人类情感表达最充沛、最不受地域和文化限制的内容载体,不论时代变幻,不论是战争还是灾祸,人们总是能通过音乐传...……更多
更多关于科技的资讯:
iQOO Neo9S Pro+评测:电竞爱好者的绝佳选择
????iQOO Neo9S Pro+终于在7月11日19:00的北京环球度假区震撼发布!这款备受期待的电竞神机是否真的如传闻般令人兴奋
2024-07-13 09:36:00
一加Ace 3 Pro电池评测:原神启动 榨干冰川
【CNMO科技】就像人们希望“光吃不胖”一样,对于手机电池续航的要求,也是既要轻薄,又要持久 。而在电池技术没有大突破的当下
2024-07-13 09:36:00
电脏声燥的救赎:PLiXiR Elite BAC 3000 平衡式电源处理器试用报告
"视听漂流活动"是本刊与厂商联合提供足不出户的线下试听活动,旨在让您在家即可享受到品质优秀的视听产品。今年3月,我们携手先声音响有限公司
2024-07-13 09:37:00
音响系统的声音提升器与潜质挖掘机:PLiXiR净源ELITE BAC 1500 电源处理器试用报告
"视听漂流活动"是本刊与厂商联合提供足不出户的线下试听活动,旨在让您在家即可享受到品质优秀的视听产品。今年3月,我们携手先声音响有限公司
2024-07-13 09:37:00
华科大首次为本科生设立自然科学创新基金,入选项目将最高获得5万元科研经费
“诞生之初的宇宙究竟什么样?”“如何解决高性能芯片的散热、热膨胀问题?”“我们实现了具有四个独立通道的复振幅波导全息成像”……近日
2024-07-13 09:40:00
物理学家利用圆形里德堡量子比特实现量子模拟里程碑
被困在光镊中的圆形里德堡锶原子的插图。图片来源:Aaron Götzelmann,斯图加特大学来自斯图加特大学第五物理研究所的一组研究人员通过克服一个基本限制
2024-07-13 09:40:00
科学家首次使用确定性单光子源实现城际量子密钥分发
使用来自半导体量子点 (QD) 的单光子在“下萨克森量子链路”上的城际 QKD 实验概述。a 汉诺威(爱丽丝)和布伦瑞克(鲍勃)之间的量子比特分布在79公里的已部署光纤上
2024-07-13 09:42:00
科学家在新型晶体薄膜中观察到创纪录的电子迁移率
研究人员已经培育出三元四镁的薄膜(如图所示),这些薄膜表现出创纪录的高电子迁移率。图片来源:由研究人员提供;由麻省理工学院新闻编辑具有高电子迁移率的材料就像没有交通的高速公路
2024-07-13 09:42:00
研究人员正在使量子传感工具更加紧凑和准确,以取代GPS
基础物理学——更不用说量子物理学了——对许多人来说可能听起来很复杂,但它实际上可以应用于解决日常问题。想象一下导航到一个陌生的地方
2024-07-13 09:43:00
科学家首次以神奇的3D方式重建猛犸象染色体
一块皮肤碎片在永久冻土层中埋藏了52000年,给了我们一个奇妙的世界。这是一头长毛猛犸象(Mammuthus primigenius)留下的
2024-07-13 09:44:00
鹰瞳科技:万语大模型通过国家深度合成服务算法备案 打造智能健康助手助力行业发展
近日,国家互联网信息办公室发布第六批深度合成服务算法备案信息公告,鹰瞳科技(2251.HK)万语大模型算法顺利通过该备案
2024-07-13 09:44:00
人形机器人组团“十八金刚”各类AI助手工具百花齐放
2024世界人工智能大会上,展馆入口处有“十八金刚 众创未来——人形机器人先锋阵列”。小朋友在展会现场与机器人“元萝卜”下象棋
2024-07-13 09:49:00
AI老师上线?专家:通用人工智能将推动教育范式转变
作为大模型落地的最佳场景之一,教育+AI的应用及探索频繁出现在教育企业产品中。7月12日,《每日经济新闻》记者在粉笔(HK02469
2024-07-13 09:49:00
打造全国首个商业航天科研生产基地!北京开建火箭大街
北京火箭大街近日在亦庄新城空天街区启动建设。作为亦庄空天街区的核心节点,北京火箭大街将建设共性技术平台、高端制造中心、创新研发中心
2024-07-13 09:51:00
你的手机为什么比别人的寿命短?充电要到100%?很多人都做错了
使用手机时,你是否也有这些疑虑?电量非得100%才放心?睡前关机能延长手机寿命?WiFi名加“5G”网速就能飙升?今天
2024-07-13 09:52:00