• 我的订阅
  • 头条热搜
AI视频进入有声时代!谷歌发布视频生成音频技术,效果惊艳网友!
...就跟了个王炸。北京时间6月18日凌晨,Google Deepmind发布了视频生成音频(Video-to-Audio,V2A)技术的进展,可以为视频创建戏剧性的背景音乐,逼真的音效,甚至是人物之间的对话。V2A技术支持为AI生成视频“配乐”,Google还特别...……更多
谷歌VideoPoet大模型上线,生成长达10秒视频,还可自动配音 | 最前线
...咏仪 尚恩Google又又又发布了新模型,这次是在文生/图生视频赛道又“卷”了一把对手们。12月19日,谷歌专门发了一款搞视频生成的模型VideoPoet,不仅能支持根据视频加入音频效果,允许交互编辑,更重要的是,VideoPoet现在可以...……更多
斯坦福AI视频生成工具免费开放!30秒时长,马斯克看了效果会沉默
一水 发自 凹非寺量子位 | 公众号 QbitAI将音频、图像、视频整合进同一工作流,这个由斯坦福初创公司发布的视频工具火了!预览版支持生成30S逼真视频,网友们直呼不输Luma。抢先看性转版马斯克激情说唱:与Luma一样,目前这...……更多
让霉霉说地道中文,背后玩家竟来自中国,7个月收入百万美元
文 | 虞景霖 尚恩编辑 | 邓咏仪最近,霉霉说地道中文的视频在全网疯传。没有机械的翻译腔,霉霉用自然而地道的语气讲述自己最近的游历,甚至连嘴型都卡点对上,效果堪称绝绝子。还没有看过视频的小伙伴们,原视频奉上...……更多
音频驱动人像视频模型:字节Loopy、CyberHost研究成果揭秘
近期,来自字节跳动的视频生成模型 Loopy,一经发布就在 X 上引起了广泛的讨论。Loopy 可以仅仅通过一张图片和一段音频生成逼真的肖像视频,对声音中呼吸,叹气,挑眉等细节都能生成的非常自然,让网友直呼哈利波特的魔...……更多
500字的文稿30秒即可生成音频文件 加快培育媒体新质生产力 国家(杭州)短视频基地揭牌
国家(杭州)短视频基地设计效果图4月26日,由中央广播电视总台与浙江省人民政府联合共建的国家(杭州)短视频基地在杭州揭牌。移动互联网时代,短视频已成为传输信息资讯的新媒介、记录日常生活的新窗口、塑造社会...……更多
Sora刷屏 标贝科技AI配音为音视频内容创作插上翅膀
...技网】新年伊始,OpenAI 扔出一枚重磅炸弹——发布文生视频模型 Sora。作为一款全新生成式人工智能模型, Sora能够根据文本指令创造出既逼真又富有想象力的场景,生成多种风格、不同画幅、最长为一分钟的高清视频。从OpenAI ...……更多
Meta版Sora深夜横空出世,小扎放出16秒高清大片!92页论文曝光技术细节,Llama 3架构立功
...刚惊艳来袭。Movie Gen可生成1080p、16秒、每秒16帧的高清长视频,还能生成音效、编辑视频、上传图像生成个性化视频。甚至Meta还放出了92页论文,模型架构、训练细节一并公开,干货满满!毫无预兆地,Meta版Sora——Movie Gen,就...……更多
AI音频“扛把子”刚上谷歌V2A,第一个视频+音频全自动AI工具,完全开源免费
这几天的视频生成AI一经推出就好评不断。无论是Runaway新模型Gen-3 Alpha,还是Luma AI推出的Dream Machine,都有着逼真的画面、多样的电影叙事手法,艺术气息拉满。目前最顶尖的工具如Sora生成的视频都是没有声音的,而声音是让AI...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...不止ChatGPT一个,光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta、DeepMind和谷歌等为核心,发了不少达到SOTA的模型。这不,立刻...……更多
首发根据音频生成 4K 分辨率 1 小时长视频,复旦、百度联手打造
...s 的基础上,相比上一代 Hallo 模型的效果更好,支持了长视频生成,通过引入数据增强方法如 patch-drop 和高斯噪声,有效提高了长时间视频的视觉一致性和时间连贯性。 Hallo2 还结合了向量量化生成对抗网络和时间对齐技术,保...……更多
雷军将网友“骂”了整整七天!AI声音诈骗防不胜防?
...国庆期间,小雷的抖音首页几乎被雷军的AI语音包刷屏。视频中的“雷军”用熟悉的口音带着些许不耐烦的语气,戏谑地吐槽:“这游戏做成这样,绝对是来捣乱的!”由于这些用词与雷军本人十分相似,评论区也常有人问到:...……更多
Sora概念盘中拉升,字节跳动或将与OpenAI短兵相接
...字节跳动旗下火山引擎在深圳举办AI创新巡展,发布豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型,面向企业市场开启邀测。火山引擎总裁谭待表示,“视频生成有很多难关亟待突破。豆包两款模型会持续演进,在解决...……更多
Sora这就落伍了?Meta“最强视频模型”不用DiT,用Llama大力出奇迹了
...因质量问题而导致难产的节骨眼,Meta毫不客气发了它的视频模型“Movie Gen”,并直接用一个完整的评测体系宣告自己打败了Sora们。而且更狠的是,Meta还“杀人诛心”,虽然这模型目前和Sora一样还没对外开放,但它把新模型的95...……更多
...公司推出一部新剧《真相捕捉》,讲述了一群人通过篡改视频、伪造证据的方式,栽赃嫁祸他人,剧中这些做法便是借助深度伪造技术实现的。深度伪造的技术特点深度伪造(Deepfake)由深度学习(deep learning)和伪造(fake)两...……更多
《2023人工智能赋能网络视听产业观察报告》在青发布
...工智能赋能网络视听产业观察报告》。《报告》围绕综合视频、短视频、网络直播和网络音频四种视听形态梳理了2023年人工智能赋能网络视听创新应用的典型案例,以及人工智能相关法规政策与行业规范发布情况,并探讨了行...……更多
第三代骁龙8技术规格解析 手游进入240帧时代
...、6400万像素+3600万像素或者三个3600万像素镜头同时进行视频拍摄。边录边拍支持8K视频拍摄同时进行6400万像素照片拍照,慢动作拍照能够进行4K分辨率120帧慢动作。支持HDR10/HDR10+/HDRVivid/杜比Vision。语义分割技术得到了进化,能...……更多
以假乱真,天工音乐大模型带来颠覆式AI体验
...0秒44100Hz 采样率双声道立体声歌曲。这套模型架构在处理视频、音频和音乐领域效果极佳。昆仑万维团队也将在后续逐步迭代和添加新的能力,让模型具备多模态的情感理解与表达能力。 「天工SkyMusic」具有以下五大特点:1. ...……更多
谷歌发布ai前沿成果,生成式ai迎来爆发
...直接生成高保真的音乐。这是继文字生成AI模型Wordcraft、视频生成工具ImagenVideo之后,谷歌又一次推出生成式AI模型工具,这一次谷歌将目标瞄准了音乐领域。透过MusicLM,不难看到,这两年生成式AI赛道正在迎来爆发。01、MusicLM ...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
人工智能(AI)巨头OpenAI又出王炸,其最新推出的文生视频大模型Sora因其“逼真”和“富有想象力”被广泛赞誉,其生成视频可达60秒也颠覆了传统视频生成领域平均只有4秒的视频生成长度。OpenAI官网介绍,Sora是一种扩散模型...……更多
AI降低了创作门槛,但没到“人人当导演”阶段
...,需要在没有版权争议的条件下去生成。“客户有部分的视频,会使用到演员配音,在获得授权的前提下,可以快速生成AI语音,不需要再考虑配音演员的档期等问题,也会节约制作成本及时间。”他认为,一旦技术取得突破性...……更多
AI生成假视频冲击印度大选,成本只要5万多!专家:为全球敲响警钟
...的团队只需要3天时间就可制作一个足够以假乱真的选举视频,为自己支持的政党造势。而造假的总成本只需要60万卢比(约合人民币5.22万元)。更有甚者,如果对质量要求不高,几分钟就能生成一个抹黑对手的假视频。AI生成的...……更多
趣丸科技副总裁兼CTO谢睿:多模态智能激发应用新场景 | 新质生产力·AI Partner大会
...人工智能可以像人类一样感知和理解音频、文本、图像、视频等多种模态信息,并与人类进行更加自然高效的交互,展现出了强大的功能和广泛的商业应用前景。 多模态能力是实现通用人工智能的重要路径之一,也是趣丸科技...……更多
遥遥领先?苹果iOS18变化爆料汇总,网友:并不看好
...之间可以通过iMessage(信息)进行聊天,可以发送照片、视频、音频、表情包、以及一些额外的功能。但是对方不是iOS用户,则只能通过传统的短信进行沟通,所以iOS18中带来了RCS,这是一种跨平台通讯标准。简单来说就是让iPhon...……更多
用AI“复活”已故亲人 能否慰藉思念?
...上,消费者花费数十元至数千元,将已故亲人的照片、音视频等发给商户,就能得到一段让其“鲜活起来”——有微表情乃至开口说话的视频。有人说,用AI“复活”逝者是对亲情的寄托;有人质疑,这样的技术手段存在安全隐...……更多
万兴科技AIGC概念迷雾:60秒文生视频能力遭质疑,开月薪10万招AI人才
图源:天幕文生样板视频截图Sora爆火两月之后,国内迅速有A股上市公司做出跟进,推出同样具备文生视频能力的多媒体大模型。4月28日,A股数字创意软件龙头万兴科技(300624.SZ)旗下天幕大模型开启公测。据万兴科技此前介...……更多
MediaTek天玑9300发布:开创全大核计算时代的旗舰5G芯片
...。它集成了旗舰级ISP影像处理器Imagiq 990,支持AI语义分割视频引擎,可以进行16层图像的语义分割,实时对捕捉到的画面色彩、纹理、噪点以及亮度进行逐帧优化,从而使视频录制的画面更明亮、锐利且细节更丰富。借助景深和...……更多
虚拟和现实世界已分不清!OpenAI首个AI视频模型发布:60秒视频全AI生成
OpenAISora宣传视频(00:59)“一名时尚女子走在充满霓虹灯和广告牌的标志性东京街头,她穿着黑色皮夹克、红长裙和黑靴子,拎着黑色手袋,戴着太阳镜,涂着红色口红,走路自信又随意。街道潮湿且反光,在灯光映射下形成镜面...……更多
3亿人都在听的喜马拉雅有没有新逻辑?
当市场对在线音频选择性忽略,只关心抖音和视频号的流量战争、B站到底什么时候做贴片广告、小红书商业化落地情况怎么样了,流量主阵地始终在视频和图文反复横跳时,已经有3亿中国人偷偷在喜马拉雅听书很久了。他们在...……更多
Adobe神级AI视频媲美Sora!拖拽一键秒生大片,最强PS震撼设计圈
...元导读】作为后期行业大哥级的存在,Adobe终于让Firefly AI视频功能从期货变现实了!视频中任何缺失部分,AI一键解决,效果已能媲美Runway和Sora。与此同时,经过全面升级的史上最强PS也来了。Adobe全面进军AI生成领域!就在2024...……更多
更多关于科技的资讯:
豪爵tr300plus旅行版上市,3个版本可选
10月25日消息,据豪爵摩托公众号,豪爵TR300Plus旅行版摩托车现已正式上市,该车共推出3个版本可选,IT之家整理价格信息如下
2024-10-25 18:26:00
山东高速集团“ETC智慧终端项目”入选全国交通行业数字化转型优秀案例
近日,第二届中国数字交通创新发展大会在成都召开,大会公布了“交通行业数字化转型优秀案例”获奖名单,山东高速信联科技股份有限公司《ETC智慧终端设备的开发与应用》在参评的400余项案例中脱颖而出
2024-10-25 18:26:00
scout发布全尺寸皮卡/suv,可选纯电、增程两种动力
10月25日消息,被大众汽车“复活”的美国汽车品牌Scout当地时间周四发布了两款预热已久的新车——全尺寸皮卡/SUV
2024-10-25 18:26:00
现代rn24概念车亮相,比ioniq5n更小、更实惠
10月25日消息,汽车媒体Drive今天(10月25日)发布博文,报道称现代(Hyundai)公司展示了全新的RN24概念车
2024-10-25 18:27:00
老外被《黑神话:悟空》文化输出 王灵官竖中指实为道教手诀
近日,一位国外玩家在Reddit上发帖表示,在《黑神话:悟空》游戏中的章节末壁画上发现了疑似“竖中指”的手势,该玩家描述道
2024-10-25 18:27:00
补齐短板!保时捷扩充中国研发团队 新增智驾与智能座舱部门
快科技10月25日消息,据媒体报道,保时捷正致力于加强其在中国的研发实力,特别是在智能座舱和ADAS高级辅助驾驶技术方面
2024-10-25 18:27:00
全球首例AI机器人致死案发生:14岁美国少年丢掉性命
快科技10月25日消息,人工智能(AI)无疑是这两年以来世界范围内最火爆的议题,不过科技是把双刃剑,有进步,自然也会带来威胁
2024-10-25 18:27:00
小米澎湃os2官宣:全新的系统内核,焕新登场
10月25日消息,小米15系列暨小米澎湃OS2新品发布会已官宣10月29日19:00举行,官方今日继续对澎湃OS2进行预热
2024-10-25 18:28:00
日本芯片制造商小池淳义:2nm制程计划建设更为先进
10月25日消息,据日本共同社、《日本经济新闻》当地时间昨日报道,日本先进芯片制造商Rapidus社长小池淳义称,若2nm制程量产顺利计划建设更为先进的1
2024-10-25 18:28:00
小米官宣双区洗双洗烘洗衣机,配备了双洗烘系统
10月25日消息,小米官宣了一款全新洗衣机产品——米家双区洗双洗烘洗衣机,即日起正式开启预约,将在小米15系列发布会上正式亮相
2024-10-25 18:29:00
anthropic推出全新分析工具
10月25日消息,科技媒体NeoWin昨日(10月24日)发布博文,报道称Anthropic公司在更新Claude3.5Sonnet并推出全新的Claude3
2024-10-25 18:30:00
绿联自研nas系统ugospro10月更新
10月25日消息,绿联官方今日公布了绿联NAS私有云UGOSPro系统10月更新详情。据IT之家报道,今年5月23日,绿联科技发布了全新自研NAS系统UGOSPro
2024-10-25 18:30:00
阿里巴巴达摩院开源coi-agent的 AI 工具
10月25日消息,阿里巴巴达摩院本月开源了一款名为 CoI-Agent的AI工具,旨在帮助科研人员自动生成科研想法。这款工具通过输入特定的论文主题
2024-10-25 18:32:00
微软copilot按键更新3.2161
10月25日消息,微软公司昨日(10月24日)发布新闻稿,面向Windows1124H2设备推送KB5044384非安全可选更新
2024-10-25 18:33:00
荣耀全新发布的 Magic7 系列手机开箱分享
今天IT之家为大家开箱荣耀全新发布的Magic7系列手机。我们这里先卖个关子,大家从包装附带的手机壳配色,能否对真机的两款配色有所猜测
2024-10-25 18:35:00