• 我的订阅
  • 头条热搜
AI视频进入有声时代!谷歌发布视频生成音频技术,效果惊艳网友!
...就跟了个王炸。北京时间6月18日凌晨,Google Deepmind发布了视频生成音频(Video-to-Audio,V2A)技术的进展,可以为视频创建戏剧性的背景音乐,逼真的音效,甚至是人物之间的对话。V2A技术支持为AI生成视频“配乐”,Google还特别...……更多
谷歌VideoPoet大模型上线,生成长达10秒视频,还可自动配音 | 最前线
...咏仪 尚恩Google又又又发布了新模型,这次是在文生/图生视频赛道又“卷”了一把对手们。12月19日,谷歌专门发了一款搞视频生成的模型VideoPoet,不仅能支持根据视频加入音频效果,允许交互编辑,更重要的是,VideoPoet现在可以...……更多
斯坦福AI视频生成工具免费开放!30秒时长,马斯克看了效果会沉默
一水 发自 凹非寺量子位 | 公众号 QbitAI将音频、图像、视频整合进同一工作流,这个由斯坦福初创公司发布的视频工具火了!预览版支持生成30S逼真视频,网友们直呼不输Luma。抢先看性转版马斯克激情说唱:与Luma一样,目前这...……更多
让霉霉说地道中文,背后玩家竟来自中国,7个月收入百万美元
文 | 虞景霖 尚恩编辑 | 邓咏仪最近,霉霉说地道中文的视频在全网疯传。没有机械的翻译腔,霉霉用自然而地道的语气讲述自己最近的游历,甚至连嘴型都卡点对上,效果堪称绝绝子。还没有看过视频的小伙伴们,原视频奉上...……更多
音频驱动人像视频模型:字节Loopy、CyberHost研究成果揭秘
近期,来自字节跳动的视频生成模型 Loopy,一经发布就在 X 上引起了广泛的讨论。Loopy 可以仅仅通过一张图片和一段音频生成逼真的肖像视频,对声音中呼吸,叹气,挑眉等细节都能生成的非常自然,让网友直呼哈利波特的魔...……更多
500字的文稿30秒即可生成音频文件 加快培育媒体新质生产力 国家(杭州)短视频基地揭牌
国家(杭州)短视频基地设计效果图4月26日,由中央广播电视总台与浙江省人民政府联合共建的国家(杭州)短视频基地在杭州揭牌。移动互联网时代,短视频已成为传输信息资讯的新媒介、记录日常生活的新窗口、塑造社会...……更多
国产AI可以拍微电影了!4K、60帧高清画质,自带音效
国产AI,正式把视频生成拉进了有声电影时代。自从Sora引爆视频生成之后,基本上所有AI生成的视频都属于“默片”的效果,也就是没有对应的音效(注意不是配乐)。但现在,音效是可以直接自带了!而且还是4K、60帧高清画...……更多
Sora刷屏 标贝科技AI配音为音视频内容创作插上翅膀
...技网】新年伊始,OpenAI 扔出一枚重磅炸弹——发布文生视频模型 Sora。作为一款全新生成式人工智能模型, Sora能够根据文本指令创造出既逼真又富有想象力的场景,生成多种风格、不同画幅、最长为一分钟的高清视频。从OpenAI ...……更多
Meta版Sora深夜横空出世,小扎放出16秒高清大片!92页论文曝光技术细节,Llama 3架构立功
...刚惊艳来袭。Movie Gen可生成1080p、16秒、每秒16帧的高清长视频,还能生成音效、编辑视频、上传图像生成个性化视频。甚至Meta还放出了92页论文,模型架构、训练细节一并公开,干货满满!毫无预兆地,Meta版Sora——Movie Gen,就...……更多
AI音频“扛把子”刚上谷歌V2A,第一个视频+音频全自动AI工具,完全开源免费
这几天的视频生成AI一经推出就好评不断。无论是Runaway新模型Gen-3 Alpha,还是Luma AI推出的Dream Machine,都有着逼真的画面、多样的电影叙事手法,艺术气息拉满。目前最顶尖的工具如Sora生成的视频都是没有声音的,而声音是让AI...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...不止ChatGPT一个,光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta、DeepMind和谷歌等为核心,发了不少达到SOTA的模型。这不,立刻...……更多
首发根据音频生成 4K 分辨率 1 小时长视频,复旦、百度联手打造
...s 的基础上,相比上一代 Hallo 模型的效果更好,支持了长视频生成,通过引入数据增强方法如 patch-drop 和高斯噪声,有效提高了长时间视频的视觉一致性和时间连贯性。 Hallo2 还结合了向量量化生成对抗网络和时间对齐技术,保...……更多
雷军将网友“骂”了整整七天!AI声音诈骗防不胜防?
...国庆期间,小雷的抖音首页几乎被雷军的AI语音包刷屏。视频中的“雷军”用熟悉的口音带着些许不耐烦的语气,戏谑地吐槽:“这游戏做成这样,绝对是来捣乱的!”由于这些用词与雷军本人十分相似,评论区也常有人问到:...……更多
Sora概念盘中拉升,字节跳动或将与OpenAI短兵相接
...字节跳动旗下火山引擎在深圳举办AI创新巡展,发布豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型,面向企业市场开启邀测。火山引擎总裁谭待表示,“视频生成有很多难关亟待突破。豆包两款模型会持续演进,在解决...……更多
Sora这就落伍了?Meta“最强视频模型”不用DiT,用Llama大力出奇迹了
...因质量问题而导致难产的节骨眼,Meta毫不客气发了它的视频模型“Movie Gen”,并直接用一个完整的评测体系宣告自己打败了Sora们。而且更狠的是,Meta还“杀人诛心”,虽然这模型目前和Sora一样还没对外开放,但它把新模型的95...……更多
...公司推出一部新剧《真相捕捉》,讲述了一群人通过篡改视频、伪造证据的方式,栽赃嫁祸他人,剧中这些做法便是借助深度伪造技术实现的。深度伪造的技术特点深度伪造(Deepfake)由深度学习(deep learning)和伪造(fake)两...……更多
《2023人工智能赋能网络视听产业观察报告》在青发布
...工智能赋能网络视听产业观察报告》。《报告》围绕综合视频、短视频、网络直播和网络音频四种视听形态梳理了2023年人工智能赋能网络视听创新应用的典型案例,以及人工智能相关法规政策与行业规范发布情况,并探讨了行...……更多
第三代骁龙8技术规格解析 手游进入240帧时代
...、6400万像素+3600万像素或者三个3600万像素镜头同时进行视频拍摄。边录边拍支持8K视频拍摄同时进行6400万像素照片拍照,慢动作拍照能够进行4K分辨率120帧慢动作。支持HDR10/HDR10+/HDRVivid/杜比Vision。语义分割技术得到了进化,能...……更多
以假乱真,天工音乐大模型带来颠覆式AI体验
...0秒44100Hz 采样率双声道立体声歌曲。这套模型架构在处理视频、音频和音乐领域效果极佳。昆仑万维团队也将在后续逐步迭代和添加新的能力,让模型具备多模态的情感理解与表达能力。 「天工SkyMusic」具有以下五大特点:1. ...……更多
谷歌发布ai前沿成果,生成式ai迎来爆发
...直接生成高保真的音乐。这是继文字生成AI模型Wordcraft、视频生成工具ImagenVideo之后,谷歌又一次推出生成式AI模型工具,这一次谷歌将目标瞄准了音乐领域。透过MusicLM,不难看到,这两年生成式AI赛道正在迎来爆发。01、MusicLM ...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
人工智能(AI)巨头OpenAI又出王炸,其最新推出的文生视频大模型Sora因其“逼真”和“富有想象力”被广泛赞誉,其生成视频可达60秒也颠覆了传统视频生成领域平均只有4秒的视频生成长度。OpenAI官网介绍,Sora是一种扩散模型...……更多
AI降低了创作门槛,但没到“人人当导演”阶段
...,需要在没有版权争议的条件下去生成。“客户有部分的视频,会使用到演员配音,在获得授权的前提下,可以快速生成AI语音,不需要再考虑配音演员的档期等问题,也会节约制作成本及时间。”他认为,一旦技术取得突破性...……更多
趣丸科技副总裁兼CTO谢睿:多模态智能激发应用新场景 | 新质生产力·AI Partner大会
...人工智能可以像人类一样感知和理解音频、文本、图像、视频等多种模态信息,并与人类进行更加自然高效的交互,展现出了强大的功能和广泛的商业应用前景。 多模态能力是实现通用人工智能的重要路径之一,也是趣丸科技...……更多
AI生成假视频冲击印度大选,成本只要5万多!专家:为全球敲响警钟
...的团队只需要3天时间就可制作一个足够以假乱真的选举视频,为自己支持的政党造势。而造假的总成本只需要60万卢比(约合人民币5.22万元)。更有甚者,如果对质量要求不高,几分钟就能生成一个抹黑对手的假视频。AI生成的...……更多
遥遥领先?苹果iOS18变化爆料汇总,网友:并不看好
...之间可以通过iMessage(信息)进行聊天,可以发送照片、视频、音频、表情包、以及一些额外的功能。但是对方不是iOS用户,则只能通过传统的短信进行沟通,所以iOS18中带来了RCS,这是一种跨平台通讯标准。简单来说就是让iPhon...……更多
用AI“复活”已故亲人 能否慰藉思念?
...上,消费者花费数十元至数千元,将已故亲人的照片、音视频等发给商户,就能得到一段让其“鲜活起来”——有微表情乃至开口说话的视频。有人说,用AI“复活”逝者是对亲情的寄托;有人质疑,这样的技术手段存在安全隐...……更多
万兴科技AIGC概念迷雾:60秒文生视频能力遭质疑,开月薪10万招AI人才
图源:天幕文生样板视频截图Sora爆火两月之后,国内迅速有A股上市公司做出跟进,推出同样具备文生视频能力的多媒体大模型。4月28日,A股数字创意软件龙头万兴科技(300624.SZ)旗下天幕大模型开启公测。据万兴科技此前介...……更多
MediaTek天玑9300发布:开创全大核计算时代的旗舰5G芯片
...。它集成了旗舰级ISP影像处理器Imagiq 990,支持AI语义分割视频引擎,可以进行16层图像的语义分割,实时对捕捉到的画面色彩、纹理、噪点以及亮度进行逐帧优化,从而使视频录制的画面更明亮、锐利且细节更丰富。借助景深和...……更多
AI毒液刷屏抖音小红书!闲鱼10元代生成一次,但官网其实免费
...,在官网是免费的!一分钱不用花啊朋友们! 而且特效视频右下角的水印已经说明出处了:PixVerse ,来自国内AI视频公司爱诗科技。这个火遍全网的毒液,就是爱诗科技最近基于最新视频模型PixVerse V3和热门在映电影《毒液:最...……更多
3亿人都在听的喜马拉雅有没有新逻辑?
当市场对在线音频选择性忽略,只关心抖音和视频号的流量战争、B站到底什么时候做贴片广告、小红书商业化落地情况怎么样了,流量主阵地始终在视频和图文反复横跳时,已经有3亿中国人偷偷在喜马拉雅听书很久了。他们在...……更多
更多关于科技的资讯:
超算+AI,我国科研团队解锁地球20亿年生命演化“密码”
南京大学科研团队联合中外多家科研单位,研究通过建立早期地球化石大数据,揭示了地球大约从20亿年到5亿年前早期生命多样性演化历程
2024-12-21 08:57:00
社交应用收入排名超ChatGPT,“出道晚增长快”的产品如何靠短剧崛起
“当地人不太爱存钱,有了钱就消费,比较推崇享乐主义,泛娱乐产品在当地比较有市场”一位在巴西做娱乐应用的出海人讲述,在这个拥有2
2024-12-21 09:07:00
抽卡效率提升4.8倍!东北大学等开源优化版Stable-Diffusion.cpp:分辨率越高越快,生成质量更好
【新智元导读】北京大学等研究团队优化了Sdcpp框架,通过引入Winograd算法和多项策略,显著提升了图像生成速度和内存效率
2024-12-21 09:14:00
谷歌版o1突发即屠榜!思考速度比所有模型快5倍,能解摩斯代码
谷歌版o1来了!在奥特曼“双十二”倒数第二天——他们发布Gemini 2.0 Flash Thinking,顾名思义,以闪电般的速度解决复杂问题并展示其思考过程的实验模型
2024-12-21 09:15:00
超级推理模型正面对垒:谷歌版o1发布次日,OpenAI o1下一代o3登场
来源:硬AI圣诞节前,人工智能巨头上演了一场精彩的推理模型攻防战。谷歌和OpenAI正面对垒,谷歌刚发布自家的先进推理模型挑战OpenAI的o1
2024-12-21 09:15:00
日本三和推出插头可 360° 旋转的 USB-C 数据线
IT之家 12 月 20 日消息,大家可能都见过旋转接头的 U 盘,但是否见过插头可旋转的 USB-C 数据线?日本配件厂商三和(Sanwa)推出了一款支持“以任何角度旋转连接”的 USB Type-C 数据线
2024-12-21 09:15:00
又有厂商加入“百镜大战”,学雷军首款AI眼镜定价999元
在近日举行的2024世界互联网大会乌镇峰会期间,周鸿祎提及AI大模型智能硬件缺少爆款时认为,人天生懒得拿那么多东西,不久后每个互联网公司都会做一个眼镜
2024-12-21 09:16:00
欧盟加码半导体,Silicon Box 意大利工厂获批 13 亿欧元投资
IT之家 12 月 21 日消息,Silicon Box 公司将在意大利诺瓦拉(Novara)开设新先进半导体封装工厂
2024-12-21 09:17:00
o3 压台登场:OpenAI 卷动推理 AI 模型风云,迈向 AGI 新巅峰
IT之家 12 月 21 日消息,“12 Days of OpenAI”活动已拉上帷幕,OpenAI 的 o3 系列大模型压台登场
2024-12-21 09:17:00
荣耀Magic7长焦下的港珠澳大桥,先锋影像定格超级工程
12 月 20 日,正值澳门回归祖国 25 周年之际。荣耀官方发布了一支视频,展示了荣耀Magic7长焦下的港珠澳大桥以及香港
2024-12-21 09:18:00
联想“一体多端”战略持续落地,联想新质媒体沙龙在武汉举办
如今,AI 正全方位渗透到个人生活的方方面面,AI 影像定格精彩瞬间、本地大模型带来随问随答的便捷交互体验,海量信息被梳理总结成知识点
2024-12-21 09:19:00
充电盒存在冒烟或烧毁风险,铁三角在国内召回无线耳机
IT之家 12 月 20 日消息,铁三角音频今日发布召回公告,自 2023 年 10 月开始销售的“ATH-SQ1TW2”真无线耳机
2024-12-21 09:20:00
Sweet Baby“多元化文化咨询”游戏顾问公司官网已无法访问
IT之家 12 月 20 日消息,主张“多元化、公平、包容”的顾问公司 Sweet Baby 在不少游戏玩家心中是近年游戏界乱象的推手
2024-12-21 09:21:00
颜值性能全都要!双旦超轻薄AI PC选购攻略华硕 a 豆 14 Air 领衔
在如今这个科技迅猛发展的时代,PC 笔记本早已不仅仅是工作和学习的必需品,它更成为了年轻人表达个性审美、生活品质的一种方式
2024-12-21 09:23:00
一加手表3渲染图曝光:新增数字表冠、支持心电图、添加 LTE 连接
IT之家 12 月 20 日消息,科技媒体 Smartprix 今天(12 月 20 日)发布博文,报道称一加计划 2025 年第 1 季度推出 OnePlus Watch 3
2024-12-21 09:23:00