• 我的订阅
  • 头条热搜
音频驱动人像视频模型:字节Loopy、CyberHost研究成果揭秘
近期,来自字节跳动的视频生成模型 Loopy,一经发布就在 X 上引起了广泛的讨论。Loopy 可以仅仅通过一张图片和一段音频生成逼真的肖像视频,对声音中呼吸,叹气,挑眉等细节都能生成的非常自然,让网友直呼哈利波特的魔...……更多
Pika、阿里同日炫技!国产视频大模型奋起直追
...之外还包括三大图片转视频神器——阿里的Animate Anyone、字节跳动的Magic Animate、微软的GAIA。为什么这类应用成了众公司开发AI应用的优先选择?相较于文字和图片,视频在信息表达、画面丰富性及动态性方面有更大优势,视频可...……更多
谷歌发布ai前沿成果,生成式ai迎来爆发
...源。不过,值得一提的是,目前谷歌只是发布了 MusicLM的研究成果,因为版权等问题,谷歌还未向公众开放MusicLM。02、AI生成音乐难在哪?去年10月,谷歌在生成式AI模型上已经推出过AudioLM,只需输入短时音频,就能生成相似风格...……更多
旷视开源的AI人像视频生成太炸了!输入照片即可模仿任意表情包
...地址:https://megactor.github.io/ MegActor 是旷视研究院的最新研究成果。旷视研究院,是旷视打造的公司级研究机构。旷视研究院旨在通过基础创新突破 AI 技术边界,以工程创新实现技术到产品的快速转化。经过多年发展,旷视研究...……更多
BAT等互联网大厂,如何入局人形机器人?
...人形机器人市场,虽然百度、阿里、腾讯、小米、美团、字节、华为等企业也都有尝试入局人形机器人产业。然而,可以发现,在这轮人形机器人的方向下,互联网资本的干涉度已经降低很多,虽然还有自主深入产业链研发人形...……更多
...待持续训练并经过安全评估后,Emu3将逐步开源。世界级研究成果接连产出具身智能技术的发展,推动人工智能从数字世界走入物理世界。在大会展厅中,经过通用抓取模型训练,机器人对任意形状、反光透明等物体都能有效抓...……更多
行业报告 | 2023年9月全球AIGC行业月报-要闻篇
...有害任务性能接近随机初始化模型,证明其有效性。这一研究成果已经被国际人工智能协会(AAAI)接受,并获得了最佳学生论文奖的提名。自毁模型的引入标志着一个新的方式,以确保大型AI模型不会被滥用,从而为AI伦理和安...……更多
广东新增联合实验室打造生成式音频大模型
...韵律、情绪的可编辑音频,打造业界领先的生成式音频大模型。香港中文大学(深圳)趣丸科技联合实验室成立。香港中文大学(深圳)供图随着《广东省人民政府关于加快建设通用人工智能产业创新引领地的实施意见》出台,广东...……更多
揭秘字节AI版图:调集多位高管参战,数款重磅产品内测
...@视觉中国文|Tech星球,作者 | 陈桥辉Tech星球独家获悉,字节旗下多个部门加大投入对AI产品的研发,成果相继落地,包括抖音电商、巨量引擎等业务部门,其中动作最大的Flow部门除了上线豆包、扣子等AI产品外,还将推出AI角...……更多
字节跳动“筋斗云人才计划”启动,面向全球高校招聘顶尖技术人才
近日,字节跳动“筋斗云人才计划”启动。该计划是字节跳动面向优秀校园技术人才推出的专项招聘,意图在全球范围内,吸引和招募有志于用技术创造突破性价值的顶尖学生。本次招聘涵盖AI应用、搜索、推荐、广告、AI for Sc...……更多
本周(4.8-4.14)AI界发生了什么?
...的多语言歌声。△Udio界面,图源:官网前沿研究北大与字节合作提出VAR范式4月13日消息,北京大学和字节跳动的研究者提出合作提出新一代范式视觉自回归建模(VAR),将图像的自回归学习,重新定义为从粗到细的“下一个尺...……更多
AI大牛履新南大副校长!高校人工智能热度高涨,3年9名大厂科学家回归学术
...反而更高。在职的五年期间,王薇所在小组仅有一次凭借研究成果促进了业务的爆发式增长。“大多设想都停留在纸面上,真正能在商业化方面带来的效益则不太理想。”在王薇看来,转向高校和创业公司往往会成为科学家们的...……更多
字节跳动推出对话式ai实时交互解决方案
8月9日消息,字节跳动旗下火山引擎今日宣布推出对话式AI实时交互解决方案,搭载火山方舟大模型服务平台。该方案通过火山引擎RTC实现语音数据的采集、处理和传输,并深度整合豆包・语音识别模型和豆包・语音合成模型,...……更多
首个3d人像视频生成模型来了
...停留在单帧人像上。最近,来自新加坡国立大学(NUS)和字节跳动的研究人员,在静态3D模型的基础上,提出了首个3D人像视频生成模型:PV3D(3DmodelforPortraitVideogeneration)。PV3D的训练继承了3DGAN模型的优点,即无需动态的三维数...……更多
趣丸科技副总裁兼CTO谢睿:多模态智能激发应用新场景 | 新质生产力·AI Partner大会
...沿技术研究和提供企业级解决方案。我们目前围绕四个大模型(生成式3D大模型、生成式音频大模型、生成式动作大模型、对话大模型)在开展技术自研,后续将推动规模化落地应用。前段时间GPT-4o的问世,相信大家都看到很多...……更多
发布三个月,豆包大模型综合能力提升20.3%,应用落地再提速
...以语音技术为例,豆包大模型团队发表的Seed-ASR、Seed-TTS研究成果获得了学术界广泛认可,已成功应用于豆包语音识别模型和语音合成模型。在语音模型能力基础上,火山引擎整合了实时音视频技术,使AI语音交互能像人类说话一...……更多
Sora概念盘中拉升,字节跳动或将与OpenAI短兵相接
...兴科技、天娱数科、信雅达等跟涨。消息面上,9月24日,字节跳动旗下火山引擎在深圳举办AI创新巡展,发布豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型,面向企业市场开启邀测。火山引擎总裁谭待表示,“视频生成...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...、语音到语音的多模态大模型。为方便结合大语言模型的研究成果,通常会将语音离散化为 Audio Token,并基于 Audio Token 进行学习和推理。这其中具有代表性的工作包括 SpeechGPT、Spectron 等,它们均采用QuestionAudio-QuestionText-Ans……更多
字节“扣子”加入AI战场,2024大模型能搞到钱吗?
...对话聊天机器人ChatGPT的推出,这个一直在小圈子走红的研究成果,才第一次为大众所认识。能聊天、画画、写文案、编代码,强大的功能,使得ChatGPT一经发布迅速走红,5天时间注册用户数超过百万,两个月时间月活突破1亿,...……更多
deepmind开发音乐创作工具dreamtrack
11月21日消息,Deepmind日前推出了一款名为Lyria的音频模型,可用于生成带有乐器和人声的音乐。此外Deepmind还通过与YouTube合作,整合Lyria模型开发了音乐创作工具DreamTrack,声称可令视频创作者“更有效率地将想法变为作品”。研...……更多
AI大牛杨红霞离职创业,曾为字节和阿里大模型研发主力 | Long China 50独家
... | 周鑫雨编辑 | 苏建勋 杨轩36氪从多个独立信源处获悉,字节跳动大语言模型研发技术专家杨红霞,已于近日从字节跳动离职,并开始筹备AI创业项目。截至发稿前,字节跳动并未回应上述消息。2023年3月,36氪曾独家报道过杨红...……更多
全球金融机构大模型领域专利创新榜揭晓 两江新区企业马上消费跻身十强
...员单位已突破110家,核心成员包括中信银行、中国平安、字节跳动等,是国内最具行业影响力的共享互动型组织。马上消费只是两江新区众多高新技术企业蓬勃发展的一个代表。长期以来,两江新区积极响应国家创新驱动发展战...……更多
以一抵百,绿色海量光子存储迎新纪元
...存储技术提出了绿色、长寿命、大数据存储的解决方案,研究成果以“Pb容量三维纳米光子存储”为题,发表在《自然》上。学界认为,该成果的发布不仅突破了光学衍射极限这一物理学难题,也将助力我国在存储领域实现突破...……更多
B站AI课几秒出总结,划词就给解释,这个「AI学习搭子」真香
...小破站上。 当然,罗马不是一日建成的。2023 年 6 月,字节开始测试代号 Grace 的 AI 对话项目,彼时,云雀大模型还未出世。8 月份,字节发布自研的云雀大模型,并搭上了国内大模型产品备案的首班车,同时还将 Grace 更名为「...……更多
荔枝核心业务稳健 全身投入AGIC有望迎来新增长极
...技术在业务广泛应用的行业实践空间。随着AIGC和大语言模型的技术突破,为音频互动产品提供了更多创新的可能性,通过AIGC和大语言模型技术赋能业务产品创新探索将成为未来的发展趋势。近日,白鲸技术栈携手亚马逊云科技&...……更多
Llama3训练每3小时崩一次?豆包大模型、港大为脆皮万卡训练提效
...训练故障、保障训练进度和提高训练效率的关键。近日,字节跳动豆包大模型团队与香港大学联合提出了 ByteCheckpoint。这是一个 PyTorch 原生,兼容多个训练框架,支持 Checkpoint 的高效读写和自动重新切分的大模型 Checkpointing 系统...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...单项分数。语言模型主观评测结果显示,在中文语境下,字节跳动豆包Skylark2、OpenAI GPT-4位居第一、第二,国产大模型更懂中国用户。在语言模型客观评测中,OpenAI GPT-4、百川智能Baichuan3位列第一、第二。百度文心一言4.0、智谱...……更多
第二届北京人工智能产业创新发展大会举办
...究中心”。与此同时,北京24家企事业单位联合发起“大模型应用产业联合体”,并发布了北京市通用人工智能产业创新伙伴计划(2024年)。2月29日,北京国际大数据交易所数据资产服务中心揭牌成立。活动主办方供图本届大会以...……更多
AI读取大脑,还破译了人们的内心独白!我的秘密会被它看光吗?
...自然-神经科学》上,发表了一项颇有“读心术”感觉的研究成果: 研究者开发了一种AI“解码器”,只要用仪器扫描大脑活动再交给解码器分析,就能解读出一个人脑子里出现的话语[1]。这是怎么做到的?AI已经要开始偷走人们...……更多
看看都有哪些重磅大咖!这份掘金年度技术演讲指南请收好
...主论坛部分重磅嘉宾公布将在主论坛带来分享的嘉宾是:字节跳动数据库负责人张雷,华为诺亚方舟实验室语音语义首席科学家刘群,Datastrato Founder & CEO堵俊平,Jina AI联合创始人 & CTO王楠,xxxxx黄玄,NVDIA神秘嘉宾。他们...……更多
更多关于科技的资讯:
纯国产高速激光打印机来了!龙芯2P0500主控打印机首批量产出货
快科技9月27日消息,日前,基于龙芯2P0500的极印高速激光打印机首批量产订单下线交付,标志着龙芯专用打印产品量产正式走向开放市场
2024-09-29 10:00:00
喜大普奔!微信公众号可以修改封面了!
9月27日,微信公众号发布新规——图文消息支持修改封面。传媒茶话会测试发现,通过“修改”入口进入文章后,修改页面的最底部已经新增修改封面的功能
2024-09-29 10:00:00
14年了,苹果又在美国本土制造芯片了,拜登:美国制造的重大胜利
美国本土可以生产4nm芯片了?据说,台积电在亚利桑那州的新工厂已经开始用上了先进的4N工艺,说白了,这就是5纳米技术的升级版
2024-09-29 13:32:00
顶固最接地气的长期主义:与“健康”同行
在历史的长河中,健康一直是人类追求的永恒主题。从苏东坡“宁可食无肉,不可居无竹”的诗意生活,到现代人对品质家居的渴望,健康的理念贯穿其中
2024-09-29 10:26:00
本文转自:人民网-北京频道人民网北京9月29日电 (记者董兆瑞)随着回天行动计划的稳步实施及昌平区“两谷一园”创新格局加速形成
2024-09-29 10:49:00
如何定义个贷不良资产处置3.0时代?
前言在金融领域,个贷不良资产处置的演变经历了显著的变革。1.0时代的处置特征依赖于传统的人工催收和法律诉讼,而2.0时代则引入了基础信息化手段
2024-09-29 10:53:00
吉利汽车CEO淦家阅:全新一代雷神超级电混续航超2000km
快科技9月29日消息,日前,在2024世界新能源汽车大会上,吉利汽车集团CEO淦家阅透露:吉利年内将发布全新一代雷神超级电混
2024-09-29 11:03:00
存储产业寒冬将至:金士顿已率先启动降价策略!
快科技9月29日消息,据媒体报道,近期,尽管存储大厂美光的财报一度给市场带来暖意,但摩根士丹利的报告却预测存储产业的寒冬即将到来
2024-09-29 11:03:00
Etsy店铺运营秘籍
Etsy是个汇集了无数手工艺品、复古商品和独特创意作品的电商平台,为全球的手工艺人和小型企业提供了一个展示和销售创意成果的舞台
2024-09-29 11:04:00
世界级的碰撞在郎酒庄园上演!中国郎的“世界级”梦想逐步照进现实
并肩同行,共绘世界建筑新篇章。9月27日,2024世界建筑节 中国盛典(以下简称:2024 WAF China)在郎酒庄园举行
2024-09-29 11:13:00
打破传统医疗服务的地域与机构壁垒,京东方健康视图板块上线
文|罗曾近日,京东方健康在智慧医疗领域有了新进展。据悉,其在合肥、成都、苏州三家自建医院正式推出创新健康视图板块,该板块是京东方医院服务号
2024-09-29 11:14:00
拿起手机、打开网约车软件,不一会儿,一辆自动驾驶出租车停到面前,扫二维码上车,系好安全带,在车载屏幕上点击“一切已准备好”
2024-09-29 11:16:00
张雪峰公司新增互联网游戏服务
张雪峰公司新增电竞相关业务天眼查App显示,近日,苏州峰狂文化科技有限公司发生工商变更,经营范围新增互联网游戏服务,演出经纪
2024-09-29 11:31:00
余承东:智能驾驶让人开车不劳累了 车相当于一个移动的家
快科技9月29日消息,日前,鸿蒙智行会客厅节目中,余承东与马东对话时表示,智能驾驶让人开车不劳累了,车相当于一个移动的家
2024-09-29 11:33:00
vivo韩伯啸公布X200标准版正面实拍图:等深四曲面 窄边框设计
快科技9月29日消息,今日vivo韩伯啸公布了X200标准版正面实拍图,称其采用超窄黑边全等深微四曲的设计,兼顾直屏的体验和曲屏的美感
2024-09-29 11:33:00