研究成果,字节,人像,模型,音频,成果头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

音频驱动人像视频模型：字节Loopy、CyberHost研究

近期，来自字节跳动的视频生成模型 Loopy，一经发布就在 X 上引起了广泛的讨论。Loopy 可以仅仅通过一张图片和一段音频生成逼真的肖像视频，对声音中呼吸，叹气，挑眉等细节都能生成的非常自然，让网友直呼哈利波特的魔...……更多

2024-09-13 13:34:00研究成果,字节,人像,模型,音频,成果

Pika、阿里同日炫技！国产视频大模型奋起直追

...之外还包括三大图片转视频神器——阿里的Animate Anyone、字节跳动的Magic Animate、微软的GAIA。为什么这类应用成了众公司开发AI应用的优先选择？相较于文字和图片，视频在信息表达、画面丰富性及动态性方面有更大优势，视频可...……更多

2024-03-01 09:26:00阿里,奋起,模型,国产,视频,视频

谷歌发布ai前沿成果，生成式ai迎来爆发

...源。不过，值得一提的是，目前谷歌只是发布了 MusicLM的研究成果，因为版权等问题，谷歌还未向公众开放MusicLM。02、AI生成音乐难在哪？去年10月，谷歌在生成式AI模型上已经推出过AudioLM，只需输入短时音频，就能生成相似风格...……更多

2023-02-01 21:09:00生成,成果,生成,音乐,模型,自动生成

旷视开源的AI人像视频生成太炸了！输入照片即可模仿任意表情包

...地址：https://megactor.github.io/ MegActor 是旷视研究院的最新研究成果。旷视研究院，是旷视打造的公司级研究机构。旷视研究院旨在通过基础创新突破 AI 技术边界，以工程创新实现技术到产品的快速转化。经过多年发展，旷视研究...……更多

2024-06-28 09:41:00人像,生成,表情,输入,照片,视频

BAT等互联网大厂，如何入局人形机器人？

...人形机器人市场，虽然百度、阿里、腾讯、小米、美团、字节、华为等企业也都有尝试入局人形机器人产业。然而，可以发现，在这轮人形机器人的方向下，互联网资本的干涉度已经降低很多，虽然还有自主深入产业链研发人形...……更多

2024-06-12 11:54:00大厂,人形,机器人,机器,互联网,互联

北京人工智能数据运营平台发布

...待持续训练并经过安全评估后，Emu3将逐步开源。世界级研究成果接连产出具身智能技术的发展，推动人工智能从数字世界走入物理世界。在大会展厅中，经过通用抓取模型训练，机器人对任意形状、反光透明等物体都能有效抓...……更多

2024-06-16 04:14:00人工智能,北京,人工,运营,智能,数据

行业报告 | 2023年9月全球AIGC行业月报-要闻篇

...有害任务性能接近随机初始化模型，证明其有效性。这一研究成果已经被国际人工智能协会（AAAI）接受，并获得了最佳学生论文奖的提名。自毁模型的引入标志着一个新的方式，以确保大型AI模型不会被滥用，从而为AI伦理和安...……更多

2023-10-18 10:00:00行业,月报,行业报告,要闻,报告,全球

广东新增联合实验室打造生成式音频大模型

...韵律、情绪的可编辑音频，打造业界领先的生成式音频大模型。香港中文大学(深圳)趣丸科技联合实验室成立。香港中文大学(深圳)供图随着《广东省人民政府关于加快建设通用人工智能产业创新引领地的实施意见》出台，广东...……更多

2024-05-21 20:24:00广东,生成,实验室,模型,音频,实验

揭秘字节AI版图：调集多位高管参战，数款重磅产品内测

...@视觉中国文｜Tech星球，作者 | 陈桥辉Tech星球独家获悉，字节旗下多个部门加大投入对AI产品的研发，成果相继落地，包括抖音电商、巨量引擎等业务部门，其中动作最大的Flow部门除了上线豆包、扣子等AI产品外，还将推出AI角...……更多

2024-02-18 13:00:00重磅,版图,字节,产品,字节,产品

字节跳动“筋斗云人才计划”启动，面向全球高校招聘顶尖技术人才

近日，字节跳动“筋斗云人才计划”启动。该计划是字节跳动面向优秀校园技术人才推出的专项招聘，意图在全球范围内，吸引和招募有志于用技术创造突破性价值的顶尖学生。本次招聘涵盖AI应用、搜索、推荐、广告、AI for Sc...……更多

2024-07-12 09:49:00人才,筋斗,字节,顶尖,全球,招聘

本周（4.8-4.14）AI界发生了什么？

...的多语言歌声。△Udio界面，图源：官网前沿研究北大与字节合作提出VAR范式4月13日消息，北京大学和字节跳动的研究者提出合作提出新一代范式视觉自回归建模（VAR），将图像的自回归学习，重新定义为从粗到细的“下一个尺...……更多

2024-04-14 20:33:00模型,特斯,马斯,芯片,融资,英特

AI大牛履新南大副校长！高校人工智能热度高涨，3年9名大厂科

...反而更高。在职的五年期间，王薇所在小组仅有一次凭借研究成果促进了业务的爆发式增长。“大多设想都停留在纸面上，真正能在商业化方面带来的效益则不太理想。”在王薇看来，转向高校和创业公司往往会成为科学家们的...……更多

2024-08-05 09:54:00大牛,大厂,大副,人工智能,热度,科学家

字节跳动推出对话式ai实时交互解决方案

8月9日消息，字节跳动旗下火山引擎今日宣布推出对话式AI实时交互解决方案，搭载火山方舟大模型服务平台。该方案通过火山引擎RTC实现语音数据的采集、处理和传输，并深度整合豆包・语音识别模型和豆包・语音合成模型，...……更多

2024-08-10 04:36:00字节,实时,对话,解决方案,方案,语音

首个3d人像视频生成模型来了

...停留在单帧人像上。最近，来自新加坡国立大学（NUS）和字节跳动的研究人员，在静态3D模型的基础上，提出了首个3D人像视频生成模型：PV3D（3DmodelforPortraitVideogeneration）。PV3D的训练继承了3DGAN模型的优点，即无需动态的三维数...……更多

2023-02-22 19:23:00人像,生成,模型,视频,生成,视频

趣丸科技副总裁兼CTO谢睿：多模态智能激发应用新场景 | 新

...沿技术研究和提供企业级解决方案。我们目前围绕四个大模型（生成式3D大模型、生成式音频大模型、生成式动作大模型、对话大模型）在开展技术自研，后续将推动规模化落地应用。前段时间GPT-4o的问世，相信大家都看到很多...……更多

2024-05-24 22:22:00模态,生产力,副总,场景,大会,智能

发布三个月，豆包大模型综合能力提升20.3%，应用落地再提速

...以语音技术为例，豆包大模型团队发表的Seed-ASR、Seed-TTS研究成果获得了学术界广泛认可，已成功应用于豆包语音识别模型和语音合成模型。在语音模型能力基础上，火山引擎整合了实时音视频技术，使AI语音交互能像人类说话一...……更多

2024-08-22 13:34:00豆包,提速,落地,模型,三个,能力

Sora概念盘中拉升，字节跳动或将与OpenAI短兵相接

...兴科技、天娱数科、信雅达等跟涨。消息面上，9月24日，字节跳动旗下火山引擎在深圳举办AI创新巡展，发布豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型，面向企业市场开启邀测。火山引擎总裁谭待表示，“视频生成...……更多

2024-09-26 09:17:00字节,概念,视频,生成,豆包,模型

让大模型能听会说,国内机构开源首个端到端语音对话模型Mini

...、语音到语音的多模态大模型。为方便结合大语言模型的研究成果，通常会将语音离散化为 Audio Token，并基于 Audio Token 进行学习和推理。这其中具有代表性的工作包括 SpeechGPT、Spectron 等，它们均采用QuestionAudio-QuestionText-Ans……更多

2024-09-07 09:44:00模型,语音,对话,机构,语音,文本