阿里,商用,模型,视频,编码,编码器头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...。那么，Wan 2.1是如何实现又好又省的呢？创新3D变分自动编码器和主流的视频生成技术路线一样，Wan 2.1的主体采用了DiT（Diffusion Transformer）架构。Wan利用T5编码器对输入的多语言文本进行编码，并在每个Transformer块内加入交叉注...……更多

2025-02-26 20:05:00阿里,商用,模型,视频,编码,编码器

智谱AI版Sora开源！首个可商用，在线可玩，5小时GitH

...得说道说道。首先便是团队自研了一个高效的三维变分自编码器结构（3D VAE），将原视频空间压缩至2%大小，大大减少了视频扩散生成模型的训练成本及训练难度。模型结构包括编码器、解码器和潜在空间正则化器，通过四个阶...……更多

2024-08-07 09:31:00商用,小时,在线,视频,模型,生成

赛道正在变得拥挤腾讯混元大模型杀入文生视频让用户 “用起

...上进行了多处升级。混元视频生成模型适配了新一代文本编码器提升语义遵循，其具备强大的语义跟随能力，更好地应对多个主体描绘，实现更加细致的指令和画面呈现；采用统一的全注意力机制，使得每帧视频的衔接更为流畅...……更多

2024-12-04 09:56:00文生,腾讯,赛道,模型,正在,关键

【玖越机器人】视频网站为了降本纷纷砍画质，为何只有谷歌仍在坚

...歌VCU芯片的布图规划也可以看出，大部分区域都分配给了编码器核心，其次是四通道的LPDDR4内存，不仅提供边带错误纠正，也提供芯片所需的带宽。编辑VCU芯片布图规划/ 谷歌每个VCU服务器系统由10块板卡组成，每块板卡上配有2...……更多

2023-01-14 03:00:00画质,机器人,机器,只有,视频,网站

开源社区参数量最大的文生视频模型来了，腾讯版Sora免费使用

...过程。语义遵从：业界首个以多模态大语言模型为文本编码器的视频生成模型，天然具备超高语义理解能力，在处理多主体及属性绑定等生成领域的难点挑战时表现出色。原生镜头转换：多视角镜头切换主体保持能力，艺术...……更多

2024-12-04 09:48:00文生,腾讯,模型,参数,社区,视频

迎战GPT-4V！谷歌PaLI-3视觉语言模型问世，更小、更

...，大型视觉语言模型在其更大的模型中使用预训练的图像编码器，其中一些使用监督分类进行预训练（如PaLI，PaLI-X，Flamingo，PaLM-E），一些使用预训练的CLIP编码器（如BLIPv2，CrossTVR，ChatBridge，还有一些使用自定义多模态预训练...……更多

2023-10-17 16:31:00更快,模型,视觉,语言,训练,模型

火爆全球的AI音频大模型，最新技术细节揭秘

...练数据的采用和部分架构上采取了调整，关键架构由自动编码器、基于T5的文本嵌入以及扩散模型（DiT）构成。论文地址：https://arxiv.org/html/2407.14358v1一、3个关键架构提供支持，免费生成44.1kHz高质量立体声短音频Stable Audio Open引...……更多

2024-07-25 09:22:00最新技术,火爆,模型,细节,音频,全球

iPhone可跑2B小钢炮！谷歌Gemma 2来袭，最强显微

...低的离线应用提供更高性能。Gemma Scope：通过开源稀疏自编码器揭示AI决策过程此次同时发布的另一大亮点，就是开源稀疏自编码器——Gemma Scope了。语言模型的内部，究竟发生了什么？长久以来，这个问题一直困扰着研究人员和...……更多

2024-08-02 09:55:00小钢炮,显微镜,大脑,模型,编码器,特征

腾讯版Sora发布即开源！130亿参数，模型权重、推理代码全

...资料看，腾讯混元视频生成模型还有三个亮点。1、文本编码器部分，已经适配多模态大模型当下行业中多数视觉生成模型的文本编码器，适配的主要是上一代语言模型，如OpenAI的CLIP和谷歌T5及各种变种。腾讯在开源图像生成模...……更多

2024-12-04 09:50:00腾讯,权重,推理,模型,参数,代码

主流手机首次深度支持H.266 vivo X200搭载Ali

快科技10月25日消息，近日，vivo联合阿里相关研发团队推出业内首个H.266手机软解异构优化方案，基于阿里自研解码器Ali266，在高清视频播放场景下实现功耗下降13%，解码速度提升12%。该方案已率先落地vivo X200系列旗舰手机，这...……更多

2024-10-25 11:27:00解码器,功耗,高清,深度,主流,支持

阿里发“神笔马良版Sora”，轻轻一抹让猫咪转向，20个演示

...。▲Tora整体架构其中，轨迹提取器采用3D运动VAE（变分自编码器），将轨迹向量嵌入到与视频补丁（video patches）相同的潜在空间中，可以有效地保留连续帧之间的运动信息，随后使用堆叠的卷积层来提取分层运动特征。运动引...……更多

2024-08-05 09:34:00马良,神笔,阿里,猫咪,演示,报告

谷歌开源libdav1d编解码器，改善对av1编码视频的支持

4月20日消息，安卓系统开发经理阿里夫・迪基奇（ArifDikici）昨日证实，已经通过2024年3月发布的PlaySystem更新，改用VideoLAN的开源libdav1d编解码器，从而改善对AV1编码视频的支持。谷歌自发布安卓10系统以来，安卓开源项目（AOSP）...……更多

2024-04-20 14:39:00解码器,编码,支持,视频,安卓,解码器

AI音乐创作、水墨画、3D空间重建、6DoF，腾讯多媒体实验

...联合主编、参考软件联席主席等重要席位。在MSU世界视频编码器大赛FullHD比赛中，腾讯自研最新一代视频编码器Tencent266取得了15项关键指标中12项第一，第一总数全场最多；并在全部VVC编码器中包揽15项指标全部第一。此外Tencent2...……更多

2023-11-29 19:02:00腾讯,水墨画,水墨,实验室,创作,领先

4090单卡可跑，6秒直出电影级画质，智谱版Sora正式开源

...远超图像数据。为应对此挑战，团队提出了基于3D变分自编码器（3D VAE）的视频压缩方法。其中，3D VAE通过三维卷积同时压缩视频的空间和时间维度，实现了更高的压缩率和更好的重建质量。模型结构包括编码器、解码器和潜在...……更多

2024-08-07 09:43:00画质,电影,视频,模型,生成,团队

高通ali266实现4k120fpsvvc视频流畅播放

...息，在刚结束的国际广播电视展（IBC）上，高通展出基于阿里自研解码器Ali266的视频解码方案，在搭载了骁龙XElite的Windows11AIPC上首次实现4K120fpsVVC视频流畅播放。得益于采用Ali266的解码方案，骁龙XElite支持超低功耗、超高清、高...……更多

2024-09-21 20:59:00高通,视频,视频,高清,多核,高通

Meta版Sora深夜横空出世，小扎放出16秒高清大片！92

... Space）中进行生成。为此，他们训练了一个单一的时间自编码器（TAE），用于将RGB图像和视频映射到潜在空间。然后，再使用预训练文本编码器，来编码用户提供的文本提示，并获得文本提示嵌入，这些嵌入用作模型的条件。流...……更多

2024-10-08 09:52:00高清,架构,大片,细节,论文,技术

谢赛宁新作：表征学习有多重要？一个操作刷新SOTA，DiT训

...纽约大学的Yann LeCun的转发。当使用自监督学习训练视觉编码器时，我们知道一个事实，使用具有重建损失（reconstruction loss）的解码器的效果远远不如具有特征预测损失（feature prediction loss）和崩溃预防机制的联合嵌入架构。这...……更多

2024-10-23 09:55:00新作,速度,训练,学习,模型,训练

AI也会「刷抖音」！清华领衔发布短视频全模态理解新模型 |

...一部分：音视频编码和时间对齐video- SALMONN使用Whisper语音编码器和BEATs音频编码器，分别得到语音和音频的编码向量序列（每1秒音频对应50个向量），同时使用InstructBLIP视觉编码器，以2 FPS的视频采样率得到视觉编码向量序列（...……更多

2024-08-01 09:45:00模态,清华,领衔,模型,视频,音视

英国ai初创公司wayve公布gaia-1最新进展

...汽车上路时的安全性和效率。据悉，GAIA-1会先运用专门的编码器，将影片或文字等各种形式的输入，编码成一个共享的表示形式，进而在模型中实现统一的时序对齐和上下文理解，这种编码方法，让模型能够更好地整合和理解不...……更多

2023-10-10 11:51:00英国,进展,公司,模型,驾驶,生成

字节版Sora火爆24小时，同名论文再次被热议

...为训练中的图像指令。据了解，文本指令由预训练的文本编码器编码，并通过交叉注意力融入扩散模型。图像指令由预训练的VAE编码器编码，并与受扰的视频潜变量或高斯噪声一起作为扩散模型的输入。在训练过程中，团队使用...……更多

2024-09-26 13:41:00字节,火爆,再次,小时,论文,指令

零样本即可时空预测！港大、华南理工等发布时空大模型Urban

...GPT是一种创新的时空大型语言模型，它通过结合时空依赖编码器和指令微调技术，展现出在多种城市任务中卓越的泛化能力和预测精度。这项技术突破了传统模型对大量标记数据的依赖，即使在数据稀缺的情况下也能提供准确的...……更多

2024-08-01 09:40:00时空,华南,样本,理工,模型,时空

$免训练大模型知识编辑，吸收新数据更高效｜EMNLP\'24$

免训练大模型知识编辑，吸收新数据更高效｜EMNLP'24

...值的媒介，确定检索库是否包含相关知识。检索器和提示编码器经过联合训练，以实现知识编辑属性，即可靠性、通用性和局部性。在多个权威基座模型和编辑数据集上进行终身编辑对比实验，结果证明了RECIPE性能的优越性。 ...……更多

2024-10-30 09:57:00模型,训练,知识,数据,模型,知识

智谱AI发布视频生成大模型，B站参与研发，亦庄提供算力｜甲子

...决内容连贯性的问题，智谱自研了一个高效的三维变分自编码器结构（3D VAE），将原视频空间压缩至2%大小，以此减少视频扩散生成模型的训练成本及训练难度。模型结构方面，智谱采用因果三维卷积（Causal 3D convolution）为主要...……更多

2024-07-27 09:30:00亦庄,甲子,生成,模型,视频,模型

稀疏自编码器是如何工作的，这里有一份直观说明

...阵 → ReLU 激活 → 矩阵在解释机器学习模型方面，稀疏自编码器（SAE）是一种越来越常用的工具（虽然 SAE 在 1997 年左右就已经问世了）。机器学习模型和 LLM 正变得越来越强大、越来越有用，但它们仍旧是黑箱，我们并不理解...……更多

2024-08-06 09:27:00编码器,直观,编码,工作,向量,编码器

LeCun 的世界模型初步实现！基于预训练视觉特征，零样本规

...预训练的视觉表征重要吗？该团队使用不同的预训练通用编码器作为世界模型的观察模型，并评估了它们的下游规划性能。在涉及简单动态和控制的 PointMaze 任务中，该团队观察到具有不同观察编码器的世界模型都实现了近乎...……更多

2024-11-19 09:48:00样本,模型,特征,视觉,训练,规划

阿里CEO吴泳铭：生成式AI让世界有了一个统一的语言——To

笔者参加了几届阿里云栖大会，每一届都有不同的主题。但近两届，有一个越来越明晰的主线，那就是云与AI的融合。这一届的阿里云栖大会，无论是从主题演讲还是展览设置，这种云+AI的感觉都很强。在阿里巴巴的高层中，吴...……更多

2024-09-20 09:51:00阿里,生成,统一,语言,世界,模态

一文看尽Meta开源大礼包！全面覆盖图像分割、语音、文本、表

...多模态语言模型Spirit LM、自学评估器和改进的跨语言句子编码器Mexma等，提升了AI在图像处理和语音识别领域的能力，进一步推动了AI研究的进展。开源绝对是AI如今发展迅猛的助推剂，而其中的一股重要力量就是来自MetaMeta在人...……更多

2024-11-28 12:02:00一文,大礼包,大礼,安全性,语音,图像

苹果AI登场，与OpenAI合作，Siri将采用GPT-4o

...新方法，Ilya 也参与：研究提出了改进大规模训练稀疏自编码器的方法，并成功将 GPT-4 的内部表征解构为 1600 万个可理解的特征。由此，复杂语言模型的内部工作变得更加可理解。免费匿名使用 GPT 等热门大模型，DuckDuckGo AI Chat ...……更多

2024-06-11 09:00:00情报局,独角兽,情报,芯片,进展,苹果

中国石油申请基于堆栈自编码器去除沉积背景专利，提高有效储层地

...石油天然气股份有限公司申请一项名为“一种基于堆栈自编码器的去除沉积背景方法及装置”的专利，公开号CN119861400A，申请日期为2023年10月。专利摘要显示，本发明公开了一种基于堆栈自编码器的去除沉积背景方法及装置。该...……更多

2025-04-26 16:37:00精确性,堆栈,编码器,中国,地震,编码

多模态竞技场对标90B Llama 3.2！Pixtral

...型不同的是，Pixtral选择从头开始训练了一个全新的视觉编码器。基于此，Pixtral 12B输入图片的分辨率和长宽比不受任何限制，并且在128K的上下文窗口范围内，想放多少张图片都行！从论文的测试结果来看，Pixtral 12B明显优于其他...……更多

2024-11-20 09:43:00模态,竞技场,竞技,报告,技术,模态

page 1/2667 首页上一页 12 3 4 5 6 下一页末页

更多关于科技的资讯：

正式发布！视源股份牵头制定《娱乐用车载显示系统图像质量技术规

2025年10月23日，在全国音频、视频及多媒体系统与设备标准化技术委员会（SAC/TC 242）商用显示标准研究组第六次全会暨标准研讨会上

2025-10-31 08:20:00

中感集团煤仓安全综合解决方案亮相中国国际煤炭采矿展，以系统性

在北京举行的第21届中国国际煤炭采矿技术交流与设备展览会上，中感集团创新展示的“煤仓安全综合解决方案”引发行业高度关注

2025-10-31 08:51:00

人工智能产业决胜与 Data&AI 数据基础设施建设——科杰

2025中国国际数字经济博览会在石家庄国际会展中心开幕。科杰科技董事长于洋受邀出席2025首席数据官峰会论坛,并作主题为《人工智能产业决胜与 Data&

2025-10-31 08:51:00

知与行｜推进县域特色产业数字化转型

■加快构建覆盖全域、经济适用、安全可靠的数字技术支撑体系，着力打通数据壁垒与业务断点，促进产业链各环节融通发展■建立功能完善

2025-10-31 09:05:00

世说新语丨AI时代，图书馆如何更“聪明”

在数字化、网络化、智能化的当下，图书馆的角色和功能正在发生深刻变化。究竟什么样的图书馆更“聪明”？近日，第五届长三角公共图书馆发展论坛在上海举行

2025-10-31 09:05:00

Mutual妙趣艺：全球战略+资源整合，打造文娱IP数字资产

Mutual妙趣艺于2020年成立于美国加州，专注于文娱IP（知识产权）数字资产化领域。公司的核心定位是打造“数字资产领域的AWS”

2025-10-31 10:57:00

临沂联通获全国百城重点区域移动网络质量综合大奖

鲁网10月31日讯近日，“2025年第四届移动网络高质量发展论坛”在北京盛大启幕。在本次论坛上，工业和信息化部委托中国信通院权威发布了2024年“全国百城重点区域移动网络质量专项评测结果”

2025-10-31 11:43:00

当担保遇上AI：一场成长的“双向奔赴”

人工智能（AI）是新一轮科技革命和产业变革的重要驱动力量，广西聚焦国家所需、广西所能、东盟所盼，正加快构建一条“北上广研发+广西集成+东盟应用”的特色发展路径

2025-10-31 11:46:00

aigo国民好物成为第32届WCGC全球总决赛官方唯一翻译类

上海，2025年10月 —— 备受瞩目的第32届世界企业高尔夫挑战赛（WCGC）全球总决赛于2025年10月19日至23日在上海东庄海岸高尔夫俱乐部隆重举行

2025-10-31 11:52:00

让检测全面拥抱AI！科学指南针2025产品服务发布会举行

让检测全面拥抱AI！10月30日，科学指南针2025年度产品服务发布会在杭州举办，来自高校院所、企业、分析测试中心等多方行业代表到场参会

2025-10-31 11:52:00

培育钻定制哪个品牌好？2025最新测评出炉，国产珠宝高性价比

曾几何时，钻石承载着“钻石恒久远，一颗永流传”的爱情神话，而天然钻石的稀缺性更被赋予了极高的市场价值。然而，随着实验室培育钻石技术的突破性进展

2025-10-31 12:14:00

2025年商旅平台选型指南：从合规能力到生态整合的全景评估

在企业商旅管理从“费用管控”向“全流程智能管理”演进的关键时期，平台竞争力已不再局限于单一的预订功能，而是延伸至合规风控

2025-10-31 12:16:00

拓竹荣膺《时代》最佳发明，3D打印技术步入主流创新支撑体系

近期，《时代》周刊公布2025年度最佳发明榜单，揭示一个耐人寻味的现象：在300项突破性发明中，仅有4项被明确标注为3D打印创新

2025-10-31 12:19:00

腾讯智慧零售与生活产业发布“全域经营·新引擎增长计划”，助力

10月29日，2025全域经营·新引擎增长计划发布暨竞赛启动会在上海举办。会上，腾讯智慧零售与生活产业正式推出“全域经营·新引擎增长计划”

2025-10-31 14:24:00

德百家电“决战双十一”活动启幕点燃品质消费热潮

鲁网10月31日讯（记者赵洪斌实习记者李安琦通讯员孙明彩）10月28日，“德百家电决战双十一全城价更低”活动启幕大会隆重举行

2025-10-31 14:53:00

头条订阅服务