• 我的订阅
  • 头条热搜
智谱ai训练cogvlm2-video开源
...的开放领域问答数据,引入了多帧视频图像和时间戳作为编码器输入,训练出CogVLM2-Video模型。智谱AI表示,CogVLM2-Video不仅在公共视频理解基准上达到了最新的性能,还在视频字幕生成和时间定位方面表现出色。 ……更多
Meta 公司发布 Imagine Yourself AI 模型
...括:生成合成配对数据以鼓励多样性; 整合了三个文本编码器和一个可训练视觉编码器的完全并行注意力架构; 以及一个从粗到细的多阶段微调过程这些创新技术使该模型能够生成高质量、多样化的图像,同时保持强大的身...……更多
华人团队爆火instructblip抢跑看图聊天
...方法。如上图所示,Q-Former被设计用来从一个冻结的图像编码器的输出中提取视觉特征。根据BLIP-2的论文,Q-Former已经分成两个阶段进行了预训练,通过预训练,它学会了提取可以被LLM消化的文本对齐的视觉特征。在推理过程中...……更多
200小时满载连轴转稳定无压力,惠普战99商用台式机全面评测
...,极大提升了视频处理效率。↑直播软件支持IntelQSV视频编码器 当启用QuickSyncVideo时,惠普战99台式机能够轻松实现4K60帧的高清直播,且不会发生掉帧现象。这一过程中,GPU承担了大量视频编码的负载,有效地减轻了CPU的压力,...……更多
撞墙还是新起点?自回归模型在图像领域展现出Scaling潜力
...这也就是所谓的 token 化。」图像的 token 化通常需要一个编码器 ENC、一个量化算法 QUANT 和一个解码器 DEC。目前,主流的图像 token 化方案有两种:VQGAN 和 BAE;它们的主要区别是离散化隐向量的方式 。经过 token 化处理之后,图像...……更多
微软确认 Win11 24H2 将不再内置 AC-3 编解码器(杜比数字)
...些会用到AC-3 解码器的老片时将无法打开。 实际上,AC-3 编码器(Dolby Digital)目前已经在被逐步淘汰,因此大部分流媒体平台和媒体公司都已经不再使用该编码器。如果你要用到一些使用 AC-3 编码的较旧文件,还可以从 Microsoft ...……更多
文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
...长图形设计。与传统依赖于预训练语言模型如T5或CLIP文本编码器的文本到图像生成模型不同,PGv3完全集成了大型语言模型(LLMs),基于全新的深度融合(Deep-Fusion)架构,利用仅解码器(decoder-only)大型语言模型的知识,来进...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
...训练,其他映射器被冻结。在 Stage 2,研究者冻结了视觉编码器,并训练了 LLM 和多模态映射器。在 Stage 3,研究者针对短数据指令遵循任务对模型全面进行微调,比如使用图像和短视频数据集。在 Stage 4,研究者以持续预训练的...……更多
下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用
...性(similarity)时,传统指标LPIPS等方法依靠预训练的图像编码器,将图像特征嵌入后再计算距离。然而,这类方法只能评估图像与图像之间的相似度(image-to-image metric),而无法判断文本和图像之间的相似度(text-to-image metric)...……更多
显卡对于游戏的重要性,你知道多少?
...专门针对游戏玩家直播的需求推出了一项解决方法:NVENC编码器,通过与直播软件的合作优化,从硬件级层面把显卡的编码能力利用起来,让游戏玩家可以把自己游戏的视频清晰同步到直播网站上。这可不是一项简单的操作,如...……更多
2022-12-15 09:36:00重要性,显卡
英伟达发布rtx4080显卡av1编码
...两款竞品。曾报道,英伟达称采用GeForceRTX40系列的全新双编码器,视频导出的时间缩短将近一半。双编码器可实现协同工作,并自动分配以实现双路输出。它们还可以通过 GeForceExperience 和OBSStudio录制高达8K60的内容。 ……更多
nvidiartx4090可以提供哪些技术?
...得更快的编码速度和更高的直播质量。RTX4090的NVENC和NVDEC编码器还可以进行视频录制和编解码任务,提高工作效率。4090作为人工智能领域的性价比之王,深受广大企业的青睐。其强大的计算能力、先进的图形渲染技术以及高效的...……更多
...的视频编辑体验。经测试,借助RTX 5090 D上多达三个专用编码器以及RTX 5080和5070 Ti 上的两个专用编码器,Wondershare Filmora/万兴喵影的用户在使用搭载RTX 5070 Ti 及以上级别GPU的电脑进行视频剪辑时,其视频导出速度较上一代GPU相比...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...予机器人端到端的推理和操纵能力,本文创新性地将视觉编码器与高效的状态空间语言模型集成,构建了全新的 RoboMamba 多模态大模型,使其具备视觉常识任务和机器人相关任务的推理能力,并都取得了先进的性能表现。同时,...……更多
扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff
...及去噪效果方面均表现出色。研究方法基于图协同过滤的编码器受到简化图神经网络(GNN)成功应用的启发,图那对在社交去噪框架中采用了轻量级图卷积网络(GCN)作为图编码器。 图关系去噪模型隐空间的社交扩散汲取扩散...……更多
NVIDIA:我们的AV1编码 秒杀AMD、Intel!
...自家产品的强大。NVIDIA宣称,RTX 40系列集成的第八代NVENC编码器,相比竞品可以提供更高精度的视频质量,同等码率下画质更好,同等画质下码率更低。NVIDIA还放出了一张静态截图对比,分别来自RTX 4080、RX 7900 XTX、Arc A770,分辨...……更多
开放媒体软件obsstudio29正式版发布
...也就是大家熟知的H.265编码,以及对macOS上原生HEVC和ProRes编码器的支持。2018年,开放媒体联盟(AOMedia)发布了新一代的视频编码AV1(AOMediaVideoCodec1.0)。该编码由开放媒体联盟协力开发,其编码4KUHD视频压缩率比同类编码器平均...……更多
机器人迈向ChatGPT时刻!清华团队首次发现具身智能Scaling Laws
...模,研究团队还在模型规模化方面有三个重要发现:视觉编码器必须经过预训练和完整的微调,缺一不可 扩大视觉编码器的规模能显著提升性能 最令人意外的是:扩大扩散模型的规模却没能带来明显的性能提升,这一现象还值...……更多
Sora背后团队:成立不到1年,站在谷歌肩头,应届博士带队
...还原出一张清晰的图片。Sora采用的架构是通过Transformer的编码器-解码器架构处理包含噪点的输入图像,并在每一步预测出更清晰的图像。DiT架构结合时空Patch,让Sora能够在更多的数据上进行训练,输出质量也得到大幅提高。OpenA...……更多
感官协同配合的精细操纵,人大胡迪团队探索机器人模态时变性挑战
...如图 2 所示):特征提取模块:该模块包含一系列单模态编码器,每个编码器都接受一段简短的单模态观测历史作为输入,并将它们编码为特征。 状态编码器:该模块旨在将各模态特征和动作历史序列编码为表示当前任务状态...……更多
...西班牙格拉纳达大学生物伦理学教授戴维·罗德里格斯·阿里亚斯·韦尔恩警告,这更接近机器“能够读懂思想并转录思想”的未来,但其可能会违背人们的意愿。美国医疗新闻网站statnews针对得克萨斯大学奥斯汀分校的研究发表...……更多
轻量化模型架构catvton的优势在哪里
...著帮助的文本交叉注意力,同时也不需要任何额外的图像编码器来辅助生成。 下表详细地比较了不同方法与CatVTON的模块数量、参数量、可训练参数量、显存占用、推理条件。在网络模块上,CatVTON只需要VAE+UNet,无需任何额外的...……更多
第二届全球数贸会 | 数字人直播什么样?5分钟即可复刻形象和声音
...的还有快手智能视频处理芯片StreamLake - 200和StreamLake硬件编码器。StreamLake - 200芯片集成了快手领先的视频编码、图像处理、AI推理、内容自适应编码等关键算法。在权威世界编码器大赛MSU2022中夺得了4K和1080P赛道24项指标中16项第...……更多
Sora这就落伍了?Meta“最强视频模型”不用DiT,用Llama大力出奇迹了
...介绍了在模型各个环节里的多个创新技巧。比如时空自动编码器(Temporal Autoencoder, TAE),通过它将视频和图像编码到压缩的时空潜在空间中,大幅减少生成视频时的计算量。这些技术让Meta可以“用一个更通用的架构来处理媒体...……更多
腾讯混元上线文生视频并开源,120秒内成片!还有提示词建议
...模型引入了多模态大语言模型(Decoder-only MLLM)作为文本编码器,提升了复杂文本的理解能力,同时支持多语言理解。这一升级使得文本与图像之间的对齐性得到了加强,能够根据用户提供的提示词精确生成符合要求的视频内容...……更多
...慧互通(AICT)研发的首款交通垂直领域大模型,由模态编码器(ModalityEncoder)、投影模型(Projector)和骨干模型(BackboneModel)三部分组成。公司大模型研发团队针对不同模态的编码器分别进行训练,并通过多模态联合训练和微调实现模...……更多
百度研发出广告推荐新系统:大模型加持、转化率提升3.6%
...信息。在技术实现上,百度团队采用了“残差量化变分自编码器(RQ-VAE)”技术,综合了残差学习、量化技术和变分自编码器三种方法。这一技术可以减少信息损失、提高模型的泛化能力,并通过优化模型参数,改善重构效果。...……更多
清华提出时间序列大模型:面向通用时序分析的生成式Transformer
...间序列的大模型(Large Time Series Model, LTSM)。模型采用仅编码器(Decoder-only)结构,基于多领域时间序列进行大规模预训练,通过微调突破了少样本场景下的性能瓶颈,适配不同输入输出长度的时间序列,以及预测,填补,异常...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...图像输入方面,训练了一组适配器权重,将预训练的图像编码器集成到预训练的大语言模型中。具体来说,该适配器:由一系列交叉注意力层组成,负责将图像编码器的表示输入进大语言模型通过在文本-图像对上的训练,实现...……更多
还在花钱看“假高清”?进来看看是谁在坑你
...Multiplatform国内也是如此。爱奇艺基于 AV1 协议自研的 QAV1 编码器在 MSU 世界视频编码器大赛中速度与压缩率同时超过了大多数 H.265 编码器,但你打开一个爱奇艺的视频下载下来看编码数据,还是采用 2003 年的 H.264 协议, 最主要...……更多
更多关于科技的资讯:
数字游民在南京:我推着房间找邻居
随时“云端”办公,自由“安放”工位,数字游民社区兴起数字游民在南京:我推着房间找邻居南京首个乡村数字游民社区坐落于浦口草圣书乡景区
2025-09-26 08:14:00
三迭纪项目入选国家药监局智慧监管典型案例年产3亿片!3D打印药片,片片皆可溯源南报网讯(通讯员唐斐记者张希)近日,国家药品监督管理局信息中心正式公布“2025年药品智慧监管典型案例”
2025-09-26 08:14:00
二〇二五年中国香料香精化妆品精品博览会启幕十七个香妆产业创新转化项目签约南报网讯(记者夏思宇)9月25日上午,2025年中国香料香精化妆品精品博览会在南京扬子江国际会议中心开幕
2025-09-26 08:15:00
厦门网讯(厦门日报通讯员 李汶鸿)24日,在上海市普陀区普熙金融广场PUSH艺术中心举办的“数字人民币国际运营中心业务平台推介会”上
2025-09-26 08:38:00
在智能语音机器人赛道,技术稳定性与迭代能力是核心竞争力,神州泰岳旗下鼎富智能avavox大模型语音机器人依托两大技术优势
2025-09-26 08:52:00
服务升级,烟台联通创新推出急救知识培训增值服务
近日,烟台联通在客户日活动中面向VIP客户创新开展急救知识培训公益增值服务,邀请中国红十字会专业急救讲师现场授课,通过“理论+实操”相结合的方式
2025-09-26 09:24:00
中交一公局集团建筑公司武清城改项目QC成果斩获省部级二等成果奖
近日,由中交一公局集团建筑公司武清城改项目申报的《BIM+智能设备在大型城中村改造项目施工阶段的应用》凭借在特大型群体住宅工程的应用实践
2025-09-26 10:49:00
中新经纬9月26日电 9月25日,小米集团创始人、董事长兼CEO雷军在年度演讲上回顾了小米汽车造车历程。雷军提到,今年6月
2025-09-26 10:54:00
与邻一起 共建美好社区!我爱我家首届社区好邻节启幕
近日,头部房产经纪企业我爱我家正式启动主题为“好邻·好礼·好生活”的2025我爱我家社区好邻节。据介绍,本次活动从9月22日至10月31日
2025-09-26 11:24:00
小米汽车推出独特定制服务:试运营一年,每月最多定制40台
9月25日,小米公司创始人雷军在年度演讲中宣布推出一项独特的服务——小米定制服务。雷军表示,小米YU7是为一群高审美,无法容忍平庸的人设计的
2025-09-26 11:37:00
解放双手!小米推出首款三区洗衣机,衣服、内衣、袜子各占一个筒
9月25日,在年度演讲暨秋季新品发布会上, 小米推出了首款三区洗衣机——米家三区洗衣机Pro 滚筒10kg,售价3999元
2025-09-26 11:38:00
机构:鸿蒙电脑占高端市场份额超70%
华为鸿蒙折叠电脑MateBook Fold非凡大师的上市成为改写高端笔记本市场格局的关键事件。根据GFK 2025年6月统计
2025-09-26 11:38:00
补链强基 延链拓新——济南历城绘就产业发展新图景
鲁网9月26日讯(记者 李晓晨)从算力之巅的超级计算中心到家庭智能的创新终端,从芯片封装的关键环节到水处理技术的自主研发
2025-09-26 12:03:00
从优篮子到 JOBY:唯迹科技的全球化成长之路
在摄影配件行业,“速生速死” 是常态 —— 产品迭代快、价格战频发,多数企业陷入内卷困境。而深圳市唯迹科技有限公司却走出了一条 “反常识” 的发展路径
2025-09-26 12:07:00
让AI规划假期行程,告别烧脑做攻略比价;戴上耳机,和自己的专属AI讲解员一起边逛边聊,拍展品听讲解,拍景点听典故,拍建筑听历史……这种全新的旅行体验
2025-09-26 12:08:00