• 我的订阅
  • 头条热搜
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
...训练,其他映射器被冻结。在 Stage 2,研究者冻结了视觉编码器,并训练了 LLM 和多模态映射器。在 Stage 3,研究者针对短数据指令遵循任务对模型全面进行微调,比如使用图像和短视频数据集。在 Stage 4,研究者以持续预训练的...……更多
下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用
...性(similarity)时,传统指标LPIPS等方法依靠预训练的图像编码器,将图像特征嵌入后再计算距离。然而,这类方法只能评估图像与图像之间的相似度(image-to-image metric),而无法判断文本和图像之间的相似度(text-to-image metric)...……更多
显卡对于游戏的重要性,你知道多少?
...专门针对游戏玩家直播的需求推出了一项解决方法:NVENC编码器,通过与直播软件的合作优化,从硬件级层面把显卡的编码能力利用起来,让游戏玩家可以把自己游戏的视频清晰同步到直播网站上。这可不是一项简单的操作,如...……更多
2022-12-15 09:36:00重要性,显卡
...的视频编辑体验。经测试,借助RTX 5090 D上多达三个专用编码器以及RTX 5080和5070 Ti 上的两个专用编码器,Wondershare Filmora/万兴喵影的用户在使用搭载RTX 5070 Ti 及以上级别GPU的电脑进行视频剪辑时,其视频导出速度较上一代GPU相比...……更多
nvidiartx4090可以提供哪些技术?
...得更快的编码速度和更高的直播质量。RTX4090的NVENC和NVDEC编码器还可以进行视频录制和编解码任务,提高工作效率。4090作为人工智能领域的性价比之王,深受广大企业的青睐。其强大的计算能力、先进的图形渲染技术以及高效的...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...予机器人端到端的推理和操纵能力,本文创新性地将视觉编码器与高效的状态空间语言模型集成,构建了全新的 RoboMamba 多模态大模型,使其具备视觉常识任务和机器人相关任务的推理能力,并都取得了先进的性能表现。同时,...……更多
扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff
...及去噪效果方面均表现出色。研究方法基于图协同过滤的编码器受到简化图神经网络(GNN)成功应用的启发,图那对在社交去噪框架中采用了轻量级图卷积网络(GCN)作为图编码器。 图关系去噪模型隐空间的社交扩散汲取扩散...……更多
开放媒体软件obsstudio29正式版发布
...也就是大家熟知的H.265编码,以及对macOS上原生HEVC和ProRes编码器的支持。2018年,开放媒体联盟(AOMedia)发布了新一代的视频编码AV1(AOMediaVideoCodec1.0)。该编码由开放媒体联盟协力开发,其编码4KUHD视频压缩率比同类编码器平均...……更多
机器人迈向ChatGPT时刻!清华团队首次发现具身智能Scaling Laws
...模,研究团队还在模型规模化方面有三个重要发现:视觉编码器必须经过预训练和完整的微调,缺一不可 扩大视觉编码器的规模能显著提升性能 最令人意外的是:扩大扩散模型的规模却没能带来明显的性能提升,这一现象还值...……更多
Sora背后团队:成立不到1年,站在谷歌肩头,应届博士带队
...还原出一张清晰的图片。Sora采用的架构是通过Transformer的编码器-解码器架构处理包含噪点的输入图像,并在每一步预测出更清晰的图像。DiT架构结合时空Patch,让Sora能够在更多的数据上进行训练,输出质量也得到大幅提高。OpenA...……更多
感官协同配合的精细操纵,人大胡迪团队探索机器人模态时变性挑战
...如图 2 所示):特征提取模块:该模块包含一系列单模态编码器,每个编码器都接受一段简短的单模态观测历史作为输入,并将它们编码为特征。 状态编码器:该模块旨在将各模态特征和动作历史序列编码为表示当前任务状态...……更多
...西班牙格拉纳达大学生物伦理学教授戴维·罗德里格斯·阿里亚斯·韦尔恩警告,这更接近机器“能够读懂思想并转录思想”的未来,但其可能会违背人们的意愿。美国医疗新闻网站statnews针对得克萨斯大学奥斯汀分校的研究发表...……更多
轻量化模型架构catvton的优势在哪里
...著帮助的文本交叉注意力,同时也不需要任何额外的图像编码器来辅助生成。 下表详细地比较了不同方法与CatVTON的模块数量、参数量、可训练参数量、显存占用、推理条件。在网络模块上,CatVTON只需要VAE+UNet,无需任何额外的...……更多
第二届全球数贸会 | 数字人直播什么样?5分钟即可复刻形象和声音
...的还有快手智能视频处理芯片StreamLake - 200和StreamLake硬件编码器。StreamLake - 200芯片集成了快手领先的视频编码、图像处理、AI推理、内容自适应编码等关键算法。在权威世界编码器大赛MSU2022中夺得了4K和1080P赛道24项指标中16项第...……更多
Sora这就落伍了?Meta“最强视频模型”不用DiT,用Llama大力出奇迹了
...介绍了在模型各个环节里的多个创新技巧。比如时空自动编码器(Temporal Autoencoder, TAE),通过它将视频和图像编码到压缩的时空潜在空间中,大幅减少生成视频时的计算量。这些技术让Meta可以“用一个更通用的架构来处理媒体...……更多
腾讯混元上线文生视频并开源,120秒内成片!还有提示词建议
...模型引入了多模态大语言模型(Decoder-only MLLM)作为文本编码器,提升了复杂文本的理解能力,同时支持多语言理解。这一升级使得文本与图像之间的对齐性得到了加强,能够根据用户提供的提示词精确生成符合要求的视频内容...……更多
...慧互通(AICT)研发的首款交通垂直领域大模型,由模态编码器(ModalityEncoder)、投影模型(Projector)和骨干模型(BackboneModel)三部分组成。公司大模型研发团队针对不同模态的编码器分别进行训练,并通过多模态联合训练和微调实现模...……更多
百度研发出广告推荐新系统:大模型加持、转化率提升3.6%
...信息。在技术实现上,百度团队采用了“残差量化变分自编码器(RQ-VAE)”技术,综合了残差学习、量化技术和变分自编码器三种方法。这一技术可以减少信息损失、提高模型的泛化能力,并通过优化模型参数,改善重构效果。...……更多
清华提出时间序列大模型:面向通用时序分析的生成式Transformer
...间序列的大模型(Large Time Series Model, LTSM)。模型采用仅编码器(Decoder-only)结构,基于多领域时间序列进行大规模预训练,通过微调突破了少样本场景下的性能瓶颈,适配不同输入输出长度的时间序列,以及预测,填补,异常...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...图像输入方面,训练了一组适配器权重,将预训练的图像编码器集成到预训练的大语言模型中。具体来说,该适配器:由一系列交叉注意力层组成,负责将图像编码器的表示输入进大语言模型通过在文本-图像对上的训练,实现...……更多
抖音春晚直播观看人数破1.3亿, 火山引擎技术助力“新年俗”新体验
...擎延用了抖音世界杯直播的各项视频云技术能力:自研BVC编码器采用最新的编码算法,针对春晚项目共完成26项技术优化,在春晚极高复杂度场景完成多路4K 10bit 50fps低延迟实时编码;火山引擎高清低码技术将转码码率压缩50%以上,通过...……更多
英伟达发布全新rtx500和rtx1000笔记本电脑
...高质量帧以显著提升性能,带来突破性的AI图形技术。AV1编码器:第八代NVIDIA编码器(NVENC),支持AV1,效率相比H.264高出40%,为广播、流媒体和视频通话带来新的可能性。英伟达表示,配有全新RTX500和1000专业卡的Windows笔记本电脑...……更多
李飞飞空间智能之后,上交、智源、北大提出空间大模型SpatialBot
...么问题?现有模型无法直接理解深度图输入。比如,图像编码器 CLIP/SigLIP 在 RGB 图像上训练,没有见过深度图。 现有大模型数据集,大多仅用 RGB 就可以分析、回答。因此,如果仅仅简单的将现有数据改为 RGBD 输入,模型不会主...……更多
苹果m4系列芯片转录方面明显优于其他cpu和gpu
...码标准,包括AV1等等。也就是说,M4Max最主要优势在于其编码器。与当今大部分只有1~2个编码器的GPU不同,M4Max集成了4个编码器,包括2个常规视频编码引擎和2个ProRes编解码引擎。 ……更多
AI古诗词动画《千秋诗颂》第二辑开播
...生成AI技术,构建起少量样本风格学习以及通用风格感知编码器策略,实现对给定任意参考风格的精准提取,完成更加符合史实同时兼具中国审美的动画原画生成。在动画角色动作方面,创新性打造基于角色动作驱动的视频生成...……更多
刚刚,Llama 3.2 来了!支持图像推理,还有可在手机上运行的版本
...了一组适应器权重(adapter weight),其可将预训练的图像编码器集成到预训练的语言模型中。该适应器由一系列交叉注意层组成,这些层的作用是将图像编码器表征馈送给语言模型。为了将图像表征与语言表征对齐,Meta 在「文...……更多
安卓即将升级,低端设备也能流畅播放 AV1 视频了
...缩技术至关重要。而由开放媒体联盟 (AOMedia) 开发的 AV1 编码器因其出色的压缩效率正受到越来越多的关注。图源 Pixabay据IT之家了解,与 h.264、h265 等传统编码器相比,AV1 可以在更低的比特率下提供相同画质的视频,从而降低流...……更多
用过GPT-4 Turbo以后,我们再也回不去了
...件,文件包含所要解决问题的自然语言描述以及用于评估编码器是否正确解决问题的测试套件。 基准测试分为两步:第一次尝试时,Aider 向 GPT 提供要编辑的桩代码文件以及描述问题的自然语言指令。这些指令反映了用户如何...……更多
全新AMD Radeon PRO工作站显卡支持下一代专业内容创建、CAD和AI应用程序
...16GB的高速VRAM允许3D艺术家和视频编辑使用更高分辨率的模型和纹理以及处理复杂的效果。它还支持应用程序之间的数据交换,允许用户在编辑、合成和修饰之间进行多任务处理,以满足项目的交付期限。此外,凭借业界领先的Di...……更多
天工开物 智破难关
...与人类不一样,人形机器人的关节里藏着电机、减速器、编码器、控制器四大关键零部件:电机能让关节动起来,同时借助减速器控制转速;编码器用来记录运动的位置,控制器则让关节精准发力。 原理看起来简单,但把这些...……更多
更多关于科技的资讯:
在数字经济浪潮奔涌、国企改革持续深化的时代背景下,绵阳安鼎元作为四川安州发展集团旗下专业的国有资产管理平台,勇立潮头,以深刻的变革意识和前瞻的战略视野
2025-11-27 10:07:00
厦门网讯(厦门日报记者 沈彦彦 王元晖)“政策一出台,咨询电话就没停过!”厦门厦旅国际旅行社有限公司湖滨东营业部负责人谢晓燕放下手中的咨询电话
2025-11-27 08:12:00
“脑”力全开!江西抢滩脑机接口新蓝海
当好莱坞经典电影《盗梦空间》描绘的人类通过脑机接口潜入他人意识的场景,从科幻照进现实,一场关乎未来产业格局的竞赛已悄然启幕
2025-11-27 07:13:00
专利技术遭盗用,创新成果被侵犯,专利权人该如何维权?11月24日,市知识产权纠纷调委会通过一起实用新型专利侵权的调解案例释法
2025-11-26 08:11:00
感恩节“心”守护:灵动生活集团全链条心理服务破局,让3000万用户听见温暖的回响
当感恩节的暖意在街头巷尾流转,“守护”与“感恩”成为叩击人心的关键词。在心理健康已从“小众需求”转变为“全民刚需”的今天
2025-11-26 08:35:00
省发展改革委近日批复了山西省教育科技人才一体化服务产业云平台项目可行性研究报告,建设地址位于中北大学校内。作为山西聚焦“产学研用深度融合”的关键信息化基建项目
2025-11-26 08:41:00
为推动智能建造落地应用,搭建行业交流平台,近日,“晋塔”智能装备观摩活动在太原市多个施工项目同步启动。“晋塔”智能施工升降机
2025-11-26 08:42:00
经济热力站|绿色转型为基 金融创新为翼 科技赋能为核——助推首都经济高质量发展再上新台阶
11月19日,“京彩不设限・经济热力站”月度主题走访活动再度启程,记者跟随采访团先后走进北京绿色交易所、中国邮政储蓄银行北京分行及北京银行顺义科技研发中心
2025-11-26 10:06:00
赞皇县:AI赋能“一网通办” 业务办理效率提升70%
河北新闻网讯(次柳静)近日,石家庄市赞皇县数据和政务服务局依托DeepSeek大模型与智能算法,创新打造AI“智能填报”平台
2025-11-26 10:07:00
河北师范大学金融学院举行“产品经理人才共创培养体系”主题培训
河北新闻网讯 近日,河北师范大学金融学院邀请北京来学吧信息技术有限公司相关负责人到校,开展了主题为“产品经理人才共创培养体系”主题培训
2025-11-26 10:09:00
南京生物医药:研发“拔节孕穗”,产业新星闪耀
第91届全国药交会在宁落幕南京生物医药:研发“拔节孕穗”,产业新星闪耀□南京日报/紫金山新闻记者张甜甜连续3天,南京国际博览中心人流如织
2025-11-26 10:26:00
2025年两院院士增选结果揭晓 南京地区7人入选 在宁院士总数达102人
南报网讯(记者何洁张安琪)11月21日,2025年两院院士增选结果正式揭晓,选举产生中国科学院院士73人、中国工程院院士71人
2025-11-26 10:27:00
隐风文化:锚定四大理念,以精品力穿越短剧周期
由北京隐风文化科技有限公司出品的奇幻爱情短剧《岁岁怀安》延续预约150万的热度,上线后迅速跃居红果站内热播榜高位,这也是今年团队继《咬清梨》《怎敌她动人》之后
2025-11-26 11:06:00
视源股份荣获2024年度广东省科技进步一等奖
2025年11月20日,广东省人民政府正式发布《2024年度广东省科学技术奖通报》(粤府〔2025〕50号)。视源股份牵头完成的“高自然度智能交互显示终端关键技术及产业化”项目
2025-11-26 11:06:00
视源股份成为英特尔首批尊享级合作伙伴 合作再升级
近日,英特尔合作伙伴联盟完成战略升级,联盟最高等级“钛金级”正式更迭为“尊享级”。视源股份凭借其在计算机领域的深厚积累
2025-11-26 11:06:00