• 我的订阅
  • 头条热搜
LeCun 的世界模型初步实现!基于预训练视觉特征,零样本规划
...成果:基于预训练的视觉特征训练的世界模型可以实现零样本规划!也就是说该模型无需依赖任何专家演示、奖励建模或预先学习的逆向模型。论文标题:DINO-WM: World Models on Pre-trained Visual Features enable Zero-shot Planning ……更多
百万鲁棒数据训练,3D场景大语言模型新SOTA!IIT等发布Robin3D
...性上存在两点不足:1. 绝大多数3D多模态指令数据对是正样本对,缺乏负样本对或者对抗性样本对。模型在这种数据上训练缺乏一定的辨识能力,因为无论被问到什么问题,模型只会输出正面的回答。因此碰到问题与场景无关时...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...、指令遵循和健壮性,团队还整理出了一套包含 110 万个样本的引用与引用指令调整数据集 GRIT。GRIT 中包含多个层次的空间知识,涵盖对象、关系、区域描述和复杂推理等要素。GRIT 包含三种数据类型:被转换为指认遵循格式的...……更多
跨模态大升级!少量数据高效微调,LLM教会CLIP玩转复杂文本
...开放世界知识,让它能真正构建一个的跨模态空间。在零样本检索任务上,CLIP 也达成了前所未有的性能提升。论文标题:LLM2CLIP: POWERFUL LANGUAGE MODEL UNLOCKS RICHER VISUAL REPRESENTATION 论文链接……更多
微美全息构建基于深度迁移学习的图像分类融合模型, 提高图像分类的准确性和效率
...,由于数据集的限制和模型的复杂性,深度学习模型在小样本数据集上的表现仍然有待提高。为了解决这个问题,微美全息(NASDAQ:WIMI)将迁移学习引入到图像分类任务中,构建了图像分类融合模型,通过利用在大规模数据集上训...……更多
Meta提出“可持续思维链”,让大模型在连续潜空间中推理
...还将优化策略应用于 Transformer 位置嵌入,从而提高了零样本运动迁移能力。他们将 DiTFlow 与最近发布的方法进行了对比评估,结果显示 DiTFlow 在多项指标和人工评估方面均优于所有方法。论文链接:https://arxiv.org/abs/2412.07776项目...……更多
多模态模型免微调接入互联网,即插即用新框架,效果超闭源方案
...的实体单词替换为其上分位词,与图片一起组成视觉问答样本。第四步,伪标注生成。为了训练网页过滤器和内容过滤器,需要对网页/片段进行打分。 对于一个视觉问答样本和一个网页/片段,研究者基于两个原则进行打分:...……更多
清华提出时间序列大模型:面向通用时序分析的生成式Transformer
...快速适配。然而,即便是目前领域前沿的时序模型,在少样本场景下依然会产生明显的性能劣化。时序预测模型PatchTST在不同数据稀缺条件下的效果(2)通用性:小型深度模型训练后仅适合单一任务和场景,具有固定输入输出长...……更多
OpenCity大模型预测交通路况,零样本下表现出色,来自港大百度
...域和时间城市交通模式的固有多样性和变化。 卓越的零样本预测能力:与仅在目标区域训练的全样本模型相比,OpenCity展示了更优越的性能。这种显著的零样本能力突出了模型学习泛化表征的能力,使其能够无需广泛重新训练或...……更多
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024
...的多步误差最小化(MEM)方法,用于生成多模态不可学习样本,以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器,MEM方法有效地误导模型,降低其对隐私数据的学习能力,并在不同模型间展现出强...……更多
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
...12 个数据集上进行的实验表明,这一方法比学生模型的零样本性能平均提高了 13.53%,比 SOTA 知识提炼基线提高了 6.84%。此外,这一方法还展示了样本效率——仅使用训练数据中 10% 的正确前向推理,它就超越了使用 10 倍前向推...……更多
零样本即可时空预测!港大、华南理工等发布时空大模型UrbanGPT | KDD 2024
...有效的时空特征。C2. 大型语言模型和现有时空模型在零样本场景下的泛化能力不足:如图2所示,大型语言模型LLaMA能够根据输入文本推断流量模式。然而,它在处理具有复杂时空依赖性的数字时间序列数据时,有时会出现预测...……更多
21.5万张X光,78万个问题!德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA
...准确率提高62%。同时,作者还与2位临床专家合作对100个样本的标签进行了全面的评估,进一步 帮助微调LLM。基于该数据集,作者提出了一种新的基于图(Graph)的可解释的医学VQA方法利用图注意力来学习回答临床问题时的逻辑...……更多
贾扬清共一论文获ICML时间检验奖:著名框架Caffe前身
...征在语义聚类方面优于GIST和LLC等传统特征。即使在训练样本稀缺的情况下,如单样本学习,DeCAF仍然表现出色。论文还详细分析了网络各层的计算时间分布,发现全连接层占用了大部分计算时间。此外,论文还探讨了dropout等正...……更多
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
...义能力,也具备语音模型的表达能力;模型还能够在少量样本的情况下跨模态学习新任务(例如自动语音识别、文本转语音、语音分类)。不过需要注意的是,和其他预训练模型一样,Sprit LM也可能会生成一些不安全的内容,所...……更多
语言、机器人破壁,MIT等用GPT-4生成模拟任务,并迁移到真实世界
...这些策略在所有生成任务上都能很好地泛化,并提高了零样本泛化性能。其中与 GPT-4 生成任务的联合训练可以将泛化性能提升 50%,并在模拟中将大约 40% 的零样本任务迁移到新任务中。‍最后,研究者还考虑了模拟到真实的迁...……更多
谢赛宁新作:表征学习有多重要?一个操作刷新SOTA,DiT训练速度暴涨18倍
...型,已经成为了一种可扩展的途径,并在有挑战性的的零样本文生图/文生视频任务上取得了非常成功的结果。最近的研究表明,生成扩散模型中的去噪过程可以在模型内部的隐藏状态中引入有意义的表示,但这些表示的质量目...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
... where2act,位置和方向的损失公式如下:其中,N 表示训练样本的数量,Tr (A) 表示矩阵 A 的迹。RoboMamba 只预测图像中接触像素的二维位置(x, y),然后使用深度信息将其转换为三维空间。为了评估这一微调策略,我们使用 SAPIEN ...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...的GPT-4V在奋力追平GPT-4V的同时,LLaVa-1.6也展现出强大的零样本中文能力。LLaVa-1.6不需要额外训练便具备杰出的中文理解和运用能力,其在中文多模态场景下表现优异,使得用户不必学习复杂的“prompt”便可以轻松上手,这对于执...……更多
LLM破局泛化诊断难题,MSSP刊登北航PHM实验室健康管理大模型研究
...泛化故障诊断难题的技术路线,初步展现了对跨工况、小样本、跨对象等泛化诊断任务的综合解决能力。 北航 PHM 实验室为业界学者应对故障诊断领域泛化痛点问题提供了新思路,也是深入开展大模型与健康管理交叉研究并建立...……更多
阿里妈妈首提AIGB并实现大规模商业化落地,将正式开源Benchmark
...同,例如,Transformer 模型主要基于自注意力机制,能够对样本中跨时序和分层信息进行提取和关联,擅长进行自回归处理。而 Diffusion Model 则缓慢地将随机噪声添加到数据中,然后学习逆向扩散过程以从噪声中构造所需的数据样...……更多
...,分别是模型训练分类器法(也被称为监督分类器法)、零样本分类器法、文本水印法。“三种检测方法本质上都是利用AI检测AI,且各有优劣。”鲍光胜说。模型训练分类器法,首先要收集大量人类创作内容与AIGC,然后以此为基...……更多
首个多模态连续学习综述,港中文、清华、UIC联合发布
...中:模态对齐和模态融合。在模态对齐过程中,单个数据样本的不同模态特征往往会在连续学习过程中出现分散,这种现象被称为 MMCL 中的空间紊乱。这种发散可能会导致更严重的性能下降。在模态融合方面,在非 CL 环境中使...……更多
联汇科技荣获2024人工智能隐形冠军企业标杆Top10
...、亿级图片、万级视频大规模预训练,实现用更小的标注样本数量,融合更多的模态信息,获得更为准确的AI模型,可灵活适配多场景应用需求。依托核心技术与产品服务能力,未来,联汇科技将继续携手合作伙伴,推动人工智...……更多
开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用
...(3)MLLM 可以通过设计系统指令前置于用户提示来充当零样本学习器,帮助文本特征更加关注关键词。此外,如图 8 所示,MLLM 基于因果注意力,而 T5-XXL 利用双向注意力,为扩散模型产生更好的文本指导。因此,我们遵循的方...……更多
NeurIPS 2024 | FaceChain团队新作,开源拓扑对齐人脸表征模型
...数, 基于 Margin 的损失函数能够鼓励模型执行更加高效的样本到类别的比较,因此能够促进人脸识别模型取得更好的识别精度。其中,ArcFace 成为业界训练人脸识别模型首选的损失函数。2. 持续同调下面介绍一下持续同调与我们...……更多
扩散模型版CS: GO!世界模型+强化学习:2小时训练登顶Atari 100K
...非平衡热力学启发的生成模型,通过逆转加噪过程来生成样本。假设有一个由连续时间变量τ索引的扩散过程,其中τ的取值范围是0到T,然后有一系列的分布,以及边界条件:在τ=0时,分布是数据的真实分布,而在τ=T时,分布...……更多
类人神经网络再进一步!DeepMind最新50页论文提出AligNet框架:用层次化视觉概念「对齐」人类
...个方面的表现:单次分类任务,考验了模型在只有极少量样本的情况下对新类别的识别能力;分布偏移,即模型在面对与训练数据分布不同的数据时的表现;以及分布外鲁棒性,即模型在面对完全未知类型的数据时的稳定性和鲁...……更多
...个高斯平滑窗口来完成,而归一化的主要任务是去除签名样本对手写板和签名笔的依赖性。然后可以从中导出一些静态特征或者动态特征。静态特征主要包括笔划个数、长短笔划个数比、笔段长度等,动态特征则包括与时间相关...……更多
AI “早筛” 癌症,准确区分13种癌症,准确率98.2%,人类尽早治疗癌症还远吗?
...logy Methods and Protocols 上。据论文描述,该模型依赖于组织样本(而不是血液中的 DNA 片段),目前还处于实验阶段,需要对更多样化的活检样本进行额外的训练和测试,方可进一步用于临床。研究人员认为,这项研究的一个重要...……更多
更多关于科技的资讯:
涉及两起命案:福特被深度调查!
快科技1月23日消息,近日,美国家公路交通安全管理局(NHTSA)宣称,已对福特BlueCruise驾驶辅助系统展开工程分析(EA)
2025-01-23 18:33:00
当前设计塞不进电池:纯电版路虎卫士将推迟至2030年
快科技1月23日消息,捷豹路虎首席商务官Lennard Hoornik在接受采访时透露,电动版路虎卫士预计要到2030年前后才会问世
2025-01-23 18:33:00
国人骄傲!阿里云、华为首席技术官双双入选美国计算机协会
快科技1月23日消息,据媒体综合报道,今日凌晨,美国计算机协会 ACM(Association for Computing Machinery)公布了最新一届会士名单
2025-01-23 18:33:00
中韩独享!三星Galaxy S25 Ultra 16GB版本无缘欧美市场
快科技1月23日消息,三星Galaxy 25系列已面向全球发布,所有型号其实内存均为12GB。其中,三星Galaxy S25 Ultra独享16GB大内存
2025-01-23 18:33:00
奇瑞2025王炸开局!要做中国大G 新车秒变船 排水量4吨
中国的豪华越野市场,又闯进一位新选手。昨晚,奇瑞正式发布全新产品序列——捷途纵横,这是奇瑞品牌向上战略的关键一步,起点很高
2025-01-23 18:33:00
599元起!玄派玄熊猫PD75M V2机械键盘开售:彩屏+旋钮、索尼克轴
快科技1月23日消息,玄派科技正式上架了玄熊猫PD75M V2机械键盘,其特点是内置彩屏和金属旋转按钮,首发价格分别为599元和629元
2025-01-23 18:33:00
小米SU7最贵配色!雷军晒璀璨洋红实车:明天开始陆续进店
快科技1月23日消息,雷军最新发文称,小米SU7璀璨洋红明天开始陆续进店,届时大家就能去店里看到实车了。他还晒出了几张在小米汽车工厂拍摄的实车照片
2025-01-23 18:33:00
Intel前CEO基辛格新动向公布!成初创AI芯片公司种子投资人
快科技1月23日消息,在离开英特尔后,前CEO帕特·基辛格(Pat Gelsinger)在社交媒体上公布了新动向,成为英国AI芯片初创公司Fractile
2025-01-23 18:33:00
RTX 5090缺货不可思议!英国顶级零售商只有几块
快科技1月23日消息,由于AIC沟通问题、中国春节放假、BIOS调试等种种原因,RTX 5090/5090D、RTX 5080上市初期的供货将非常紧张
2025-01-23 18:33:00
上半年最值得关注的5款新车盘点:看完你会买吗
说实话,25年上半年并不是购车的较好时机,因为英伟达下一代最强算力平台Thor有望会从6月开始上市,部分车企的明星产品也推迟到了对应时间点
2025-01-23 18:33:00
3C数码国家补贴至高省2000元 手机补贴15%
京东货节大促将在今晚 24 点正式结束,年前最后一波福利不要错过。京东红包每天抽 3 次 面额至高 9999 元:点此抽红包(1 月 23 日 24 点结束)手机
2025-01-23 18:33:00
被五步蛇咬了 只走四步还会死吗
提示:本集内容涉及大量蛇,对蛇敏感人士建议不要打开,想“知己知彼”对付毒蛇的建议收看,怕被毒蛇咬的建议收藏。责任编辑:上方文Q文章内容举报
2025-01-23 18:33:00
又一家国产新势力爆雷!员工工资数月未发 强制放假
快科技1月23日消息,据博主爆料称,又一家国产造车新势力爆雷,员工已被拖欠数月工资,且被安排强制放假。被传爆雷的新势力是智行盒子
2025-01-23 18:33:00
“天关”卫星探测到宇宙早期爆发的软X射线信号
本文转自:人民日报客户端基于天关卫星的观测数据,中国科学院国家天文台等单位的科研人员,发现1例来自宇宙早期的伽马射线暴
2025-01-23 18:35:00
“我们食品厂生产的银丝面久煮不烂、晶莹剔透,入口香软滑嫩,在市场上的销售一直很好。感谢咱农商银行提供的50万元的信贷资金
2025-01-23 19:03:00