• 我的订阅
  • 头条热搜
LeCun 的世界模型初步实现!基于预训练视觉特征,零样本规划
...成果:基于预训练的视觉特征训练的世界模型可以实现零样本规划!也就是说该模型无需依赖任何专家演示、奖励建模或预先学习的逆向模型。论文标题:DINO-WM: World Models on Pre-trained Visual Features enable Zero-shot Planning ……更多
百万鲁棒数据训练,3D场景大语言模型新SOTA!IIT等发布Robin3D
...性上存在两点不足:1. 绝大多数3D多模态指令数据对是正样本对,缺乏负样本对或者对抗性样本对。模型在这种数据上训练缺乏一定的辨识能力,因为无论被问到什么问题,模型只会输出正面的回答。因此碰到问题与场景无关时...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...、指令遵循和健壮性,团队还整理出了一套包含 110 万个样本的引用与引用指令调整数据集 GRIT。GRIT 中包含多个层次的空间知识,涵盖对象、关系、区域描述和复杂推理等要素。GRIT 包含三种数据类型:被转换为指认遵循格式的...……更多
微美全息构建基于深度迁移学习的图像分类融合模型, 提高图像分类的准确性和效率
...,由于数据集的限制和模型的复杂性,深度学习模型在小样本数据集上的表现仍然有待提高。为了解决这个问题,微美全息(NASDAQ:WIMI)将迁移学习引入到图像分类任务中,构建了图像分类融合模型,通过利用在大规模数据集上训...……更多
多模态模型免微调接入互联网,即插即用新框架,效果超闭源方案
...的实体单词替换为其上分位词,与图片一起组成视觉问答样本。第四步,伪标注生成。为了训练网页过滤器和内容过滤器,需要对网页/片段进行打分。 对于一个视觉问答样本和一个网页/片段,研究者基于两个原则进行打分:...……更多
清华提出时间序列大模型:面向通用时序分析的生成式Transformer
...快速适配。然而,即便是目前领域前沿的时序模型,在少样本场景下依然会产生明显的性能劣化。时序预测模型PatchTST在不同数据稀缺条件下的效果(2)通用性:小型深度模型训练后仅适合单一任务和场景,具有固定输入输出长...……更多
OpenCity大模型预测交通路况,零样本下表现出色,来自港大百度
...域和时间城市交通模式的固有多样性和变化。 卓越的零样本预测能力:与仅在目标区域训练的全样本模型相比,OpenCity展示了更优越的性能。这种显著的零样本能力突出了模型学习泛化表征的能力,使其能够无需广泛重新训练或...……更多
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024
...的多步误差最小化(MEM)方法,用于生成多模态不可学习样本,以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器,MEM方法有效地误导模型,降低其对隐私数据的学习能力,并在不同模型间展现出强...……更多
零样本即可时空预测!港大、华南理工等发布时空大模型UrbanGPT | KDD 2024
...有效的时空特征。C2. 大型语言模型和现有时空模型在零样本场景下的泛化能力不足:如图2所示,大型语言模型LLaMA能够根据输入文本推断流量模式。然而,它在处理具有复杂时空依赖性的数字时间序列数据时,有时会出现预测...……更多
21.5万张X光,78万个问题!德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA
...准确率提高62%。同时,作者还与2位临床专家合作对100个样本的标签进行了全面的评估,进一步 帮助微调LLM。基于该数据集,作者提出了一种新的基于图(Graph)的可解释的医学VQA方法利用图注意力来学习回答临床问题时的逻辑...……更多
贾扬清共一论文获ICML时间检验奖:著名框架Caffe前身
...征在语义聚类方面优于GIST和LLC等传统特征。即使在训练样本稀缺的情况下,如单样本学习,DeCAF仍然表现出色。论文还详细分析了网络各层的计算时间分布,发现全连接层占用了大部分计算时间。此外,论文还探讨了dropout等正...……更多
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
...义能力,也具备语音模型的表达能力;模型还能够在少量样本的情况下跨模态学习新任务(例如自动语音识别、文本转语音、语音分类)。不过需要注意的是,和其他预训练模型一样,Sprit LM也可能会生成一些不安全的内容,所...……更多
语言、机器人破壁,MIT等用GPT-4生成模拟任务,并迁移到真实世界
...这些策略在所有生成任务上都能很好地泛化,并提高了零样本泛化性能。其中与 GPT-4 生成任务的联合训练可以将泛化性能提升 50%,并在模拟中将大约 40% 的零样本任务迁移到新任务中。‍最后,研究者还考虑了模拟到真实的迁...……更多
谢赛宁新作:表征学习有多重要?一个操作刷新SOTA,DiT训练速度暴涨18倍
...型,已经成为了一种可扩展的途径,并在有挑战性的的零样本文生图/文生视频任务上取得了非常成功的结果。最近的研究表明,生成扩散模型中的去噪过程可以在模型内部的隐藏状态中引入有意义的表示,但这些表示的质量目...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
... where2act,位置和方向的损失公式如下:其中,N 表示训练样本的数量,Tr (A) 表示矩阵 A 的迹。RoboMamba 只预测图像中接触像素的二维位置(x, y),然后使用深度信息将其转换为三维空间。为了评估这一微调策略,我们使用 SAPIEN ...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...的GPT-4V在奋力追平GPT-4V的同时,LLaVa-1.6也展现出强大的零样本中文能力。LLaVa-1.6不需要额外训练便具备杰出的中文理解和运用能力,其在中文多模态场景下表现优异,使得用户不必学习复杂的“prompt”便可以轻松上手,这对于执...……更多
...,分别是模型训练分类器法(也被称为监督分类器法)、零样本分类器法、文本水印法。“三种检测方法本质上都是利用AI检测AI,且各有优劣。”鲍光胜说。模型训练分类器法,首先要收集大量人类创作内容与AIGC,然后以此为基...……更多
首个多模态连续学习综述,港中文、清华、UIC联合发布
...中:模态对齐和模态融合。在模态对齐过程中,单个数据样本的不同模态特征往往会在连续学习过程中出现分散,这种现象被称为 MMCL 中的空间紊乱。这种发散可能会导致更严重的性能下降。在模态融合方面,在非 CL 环境中使...……更多
联汇科技荣获2024人工智能隐形冠军企业标杆Top10
...、亿级图片、万级视频大规模预训练,实现用更小的标注样本数量,融合更多的模态信息,获得更为准确的AI模型,可灵活适配多场景应用需求。依托核心技术与产品服务能力,未来,联汇科技将继续携手合作伙伴,推动人工智...……更多
NeurIPS 2024 | FaceChain团队新作,开源拓扑对齐人脸表征模型
...数, 基于 Margin 的损失函数能够鼓励模型执行更加高效的样本到类别的比较,因此能够促进人脸识别模型取得更好的识别精度。其中,ArcFace 成为业界训练人脸识别模型首选的损失函数。2. 持续同调下面介绍一下持续同调与我们...……更多
扩散模型版CS: GO!世界模型+强化学习:2小时训练登顶Atari 100K
...非平衡热力学启发的生成模型,通过逆转加噪过程来生成样本。假设有一个由连续时间变量τ索引的扩散过程,其中τ的取值范围是0到T,然后有一系列的分布,以及边界条件:在τ=0时,分布是数据的真实分布,而在τ=T时,分布...……更多
类人神经网络再进一步!DeepMind最新50页论文提出AligNet框架:用层次化视觉概念「对齐」人类
...个方面的表现:单次分类任务,考验了模型在只有极少量样本的情况下对新类别的识别能力;分布偏移,即模型在面对与训练数据分布不同的数据时的表现;以及分布外鲁棒性,即模型在面对完全未知类型的数据时的稳定性和鲁...……更多
...个高斯平滑窗口来完成,而归一化的主要任务是去除签名样本对手写板和签名笔的依赖性。然后可以从中导出一些静态特征或者动态特征。静态特征主要包括笔划个数、长短笔划个数比、笔段长度等,动态特征则包括与时间相关...……更多
AI “早筛” 癌症,准确区分13种癌症,准确率98.2%,人类尽早治疗癌症还远吗?
...logy Methods and Protocols 上。据论文描述,该模型依赖于组织样本(而不是血液中的 DNA 片段),目前还处于实验阶段,需要对更多样化的活检样本进行额外的训练和测试,方可进一步用于临床。研究人员认为,这项研究的一个重要...……更多
SIGGRAPH上首个Real-Time Live的中国团队用生成式AI创建3D世界
...势。下图展示了研究者从数据集中检索到的前三个最邻近样本。CLAY 生成的高质量几何体与提示词匹配,但与数据集中的样本有所不同,展现出了足够的丰富度,具备大模型涌现能力的特点。 为了使生成的数字资产能够直接用...……更多
扩散模型训练方法一直错了!谢赛宁:Representation matters
...」?他表示:「我们可能一直都在用错误的方法训练扩散模型。」即使对生成模型而言,表征也依然有用。基于此,他们提出了 REPA,即表征对齐技术,其能让「训练扩散 Transformer 变得比你想象的更简单。」Yann LeCun 也对他们的...……更多
NeurIPS | 消除多对多问题,清华大规模细粒度视频片段标注新范式
...y Aware Noise Evaluator(C),该模块生成并选择被扰动的正负样本,通过难负样本增强的对比损失和匹配损失来微调 UMT。这个评估器对描述进行评分,以识别不准确描述。图 2 展示了该研究的 VERIFIED 标注流程图。为了让大模型像人...……更多
与OpenAI o1技术理念相似,TDPO-R算法有效缓解奖励过优化问题
...他域外奖励函数(即不同于优化目标的奖励标准)对生成样本进行评分,会发现随着目标奖励逐渐上升,域外奖励评分的增长速度明显放缓,甚至出现域外评分逐渐下降的情况。这表明,模型在一个特定奖励函数上取得高分时,...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...iffusion、Imagen、Muse。DALL·E2 是来自OpenAI的生成模型,在零样本学习上做出大突破。与DALL・E一样,两点依旧是CLIP模型,除了训练数据庞大,CLIP基于Transformer对图像块建模,并采用对比学习训练,最终帮助DALL・E2取得了不错的生成...……更多
感官协同配合的精细操纵,人大胡迪团队探索机器人模态时变性挑战
...理解整合到模仿学习过程中,我们首先为每个数据集中的样本添加了一个阶段标签,并将动作标签和阶段标签共同作为监督信号训练包含四个模块的 MS-Bot 框架(如图 2 所示):特征提取模块:该模块包含一系列单模态编码器,...……更多
更多关于科技的资讯:
浙大研制出可穿戴变脸面具:一张面具无痕切换8种不同脸型
快科技3月10日消息,浙江大学发文称,该校机械工程学院邹俊教授课题组研制出一种可穿戴的变脸面具。这种面具实现了一张面具在多个相貌之间的无痕切换
2025-03-10 14:47:00
国产机器狗宇树Go1新技能:靠自己蹬腿滑滑板
快科技3月10日消息,据报道,密歇根大学与南方科技大学的联合研究团队近日取得突破,通过混合自主学习技术,成功让宇树Go1机器狗掌握了蹬腿滑滑板的技能
2025-03-10 14:47:00
21.7特斯拉!米哈游投资的能量奇点创高温超导磁体新纪录
快科技3月10日消息,今日,能量奇点宣布其在高温超导磁体领域取得重大突破。能量奇点自主研制的大孔径强场磁体——经天磁体成功完成了首轮通流实验
2025-03-10 14:47:00
华为nova13 Pro影像评测:氛围感照片制造机
一、前言:在当下,记录生活已经成为人们日常生活的一部分。尤其是情侣间,用镜头定格那些甜蜜的瞬间,不仅是一种记录,更是一种表达情感的方式
2025-03-10 14:47:00
聚力谋新篇|胡望明委员:让人工智能重新定义钢铁行业
本文转自:人民网-上海频道人民网记者 唐小丽“智能化对钢铁行业而言,无疑是一次革命性的机遇,它不仅标志着技术上的革新,更是推动行业迈向高质量发展的关键力量
2025-03-10 14:49:00
国家超算互联网平台接入阿里千问大模型
3月10日消息,国家超算互联网平台接入阿里巴巴通义千问大模型,对外提供千问QwQ-32B API 服务,用户可免费获得100万tokens
2025-03-10 14:54:00
高天试验设备|冷热冲击试验箱的内部组成部件
当我们对产品进行冷热试验时,会需要用到冷热冲击试验箱。冷热冲击试验箱是一种常用的实验设备,主要是用于测试材料结构或复合材料
2025-03-10 15:00:00
南京试剂:春日健行,共赴自然之约
“等闲识得东风面,万紫千红总是春”。为关爱员工身心健康,倡导绿色生活理念,在第115个国际妇女节这个美好日子里,南京试剂以“相约春天
2025-03-10 15:01:00
高天试验设备|高低温冲击试验箱和高低温试验箱有什么区别?
高低温冲击试验箱是一种精密仪器设备,主要是用来测试金属、塑料、橡胶、电子等材料在瞬间高温及低温情况下的性能稳定性。而高低温试验箱主要通过控制高温
2025-03-10 15:02:00
科技赋能消费新体验,机器人亮相下沙奥特莱斯
在消费升级与科技发展的时代背景下,科技元素正以前所未有的速度渗透到人们生活的各个领域,从日常出行到休闲娱乐,科技变革随处可见
2025-03-10 15:03:00
高天试验设备|操作高低温冲击试验箱的基本步骤
高低温冲击试验箱是一种精密仪器设备,主要用来测试金属、塑料、橡胶、电子等材料在瞬间高温及低温情况下的性能稳定性。不过高低温冲击试验箱作为一项关键的产品质量检测工具
2025-03-10 15:03:00
罗永浩发微博招人!疑布局人工智能操作系统与AI手机市场
3月10日,罗永浩通过其个人微博发布招聘信息,其AR创业公司细红线科技(Thin Red Line)2025年春季招聘启动
2025-03-10 15:04:00
你达标了吗 智联报告:2025年职场女性平均月薪8978元 男性平均月薪10320元
快科技3月10日消息, 近日,智联招聘发布的《2025中国女性职场现状调查报告》显示,2025年职场女性平均月薪8978元
2025-03-10 15:17:00
美媒急了:为啥小米能造车3年就成功 苹果用了10年研究却不行
快科技3月10日消息,近日美国权威媒体《纽约时报》发文,对小米汽车的成功表示赞赏。文章指出,中国电子产品巨头小米在短短三年内成功推出了首款电动汽车SU7
2025-03-10 15:17:00
宇树机器人加速全球市场扩张:入驻阿里跨境平台
快科技3月10日消息,据媒体报道,近日,在今年春晚舞台上一战成名的宇树科技,已在阿里跨境电商平台速卖通开设官方店铺,并上架了多款商品
2025-03-10 15:17:00