• 我的订阅
  • 头条热搜
扩散模型训练方法一直错了!谢赛宁:Representation matters
...」?他表示:「我们可能一直都在用错误的方法训练扩散模型。」即使对生成模型而言,表征也依然有用。基于此,他们提出了 REPA,即表征对齐技术,其能让「训练扩散 Transformer 变得比你想象的更简单。」Yann LeCun 也对他们的...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research、Google DeepMind 和 Google Cloud 共同推出了一个更小、更快、更强大的视觉语言模型(VLM)——PaLI-3,该模型与相似的体...……更多
微美全息(NASDAQ:WIMI)将迁移学习引入到语义分割模型,实现高质量的语义分割任务
...景理解、图像分析、机器人感知和图像分割等。语义分割模型是计算机视觉领域中的一种模型,旨在将图像中的每个像素分配给特定的语义类别。与传统的图像分类模型只能给整个图像分配一个类别不同,语义分割模型能够为图...……更多
1890美元,就能从头训练一个还不错的12亿参数扩散模型
...只用1890美元、3700 万张图像,就能训练一个还不错的扩散模型。现阶段,视觉生成模型擅长创建逼真的视觉内容,然而从头开始训练这些模型的成本和工作量仍然很高。比如 Stable Diffusion 2.1 花费了 200000 个 A100 GPU 小时。即使研...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
现在,长上下文视觉语言模型(VLM)有了新的全栈解决方案 ——LongVILA,它集系统、模型训练与数据集开发于一体。现阶段,将模型的多模态理解与长上下文能力相结合是非常重要的,支持更多模态的基础模型可以接受更灵活...……更多
谷歌在AI赛道加速
...oogle 的 AI 研究实验室Google DeepMind 发布了一项关于训练 AI 模型的新研究,Google 声称,该研究将大大提高训练速度和能效,比其他方法的性能高出 13 倍,能效高出 10 倍。随着有关 AI 数据中心对环境影响的讨论日益升温,新的 JEST...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为视觉基础模型与机器人操纵。指导老师为仉尚航,北京大学计算机学院研究员、博士生导师、博雅青年学者...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...点在于,Llama 3.2成为羊驼家族中,首个支持多模态能力的模型。Connect大会上,新出炉的Llama 3.2包含了小型(11B)和中型(90B)两种版本的主要视觉模型。正如Meta所说,这两款模型能够直接替代,相对应的文本模型,而且在图像...……更多
刚刚,Llama 3.2 来了!支持图像推理,还有可在手机上运行的版本
...又又动荡了,另一边被誉为「真・Open AI」的 Meta 对 Llama 模型来了一波大更新:不仅推出了支持图像推理任务的新一代 Llama 11B 和 90B 模型,还发布了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。不仅如此,Meta 还...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
【新智元导读】NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平,其在纯文本性能甚至超过了LLM骨干模型,特别是在文本数学和编码基准测试中,平均准确率提高了4.3个百分点。文本...……更多
OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词
...凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。目前官网上已经更新了48个视频demo,在这...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
清华大学计算机系讲席教授、人工智能研究院基础模型研究中心主任唐杰出品|搜狐科技作者|郑松毅2024年已过半,大模型之争热度不减,通往AGI的路究竟该怎么走?近日,清华大学计算机系讲席教授、人工智能研究院基础模...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...武静静编辑|邓咏仪放弃造车后的苹果,正在加速入局大模型战争。当地时间3月15日,苹果就披露了两个关键大模型动作。其中一个值得关注的是苹果的收购事件。彭博社报道称,苹果已经收购了一家加拿大AI初创公司DarwinAI。...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...构成威胁,Arm 和台积电将获胜。”有网友说到苹果在大模型发展上的状况。也有网友认为,苹果在大模型上的发力将为其在未来的手机市场竞争中带来优势。他们认为,开源模型加上移动设备的本地数据,即本地化的原生 LLM,...……更多
MSRA:视觉生成六大技术问题
...进行了梳理,他认为视觉信号拆分是最本质的问题。生成模型的目标是拟合目标数据分布,然而,目标数据分布过于复杂,难以直接拟合。因此,往往需要将复杂的信号做拆分,拆分成多个简单的分布拟合问题,再分别求解。信...……更多
微美全息构建基于深度迁移学习的图像分类融合模型, 提高图像分类的准确性和效率
...美全息(NASDAQ:WIMI)构建基于深度迁移学习的图像分类融合模型,提高图像分类的准确性和效率深度学习在计算机视觉领域得到越来越广泛的应用,尤其是在图像分类任务上。然而,由于数据集的限制和模型的复杂性,深度学习模...……更多
国网浙江电力:世界首个电力联邦学习国际标准获批立项
...力电力行业智能化转型。联邦学习是一种分布式人工智能模型训练技术。《基于联邦学习的电力视觉检测系统要求和框架》国际标准将联邦学习技术与电力视觉检测业务相结合,构建了一套分布式模型训练方法,能够有效解决数...……更多
70倍极致压缩!大模型的检查点再多也不怕
...ICCV、ECCV等顶会上有多项代表性工作发表,在高效大语言模型、视觉模型等领域都有丰富的成果产出,和知名高校和科研机构合作广泛。大模型作为当下 AI 工业界和学术界当之无愧的「流量之王」,吸引了大批学者和企业投入资...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...G42和软银集团。2.能力达到奥数金牌级,DeepMind几何推理模型登上Nature,这个叫AlphaGeometry的模型在国际数学奥林匹克(IMO)的30道几何题中做出了25道,这一成就标志着AI在数学领域推理能力的史诗级升级。3.DeepMind首席科学家Lauren...……更多
Meta 公司发布 Imagine Yourself AI 模型
...可扩展性,为此 Meta 公司创新提出了“Imagine Yourself” AI 模型。传统个性化图像生成方法挑战目前的个性化图像生成方法通常依赖于为每个用户调整模型,这种方法效率低下,而且缺乏通用性。虽然较新的方法试图在不进行调整...……更多
Meta版Sora深夜横空出世,小扎放出16秒高清大片!92页论文曝光技术细节,Llama 3架构立功
...、上传图像生成个性化视频。甚至Meta还放出了92页论文,模型架构、训练细节一并公开,干货满满!毫无预兆地,Meta版Sora——Movie Gen,就在刚刚抢先上线了!Meta将其称为「迄今最先进的媒体基础模型」。全新上线的大杀器Movie ...……更多
比Stable Diffusion便宜118倍!1890美元训出11.6亿参数高质量文生图模型
...研究人员,利用延迟掩蔽、MoE、分层扩展等策略,将扩散模型的训练成本降到了1890美元。训练一个扩散模型要多少钱?之前最便宜的方法(Wuerstchen)用了28400美元,而像Stable Diffusion这样的模型还要再贵一个数量级。大模型时代...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...间和物理世界的交互来完成复杂任务。近年来,多模态大模型和机器人技术得到了长足发展,具身智能成为全球科技和产业竞争的新焦点。然而,目前缺少一篇能够全面解析具身智能发展现状的综述。因此,鹏城实验室多智能体...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...想要达成通用人工智能 AGI 的终极目标,首先要达成的是模型要能完成人类所能轻松做到的任务。为了做到这一点,大模型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链(Chain-of-Thought)等...……更多
云测数据:为人工智能提供专业、高效的AI数据服务
...。随着全球新一轮AI热潮来临,大量训练数据已成为AI算法模型发展和演进的“燃料”。高质量的数据,能够为模型自身的学习、迭代,以及对推理能力的训练带来正向影响。如今,人工智能在以大模型为核心实现着更加快速的发展,并...……更多
BEV“超融合”感知部署 轻舟智航迈出量产从0到1的关键一步
...出色的 BEV感知能力,需要积累海量的已标注数据以支持模型的训练。如何找到更多高质量的数据并高效利用,是支持技术不断迭代的重要基石。轻舟智航充分利用作为高级别自动驾驶解决方案提供商在AI领域的先发优势,通过突...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...的关注,但最近浙大、中科院等机构的学者们提出,先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层...……更多
单图解锁全景视角!北大/港中文/腾讯等推出ViewCrafter | 已开源
...甚至单张输入图像中生成任意规模场景的新视角。这需要模型对3D物理世界有全面的理解。接下来一起康康具体咋实现的。概括而言,ViewCrafter是基于点云先验的可控视角视频生成。首先,快速多视图/单视图stereo技术的发展,使...……更多
OpenAI没有放弃的机器人梦想
... :“一种可能准确但带有讽刺意味的观点是,研究语言模型比研究机器人学具有更高的投资回报率和更低的风险。”事实证明,OpenAI的确在大语言模型方面取得了更大突破。不过,OpenAI忘记机器人了吗?「甲子光年」在2023北京...……更多
21.5万张X光,78万个问题!德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA
【新智元导读】多模态大语言模型(MLLM)在医学视觉问答(VQA)领域展现出巨大潜力,通过提供针对医学图像的具体临床问题的回答,有助于提高医疗专业人员的工作效率。然而,现有医学VQA数据集规模较小且问题过于简单,...……更多
更多关于科技的资讯:
不惧关税冲击!一家企业失去美国订单后海外订单量竟然多了
4月22日消息,据媒体报道,浙江慈溪是我国三大家电生产基地之一,其中出口美国的占比约16%。慈溪一家家电企业负责人表示
2025-04-22 00:59:00
vivo X200 Ultra摄影师套装版售罄!韩伯啸:组装难度极大 加紧提升产能
快科技4月22日消息,日前,vivo年度影像旗舰——X200 Ultra正式发布,售价6499元起。当晚开启预售后,vivo X200 Ultra 16GB+1TB摄影师套装很快就已售罄
2025-04-22 00:59:00
本文转自:人民日报书香溢天宫  逐梦探苍穹(在现场)——空间站里的读书滋味神舟十九号乘组  蔡旭哲 宋令东 王浩泽大鹏一日同风起
2025-04-22 05:55:00
本文转自:人民日报郁静娴无人机低空盘旋,育秧流水线高速运转,大数据、物联网及时传回农情信息,水肥一体化、绿色生物防控技术大显身手……春天的田野里
2025-04-22 05:57:00
京东“2元包邮”专区今天正式上线:买啥都是2块
快科技4月22日消息,今天京东特价“2元包邮”专区正式上线!每月逢2(2号/12号/22号)打开京东APP,首页点击“特价”频道戳“2元包邮”专区
2025-04-22 06:59:00
苹果发布iOS 18.5开发者预览版Beta 3:正式版5月登场
快科技4月22日消息,苹果今天凌晨推送了iOS 18.5开发者预览版Beta 3,依然没有太大的变动,iOS 18.5版本目前基本都是小修小补
2025-04-22 06:59:00
一场马拉松扒光了中国机器人的底裤 属实有点幽默了
前几个月还在春晚转手帕,现在人形机器人都已经上道跑马拉松了,这个周末是真挺魔幻。想象中这可能挺炫酷,校运会办上了赛博坦
2025-04-22 06:59:00
4月21日,在2025年全国知识产权宣传周期间,太原市“知识产权与人工智能”主题活动在全省首个知识产权服务业集聚区核心载体——知识产权大厦举行
2025-04-22 06:59:00
vivo手机上能收到iPhone的短信 蓝厂这波操作给我看傻了
说起蓝厂的旗舰手机,那能聊的可就太多了,从与蔡司联合研发,再到与联发科深度合作,X 系列旗舰手机可以说每一步都走的相当稳健
2025-04-22 07:29:00
曝iPhone 17 Pro引入天空蓝配色:超越神作远峰蓝
快科技4月22日消息,当年iPhone 13 Pro首次加入远峰蓝就卖爆,销量和口碑十分夸张,堪称一代神作。根据权威爆料者Majin Bu最新消息
2025-04-22 07:29:00
蚂蚁集团在广州设立“双中心”
快科技4月22日消息,蚂蚁集团宣布,蚂蚁集团华南数字运营中心、万里汇跨境贸易运营中心“双中心”,昨日在琶洲正式投用。去年5月
2025-04-22 07:29:00
摩尔线程发布图形显卡驱动v290.100.2:《巫师3:狂猎》帧率飙升超80%
快科技4月22日消息,昨晚,摩尔线程发布版本号为v290.100.2的图形显卡驱动程序,适配MTT S80、MTT S70
2025-04-22 07:29:00
娃哈哈回应跨界做AD钙奶鞋:相关公司违反约定 已致函终止授权
快科技4月22日消息,据报道,近日,一款主打情怀牌的"娃哈哈AD钙奶休闲鞋"在电商平台引发关注。这款售价139元的鞋子在淘宝
2025-04-22 07:29:00
合资发力辅助驾驶!别克与Momenta达成战略合作:全新城区辅助驾驶上车
快科技4月22日消息,日前,上汽通用别克在品牌日上发布全新高端新能源子品牌“至境”,搭载别克“逍遥”超级融合架构,覆盖轿车
2025-04-22 07:29:00
4月18日早上10点不到,在杭州桐庐,浙江省“十链百场万企”系列对接活动专精特新企业专场活动现场座无虚席。企业、金融机构
2025-04-22 07:30:00