• 我的订阅
  • 头条热搜
语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了
机器之心报道机器之心编辑部方向完全搞错了?大语言模型(LLM)为什么空间智能不足,GPT-4 为什么用语言以外的数据训练,就能变得更聪明?现在这些问题有 「标准答案」了。近日,一篇麻省理工学院(MIT)等机构发表在顶...……更多
单卡搞定Llama 3.1 405B,让大模型轻松瘦身!超强压缩工具包来了
单卡搞定Llama 3.1(405B),最新大模型压缩工具来了!最近Llama-3.1登上开源顶峰,但其最强的405B版本模型900多GB的内存需求,对资源构成了更加苛刻的挑战。北航、商汤、南洋理工等团队联合推出的大模型压缩工具与基准LLMC,能...……更多
Meta提出“可持续思维链”,让大模型在连续潜空间中推理
今日值得关注的大模型前沿论文北大团队提出「自定义漫画生成」框架UniReal:通过学习真实世界动态实现通用图像生成和编辑苹果团队提出「可扩展视频生成」方法利用扩散 Transformer 进行视频运动迁移ObjCtrl-2.5D:无需训练的「...……更多
摒弃人工标注,AutoAlign方法基于大模型让知识图谱对齐全自动化
...ong Cheng, Jianzhong Qi 等学者团队联合完成。该团队专注于大模型、知识图谱、推荐搜索、自然语言处理、大数据等方向的研究。知识图谱作为结构化知识的重要载体,广泛应用于信息检索、电商、决策推理等众多领域。然而,由于...……更多
科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知
...,可以迅速地定位在关键区域。为了提高端到端自动驾驶模型的可解释性,该团队首次引入人类驾驶员的注意力机制。通过预测当前上下文中的驾驶员注意区域,他们将其作为一个掩码来调整原始图像的权重,从而使自动驾驶车...……更多
百度神器!读英文论文 真的跟读中文没两样了
大模型时代,读论文这事儿真是越来越爽了~你敢信,这样式儿的论文并非中文原版,而是出自翻译软件之手的翻译版。原文长这样:不仅译文流畅,公式图表也丝毫不乱,原模原样清晰美观不说,各种图注表头该翻译也都能翻...……更多
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
OpenAI-o1替代品来了,大模型能根据任务复杂度进行不同时间的思考。不限于推理性的逻辑或数学任务,一般问答也能思考的那种。最近畅销书《Python机器学习》作者Sebastian Raschka推荐了一项新研究,被网友们齐刷刷码住了。论文...……更多
超越GPT-4o!开源科研神器登场,4500万论文检索增强生成靠谱回答
只需几秒钟,开源模型检索4500篇论文,比GPT-4o还靠谱!这就是由华盛顿大学和艾伦人工智能研究所(Ai2)打造的最新模型OpenScholar。它还是首个从论文到数据集、模型检查点都完全开源的科研助手模型。在由20位专家进行的500次...……更多
北大字节VAR最佳论文、厦大清华亚军,NeurIPS 2024最佳论文出炉
...可扩展图像),论文一作为田柯宇(此前因涉攻击内部大模型,被字节起诉)。参见机器之心报道《GPT 超越扩散、视觉生成 Scaling Law 时刻!北大 & 字节提出 VAR 范式》。机器之心获悉,从 2023 年开始,字节商业化技术团队就...……更多
复杂组合3D场景生成,LLMs对话式3D可控生成编辑框架来了
...法介绍GALA3D 的整体架构如下图所示:GALA3D 利用大型语言模型(LLMs)生成初始布局,并提出布局引导的生成式 3D 高斯表示构建复杂 3D 场景。GALA3D 设计通过自适应几何控制优化 3D 高斯的形状和分布,以生成具有一致几何、纹理...……更多
多个中国团队斩获EMNLP\'24最佳论文!UCLA华人学者中三篇杰出论文
...,跨文化再创作应运而生。作者构建了三个包含SOTA生成模型的管道:e2e-instruct 直接编辑图像,cap-edit 通过字幕和 LLM 编辑后处理图像,cap-retrieve 利用编辑后的字幕检索图像,还创建了概念和应用两部分评估数据集。 结果发现...……更多
...美国国家工程院外籍院士沈向洋在开幕式上发表演讲《大模型时代的创新与思考》提到,“DeepSeek让大家看到开源社区的胜利。把了不起的模型开源后,让更多人得到机会,在这个模型上做更多了不起的事情。”沈向洋表示,在...……更多
安全强化学习方法、理论与应用综述,慕工大、同济等深度解析
...种方法来处理安全强化学习的问题,可以大致分类为基于模型的方法和无模型的方法。1. 基于模型的安全强化学习方法:基于模型的安全强化学习方法通常依赖于对环境的建模,通过利用物理模型或近似模型进行推理和决策。这...……更多
科学家研发AI睡眠模型,捕捉多导睡眠图数据特征,提升睡眠障碍
...理工大学郭晶晶教授团队,提出一款名为 MSSC-BiMamba 的 AI 模型,能够捕捉多导睡眠图多模态数据特征,提升睡眠分期与睡眠障碍的诊断效率。图 | 郭晶晶(来源:郭晶晶)据介绍,考虑到多导睡眠监测的特点,该团队设计了这款...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
ChatGPT的出现,彻底将生成AI推向爆发。但别忘了,AI生成模型可不止ChatGPT一个,光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta...……更多
彩云科技发布基于DCFormer架构通用大模型云锦天章
...er to App”的沟通会。会上,彩云科技CEO袁行远,就通用大模型未来进化之路,与人工智能的落地场景等热点话题进行了交流,并正式推出了首款基于DCFormer架构开发的通用大模型云锦天章,与此同时,彩云科技旗下AI RPG平台彩云...……更多
能识别手语中的情感变化 合肥工业大学这项研究成果获奖
...情感状态下听障人士的手语表达习惯,建立手语情感分析模型,开辟了手语情感分析的全新技术路径。在此基础上,团队持续深耕手语识别领域,先后在IEEE Transactions on Mobile Computing、IEEE Transactions on Multimedia和ACM Transa……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
在长文本理解能力这块,竟然没有一个大模型及格!北大联合北京通用人工智能研究院提出了一个新基准数据集:LooGLE,专门用于测试和评估大语言模型(LLMs)长上下文理解能力。该数据集既能够评估LLMs对长文本的处理和检索...……更多
严禁AI评审!CVPR 2025重申大模型审稿0容忍,一首拒稿小诗爆笑全场
...了,不仅出台了七条新规,还再三强调,禁止审稿人用大模型生成/翻译评审结果。CVPR的投稿量每年都在刷新纪录,总以为今年是巅峰,但明年只会更多。CVPR 2024收到11532次提交,增幅达到了26%;今年的投稿增速虽然有所放缓,...……更多
arXiv和Hugging Face梦幻联动,一个按钮直达论文、模型、数据集
...选项卡下,选中之后就可以直达相关的 Hugging Face 论文、模型和数据集。二者打通之后有多方便呢?以直达「Hugging Face 论文」为例,在找到这篇论文后,点击「View on Hugging Face」,你就直接来到了 Hugging Face 的论文评论区,可以...……更多
LLM超越人类时该如何对齐?谷歌用新RLHF框架解决了这个问题
...需要为 LLM 构建一种能使其实现自我提升的基本机制,让模型可以持续地自我生成和自我求解更困难的问题。于是,问题就来了:语言模型能否自我创建可学习的新任务,从而实现自我改进以更好地泛化用于人类偏好对齐? 为...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。随着多类型大模型的飞速发展,全球 AI 已经进入到了多模交互时代。2024 年 5 月,OpenAI 推出了全新的多模...……更多
消息称Kimi、豆包等AI应用本月广告投放超3亿元,开始“卷”投流
...手目前则没有付费方案。报道称,当前中美之间的 AI 大模型竞赛已开始“分道扬镳”:中国 AI 大模型“卷”算力、“卷”价格,而且“卷”获客、“卷”变现能力;美国 AI 公司则依然专注于前沿 AI 模型技术研究,并且加速 AI ...……更多
NeurIPS 2024 Oral | 小参数,大作为!揭秘非对称 LoRA 架构性能
...机系的三年级博士生,研究方向涉及 MLSys 和高效大语言模型。师从栗力、须成忠教授。大型语言模型(LLMs)虽然在适应新任务方面取得了长足进步,但它们仍面临着巨大的计算资源消耗,尤其在复杂领域的表现往往不尽如人意...……更多
击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B都写在论文里
...拥有 8B、70B 和 405B 三个版本,再次以一已之力抬高了大模型赛道的竞争标准。对 AI 社区来说,Llama 3.1 405B 最重要的意义是刷新了开源基础模型的能力上限,Meta 官方称,在一系列任务中,其性能可与最好的闭源模型相媲美。下...……更多
...名为“Social Behavior Atlas(SBeA)”的小样本学习计算框架模型。这个模型实现了对动物社交行为的高精度识别,无需事先标注数据,就能在自由社交状态下精准识别动物身份,准确率超过90%,为动物社交行为研究带来了革命性的...……更多
毕业论文,千万大学生的最难一课
...士论文也在呈现“知识重复”的迹象。所幸这几年有了大模型(生成式AI),各种文字生产相对便利。根据浙江大学教育学院的调研,截至2023年底,就有近半数大学生使用生成式AI辅助完成课程作业(45.5%),46.3%的学生用AI辅助...……更多
1890美元,就能从头训练一个还不错的12亿参数扩散模型
...只用1890美元、3700 万张图像,就能训练一个还不错的扩散模型。现阶段,视觉生成模型擅长创建逼真的视觉内容,然而从头开始训练这些模型的成本和工作量仍然很高。比如 Stable Diffusion 2.1 花费了 200000 个 A100 GPU 小时。即使研...……更多
苹果扩充 AI 模型和研究论文,在 HF 平台上传20个新 Core ML模型
IT之家 6 月 20 日消息,苹果公司进一步补充现有的公开模型和研究论文,在开源人工智能知识库 Hugging Face上传了 20 个新的核心机器学习模型。苹果公司于今年四月公开了 4 个开源高效 LLMs(OpenELMs),并分享到 Hugging Face 平台上...……更多
谷歌AlphaFold 3在《自然》杂志刊登:准确率超50%
...歌旗下公司DeepMind创建的基于深度学习的人工智能测序式模型AlphaFold解决了这个问题。北京时间5月8日(周三)晚间,《自然》杂志刊登了DeepMind的AlphaFold团队和伦敦药物研发公司IsomorphicLabs共同署名的论文,介绍了AlphaFold3,这是...……更多
更多关于科技的资讯:
厦门网讯(厦门日报记者 沈彦彦 应洁)明日,厦门岛外首家永辉“胖东来模式”调改店将在杏林万科里正式开业。作为厦门第二家
2025-09-25 08:53:00
9月24日,“青春华章・向西而歌”网络大思政课活动上,西安交通大学微电子学院集成电路工程专业博士研究生魏上杰介绍,集成电路是“国之重器”的“心脏”
2025-09-25 09:44:00
杜建英一持股公司被吊销,名下关联60家企业其中8家已注销或吊销
企查查APP显示,近日,杜建英持股的杭州芸台文化创意有限公司被吊销,原因是公司成立后无正当理由超过6个月未开业,或者开业后自行停业连续6个月以上
2025-09-25 11:20:00
雷军“五十来岁正是闯的年纪”,出生于1969年,和余承东、陈明永同龄
9月25日,雷军发文:这5年,小米一路摸爬滚打、跌宕起伏,依然启动了造车、芯片和高端化……没什么好犹豫的,五十来岁,正是闯的年纪
2025-09-25 11:20:00
贵州国企“智”变攻坚推动数实融合
赤水河畔,国内首台高温复合型仿生压曲机稳定运转,物联网实时优化发酵参数……这场酿酒的“数字革命”,也是贵州习酒公司以全链数智革新推动产业跃迁的生动缩影
2025-09-25 11:57:00
近8成职场人每周都会用AI工具 “人机互信”仍在磨合期
在人工智能技术日臻成熟的2025年,AI已是深度融入职场生态的“数字同事”,在AI辅助下的2025年职场迎来了哪些变化
2025-09-25 13:30:00
9月23日下午,2025北京文化论坛“破界共生:科技激发文化原创力”平行论坛在京举办。本场论坛由中国文联、中国作协指导
2025-09-25 13:38:00
国庆前夕,房山区物美超市“胖改店”、居然之家房山店、瑞莱广场分别于9月26日、27日、28日开业,进一步丰富了房山区消费场景
2025-09-25 13:38:00
OPPO杭州研发总部项目易主,山子高科接手公司95%股权
企查查APP显示,近日,负责OPPO项目的杭州逗酷软件科技有限公司发生工商变更,新增山子高科旗下浙江山子超影科技有限公司为股东
2025-09-25 16:25:00
雷军提前透露年度演讲细节,晒照新T恤“正是闯的年纪”被粉丝要链接
9月25日,雷军年度演讲将在今晚7点举行,这次不光是演讲,还是小米17系列等各种新品的发布会。关于今晚的演讲和发布会,25日下午
2025-09-25 17:34:00
齐鲁晚报·齐鲁壹点 记者 张召旭近日,为紧密配合《山东省食品经营许可审查细则》的落地施行,山东省全新改造升级的食品经营许可系统正式上线运行
2025-09-25 17:34:00
中国AI“黑科技”集结数贸会,AI硬件备受瞩目
9月25日,第四届全球数字贸易博览会在杭州开幕,作为国内唯一以数字贸易为主题的国家级展会,本届数贸会汇聚全球顶尖的数字科技与AI创新成果
2025-09-25 17:40:00
近日,山东移动聊城分公司组织技术团队专程赴莘县翰林学校,开展互联网专线及校园网络全面巡检与优化工作,通过端到端的全流程保障
2025-09-25 18:06:00
高德刘振飞:空间智能,就是让AI理解和预测真实世界的复杂性
高德地图董事长 刘振飞9月25日云栖大会期间,高德地图董事长刘振飞于2025高德技术峰会上致辞,系统阐述了高德全面转向“空间智能”的战略思考与实践
2025-09-25 18:06:00
京东发布AI全景图,未来三年持续投入构建万亿人工智能生态
9月25日,主题为“Enjoy AI”的JDDiscovery-2025京东全球科技探索者大会在北京举行。京东在会上发布了AI全景图
2025-09-25 18:10:00