模型,障碍,论文,论文,元宝,模块头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

语言≠思维，大模型学不了推理：一篇Nature让AI社区炸锅

机器之心报道机器之心编辑部方向完全搞错了？大语言模型（LLM）为什么空间智能不足，GPT-4 为什么用语言以外的数据训练，就能变得更聪明？现在这些问题有「标准答案」了。近日，一篇麻省理工学院（MIT）等机构发表在顶...……更多

2024-06-25 09:45:00推理,模型,思维,语言,社区,语言

单卡搞定Llama 3.1 405B，让大模型轻松瘦身！超强

单卡搞定Llama 3.1（405B），最新大模型压缩工具来了！最近Llama-3.1登上开源顶峰，但其最强的405B版本模型900多GB的内存需求，对资源构成了更加苛刻的挑战。北航、商汤、南洋理工等团队联合推出的大模型压缩工具与基准LLMC，能...……更多

2024-08-05 09:34:00工具包,模型,工具,模型,算法,工具

Meta提出“可持续思维链”，让大模型在连续潜空间中推理

今日值得关注的大模型前沿论文北大团队提出「自定义漫画生成」框架UniReal：通过学习真实世界动态实现通用图像生成和编辑苹果团队提出「可扩展视频生成」方法利用扩散 Transformer 进行视频运动迁移ObjCtrl-2.5D：无需训练的「...……更多

2024-12-13 09:19:00推理,模型,思维,空间,模型,生成

摒弃人工标注，AutoAlign方法基于大模型让知识图谱对齐

...ong Cheng, Jianzhong Qi 等学者团队联合完成。该团队专注于大模型、知识图谱、推荐搜索、自然语言处理、大数据等方向的研究。知识图谱作为结构化知识的重要载体，广泛应用于信息检索、电商、决策推理等众多领域。然而，由于...……更多

2024-07-27 09:28:00图谱,人工,模型,自动化,方法,知识

科学家研发自动驾驶新模块，让自动驾驶场景理解更接近人类认知

...，可以迅速地定位在关键区域。为了提高端到端自动驾驶模型的可解释性，该团队首次引入人类驾驶员的注意力机制。通过预测当前上下文中的驾驶员注意区域，他们将其作为一个掩码来调整原始图像的权重，从而使自动驾驶车...……更多

2024-04-11 10:53:00驾驶,认知,科学家,模块,场景,人类

百度神器！读英文论文真的跟读中文没两样了

大模型时代，读论文这事儿真是越来越爽了~你敢信，这样式儿的论文并非中文原版，而是出自翻译软件之手的翻译版。原文长这样：不仅译文流畅，公式图表也丝毫不乱，原模原样清晰美观不说，各种图注表头该翻译也都能翻...……更多

2025-03-13 06:50:00英文,神器,中文,论文,论文,模型

OpenAI-o1思考替代法火了！焦剑涛高徒一作提出思考偏好

OpenAI-o1替代品来了，大模型能根据任务复杂度进行不同时间的思考。不限于推理性的逻辑或数学任务，一般问答也能思考的那种。最近畅销书《Python机器学习》作者Sebastian Raschka推荐了一项新研究，被网友们齐刷刷码住了。论文...……更多

2024-10-29 09:58:00高徒,偏好,模型,过程,基线,偏好

超越GPT-4o！开源科研神器登场，4500万论文检索增强生

只需几秒钟，开源模型检索4500篇论文，比GPT-4o还靠谱！这就是由华盛顿大学和艾伦人工智能研究所（Ai2）打造的最新模型OpenScholar。它还是首个从论文到数据集、模型检查点都完全开源的科研助手模型。在由20位专家进行的500次...……更多

2024-11-27 09:58:00论文检索,神器,生成,科研,检索,论文

北大字节VAR最佳论文、厦大清华亚军，NeurIPS 202

...可扩展图像），论文一作为田柯宇（此前因涉攻击内部大模型，被字节起诉）。参见机器之心报道《GPT 超越扩散、视觉生成 Scaling Law 时刻！北大 & 字节提出 VAR 范式》。机器之心获悉，从 2023 年开始，字节商业化技术团队就...……更多

2024-12-05 09:47:00论文,清华,亚军,字节,北大,模型

复杂组合3D场景生成，LLMs对话式3D可控生成编辑框架来了

...法介绍GALA3D 的整体架构如下图所示：GALA3D 利用大型语言模型（LLMs）生成初始布局，并提出布局引导的生成式 3D 高斯表示构建复杂 3D 场景。GALA3D 设计通过自适应几何控制优化 3D 高斯的形状和分布，以生成具有一致几何、纹理...……更多

2024-08-01 09:33:00生成,框架,场景,对话,组合,高斯

$多个中国团队斩获EMNLP\'24最佳论文！UCLA华人学者中三篇杰出论文$

多个中国团队斩获EMNLP'24最佳论文！UCLA华人学者中

...，跨文化再创作应运而生。作者构建了三个包含SOTA生成模型的管道：e2e-instruct 直接编辑图像，cap-edit 通过字幕和 LLM 编辑后处理图像，cap-retrieve 利用编辑后的字幕检索图像，还创建了概念和应用两部分评估数据集。结果发现...……更多

2024-11-18 09:59:00论文,中国,学者,多个,团队,华人

DeepSeek低调参与GDC大会，宇树科技表演“机器人遛机

...美国国家工程院外籍院士沈向洋在开幕式上发表演讲《大模型时代的创新与思考》提到，“DeepSeek让大家看到开源社区的胜利。把了不起的模型开源后，让更多人得到机会，在这个模型上做更多了不起的事情。”沈向洋表示，在...……更多

2025-02-23 16:04:00机器,机器人,低调,表演,大会,科技

安全强化学习方法、理论与应用综述，慕工大、同济等深度解析

...种方法来处理安全强化学习的问题，可以大致分类为基于模型的方法和无模型的方法。1. 基于模型的安全强化学习方法：基于模型的安全强化学习方法通常依赖于对环境的建模，通过利用物理模型或近似模型进行推理和决策。这...……更多

2024-10-09 09:51:00同济,学习方法,深度,理论,方法,应用

科学家研发AI睡眠模型，捕捉多导睡眠图数据特征，提升睡眠障碍

...理工大学郭晶晶教授团队，提出一款名为 MSSC-BiMamba 的 AI 模型，能够捕捉多导睡眠图多模态数据特征，提升睡眠分期与睡眠障碍的诊断效率。图 | 郭晶晶（来源：郭晶晶）据介绍，考虑到多导睡眠监测的特点，该团队设计了这款...……更多

2024-06-07 09:44:00睡眠,科学家,模型,障碍,特征,科学

2022生成模型进展有多快，新论文盘点9类生成模型代表作

ChatGPT的出现，彻底将生成AI推向爆发。但别忘了，AI生成模型可不止ChatGPT一个，光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年，效果好的AI生成模型层出不穷，又以OpenAI、Meta...……更多

2023-01-30 16:34:00生成,模型,新论,代表作,盘点,进展

彩云科技发布基于DCFormer架构通用大模型云锦天章

...er to App”的沟通会。会上，彩云科技CEO袁行远，就通用大模型未来进化之路，与人工智能的落地场景等热点话题进行了交流，并正式推出了首款基于DCFormer架构开发的通用大模型云锦天章，与此同时，彩云科技旗下AI RPG平台彩云...……更多

2024-11-14 14:43:00天章,云锦,彩云,架构,模型,科技

能识别手语中的情感变化合肥工业大学这项研究成果获奖

...情感状态下听障人士的手语表达习惯，建立手语情感分析模型，开辟了手语情感分析的全新技术路径。在此基础上，团队持续深耕手语识别领域，先后在IEEE Transactions on Mobile Computing、IEEE Transactions on Multimedia和ACM Transa……更多

2025-08-14 17:19:00合肥工业大学,合肥,手语,研究成果,获奖,成果

无一大模型及格！北大/通研院提出超难基准，评估长文本理解生

在长文本理解能力这块，竟然没有一个大模型及格！北大联合北京通用人工智能研究院提出了一个新基准数据集：LooGLE，专门用于测试和评估大语言模型（LLMs）长上下文理解能力。该数据集既能够评估LLMs对长文本的处理和检索...……更多

2024-08-08 09:39:00基准,北大,生成,模型,文本,评估

严禁AI评审！CVPR 2025重申大模型审稿0容忍，一首拒

...了，不仅出台了七条新规，还再三强调，禁止审稿人用大模型生成/翻译评审结果。CVPR的投稿量每年都在刷新纪录，总以为今年是巅峰，但明年只会更多。CVPR 2024收到11532次提交，增幅达到了26%；今年的投稿增速虽然有所放缓，...……更多

2024-12-09 09:48:00小诗,一首,评审,全场,爆笑,模型

arXiv和Hugging Face梦幻联动，一个按钮直达论

...选项卡下，选中之后就可以直达相关的 Hugging Face 论文、模型和数据集。二者打通之后有多方便呢？以直达「Hugging Face 论文」为例，在找到这篇论文后，点击「View on Hugging Face」，你就直接来到了 Hugging Face 的论文评论区，可以...……更多

2024-10-26 09:50:00直达,按钮,模型,梦幻,数据,论文

LLM超越人类时该如何对齐？谷歌用新RLHF框架解决了这个问

...需要为 LLM 构建一种能使其实现自我提升的基本机制，让模型可以持续地自我生成和自我求解更困难的问题。于是，问题就来了：语言模型能否自我创建可学习的新任务，从而实现自我改进以更好地泛化用于人类偏好对齐？为...……更多

2024-11-06 09:44:00框架,人类,问题,提示,策略,模型

让大模型能听会说,国内机构开源首个端到端语音对话模型Mini

...非与启元世界多模态负责人吴昌桥，研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。随着多类型大模型的飞速发展，全球 AI 已经进入到了多模交互时代。2024 年 5 月，OpenAI 推出了全新的多模...……更多

2024-09-07 09:44:00模型,语音,对话,机构,语音,文本

消息称Kimi、豆包等AI应用本月广告投放超3亿元，开始“卷

...手目前则没有付费方案。报道称，当前中美之间的 AI 大模型竞赛已开始“分道扬镳”：中国 AI 大模型“卷”算力、“卷”价格，而且“卷”获客、“卷”变现能力；美国 AI 公司则依然专注于前沿 AI 模型技术研究，并且加速 AI ...……更多

2024-10-30 14:12:00豆包,广告投放,消息,应用,广告,广告

NeurIPS 2024 Oral | 小参数，大作为！揭秘

...机系的三年级博士生，研究方向涉及 MLSys 和高效大语言模型。师从栗力、须成忠教授。大型语言模型（LLMs）虽然在适应新任务方面取得了长足进步，但它们仍面临着巨大的计算资源消耗，尤其在复杂领域的表现往往不尽如人意...……更多

2024-10-22 09:57:00对称,架构,性能,参数,矩阵,任务

击败GPT-4o的开源模型如何炼成?关于Llama 3.1

...拥有 8B、70B 和 405B 三个版本，再次以一已之力抬高了大模型赛道的竞争标准。对 AI 社区来说，Llama 3.1 405B 最重要的意义是刷新了开源基础模型的能力上限，Meta 官方称，在一系列任务中，其性能可与最好的闭源模型相媲美。下...……更多

2024-07-25 09:32:00模型,论文,模型,训练,论文,开发

深圳科学家利用人工智能揭秘动物社交语言

...名为“Social Behavior Atlas（SBeA）”的小样本学习计算框架模型。这个模型实现了对动物社交行为的高精度识别，无需事先标注数据，就能在自由社交状态下精准识别动物身份，准确率超过90%，为动物社交行为研究带来了革命性的...……更多

2024-01-11 04:04:00人工智能,深圳,社交,科学家,人工,动物

毕业论文，千万大学生的最难一课

...士论文也在呈现“知识重复”的迹象。所幸这几年有了大模型（生成式AI），各种文字生产相对便利。根据浙江大学教育学院的调研，截至2023年底，就有近半数大学生使用生成式AI辅助完成课程作业（45.5%），46.3%的学生用AI辅助...……更多

2025-06-24 03:33:00毕业论文,大学生,论文,大学,论文,本科

1890美元，就能从头训练一个还不错的12亿参数扩散模型

...只用1890美元、3700 万张图像，就能训练一个还不错的扩散模型。现阶段，视觉生成模型擅长创建逼真的视觉内容，然而从头开始训练这些模型的成本和工作量仍然很高。比如 Stable Diffusion 2.1 花费了 200000 个 A100 GPU 小时。即使研...……更多

2024-07-30 09:37:00从头,模型,训练,参数,掩蔽,训练

苹果扩充 AI 模型和研究论文，在 HF 平台上传20个新

IT之家 6 月 20 日消息，苹果公司进一步补充现有的公开模型和研究论文，在开源人工智能知识库 Hugging Face上传了 20 个新的核心机器学习模型。苹果公司于今年四月公开了 4 个开源高效 LLMs（OpenELMs），并分享到 Hugging Face 平台上...……更多

2024-06-20 09:39:00模型,研究论文,苹果,研究,论文,平台

谷歌AlphaFold 3在《自然》杂志刊登：准确率超50%

...歌旗下公司DeepMind创建的基于深度学习的人工智能测序式模型AlphaFold解决了这个问题。北京时间5月8日（周三）晚间，《自然》杂志刊登了DeepMind的AlphaFold团队和伦敦药物研发公司IsomorphicLabs共同署名的论文，介绍了AlphaFold3，这是...……更多

2024-05-12 23:11:00准确率,自然,杂志,结构,蛋白质,蛋白