模型,论文,模型,训练,论文,开发头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

检索总结能力超博士后，首个大模型科研智能体PaperQA2开

...最近一段时间，有关 AI 科学家的研究越来越多。大语言模型（LLM）有望帮助科学家检索、综合和总结文献，提升人们的工作效率，但在研究工作中使用仍然有很多限制。对于科研来说，事实性至关重要，而大模型会产生幻觉，...……更多

2024-09-13 13:33:00博士后,模型,科研,博士,检索,能力

鄂维南院士领衔新作：大模型不止有RAG、参数存储，还有第3种

2.4B 的 Memory3比更大的 LLM 和 RAG 模型获得了更好的性能。近年来，大型语言模型 (LLM) 因其非凡的性能而获得了前所未有的关注。然而， LLM 的训练和推理成本高昂，人们一直在尝试通过各种优化方法来降低成本。本文来自上海算...……更多

2024-07-11 09:33:00维南,领衔,院士,新作,模型,存储

IBM开发新芯片为AI提速：消除片外内存，灵感来自大脑

...然》杂志报道，即使是北极点芯片224兆内存对于大型语言模型来说也是不够的，比如聊天机器人ChatGPT这样的语言模型，即使在最精简的版本中也要占用几千兆的数据。而且该芯片只能运行预先编程的神经网络，这些神经网络需...……更多

2023-10-20 17:24:00提速,灵感,芯片,大脑,内存,开发

清华领衔发布多模态评估MultiTrust：GPT-4可信度

...专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型（MLLMs）因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手，还逐渐渗透到自动驾驶、医学诊断等各大应用领域，掀...……更多

2024-07-25 09:31:00模态,清华,可信度,领衔,可信,几何

科学家研发酶约束模型工具箱，将大幅推进酶约束模型的普及

...深圳先进技术研究院陈禹研究员和合作者，开发了酶约束模型构建和使用的最新工具箱 GECKO 3.0。图 | 陈禹（来源：陈禹）研究期间，他们整合了深度学习模块以解决数据缺乏的问题，此外他们撰写了详细的使用指南，相信该工...……更多

2024-03-14 10:28:00模型,工具箱,科学家,科学,工具,模型

苹果展示ferret-uiai系统可理解应用程序

...以理解应用程序屏幕上的内容。以ChatGPT为代表的AI大语言模型（LLMs），其训练材料通常是文本内容。为了能够让AI模型能够理解图像、视频和音频等非文本内容，多模态大语言模型（MLLMs）因此孕育而生。只是现阶段MLLMs还无法...……更多

2024-04-11 02:30:00应用程序,苹果,程序,应用,系统,模型

阿里巴巴推出atomovideo高保真图生视频框架

...静态图像生成高质量的视频内容，并与各种文生图（T2I）模型兼容。▲图源AtomoVIdeo团队论文IT之家总结AtomoVideo特性如下：高保真度：生成的视频与输入图像在细节与风格上保持高度一致性运动一致性：视频动作流畅，确保时间...……更多

2024-03-08 00:45:00阿里巴巴,阿里,框架,视频,视频,图像

专家模型不要专家并行！微软开源MoE新路径

...日，来自微软的研究人员开源了使用全新方法训练的MoE大模型，不走寻常路，且编码和数学表现出色。继Phi家族之后，微软又开源了新的混合专家大模型——GRIN MoE。与Phi-3.5同样的个头（16 * 3.8B），却采用了截然不同的训练方法...……更多

2024-11-12 09:57:00专家,微软,路径,模型,模型,专家

AI “早筛” 癌症，准确区分13种癌症，准确率98.2%，

...帝国理工学院和剑桥大学的研究团队训练了一种人工智能模型——EMethylNET，通过观察 DNA 甲基化模式，从非癌组织中识别出 13 种不同类型的癌症（包括乳腺癌、肝癌、肺癌和前列腺癌等），准确率高达 98.2%。相关论文以“Early de...……更多

2024-06-27 08:48:00癌症,准确率,人类,治疗,癌症,模型

Token化一切，甚至网络！北大&谷歌&马普所提出Token

...者是汪海洋，北京大学20级博士生，目前主要关注是通用模型的架构设计和学习算法。指导教授主要包括王立威，北京大学智能学院教授；Bernt Schiele，德国马普计算所教授；Federico Tombari 谷歌人工智能科学家等。新一代通用灵活...……更多

2024-11-15 09:51:00马普,北大,网络,模型,增量式,增量

苹果扩充 AI 模型和研究论文，在 HF 平台上传20个新

IT之家 6 月 20 日消息，苹果公司进一步补充现有的公开模型和研究论文，在开源人工智能知识库 Hugging Face上传了 20 个新的核心机器学习模型。苹果公司于今年四月公开了 4 个开源高效 LLMs（OpenELMs），并分享到 Hugging Face 平台上...……更多

2024-06-20 09:39:00模型,研究论文,苹果,研究,论文,平台

这个大模型，真的治好了我的论文阅读障碍

...enAI、谷歌、Meta 连放大招，一些创业公司也在不断推出新模型、新方法，相信很多从业者都会感觉论文多到看不过来。把论文丢给 AI 去总结是现在常用的阅读方法，但很多 AI 总结的内容缺乏清晰的层次以及对于创新点、局限性...……更多

2024-08-13 09:40:00模型,障碍,论文,论文,元宝,模块

类Sora模型能否理解物理规律？字节豆包大模型团队系统性研究

视频生成模型虽然可以生成一些看似符合常识的视频，但被证实目前还无法理解物理规律！自从 Sora 横空出世，业界便掀起了一场「视频生成模型到底懂不懂物理规律」的争论。图灵奖得主 Yann LeCun 明确表示，基于文本提示生...……更多

2024-11-09 09:59:00模型,豆包,系统性,字节,规律,团队

科学家为脉冲神经网络引入新架构，为超大模型奠定基础

...计算可以利用脉冲信号来传递信息。前者，让脉冲神经元模型的表达能力在理论上高于基于传统人工神经网络（Artificial Neural Network，ANN）的人工神经元模型；后者，让脉冲神经元具有脉冲驱动的计算特征。当脉冲神经网络运行...……更多

2024-03-18 10:41:00神经网络,脉冲,架构,科学家,模型,神经

GPT-4批评GPT-4实现「自我提升」！OpenAI前超级

...许是为了缓解广大网友的热切期待，OpenAI在今天放出了新模型CriticGPT，相当于GPT-4的「拐杖」。我们训练了一个模型CriticGPT，来捕获GPT-4生成代码中的错误。我们开始将此类模型集成到RLHF对齐管道中，以帮助人类监督AI执行困难...……更多

2024-07-01 09:23:00力作,批评,团队,模型,人类,训练

《自然》子刊：蛋白质结构预测新算法可大幅提高预测效率

...表了百度飞桨螺旋桨联合百图生科研发的文心生物计算大模型的一项成果，在这一模型中，由于创新了人工智能的训练方案，蛋白质结构预测时间被大幅缩短。该论文显示，当前蛋白质结构预测的人工智能大模型，如AlphaFold2（...……更多

2023-10-11 09:50:00蛋白质,算法,蛋白,效率,自然,结构

AI自己长出了类似大脑的脑叶？新研究揭示LLM特征的惊人几何

大型语言模型在学习概念时竟然会形成令人惊讶的几何结构，比如代码和数学特征会形成一个「叶（lobe）」，类似于我们在做磁共振功能成像时看到的大脑功能性脑叶。这说明什么呢？论文通讯作者、MIT 物理学教授 Max Tegmark ...……更多

2024-11-04 09:52:00长出,几何,大脑,特征,结构,研究

Anthropic挖走DeepMind强化学习大牛、Alph

...动态知识的情况下，该算法通过结合基于树的搜索和学得模型，不仅在国际象棋、日本将棋和围棋的精确规划任务中匹敌 AlphaZero，还在 30 多款雅达利游戏中展示出了超越人类的表现。Julian Schrittwieser 是 MuZero 论文《Mastering Atari, ...……更多

2024-10-30 09:54:00大牛,核心,作者,学习,学习,算法

最强国产多模态刚刚易主！腾讯混元把GPT-4/Claude-

国产大模型，多模态能力都开始超越GPT-4-Turbo了？？权威榜单，中文多模态大模型测评基准SuperCLUE-V，新鲜出炉：特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B，分别成为国内闭源和开源界两大领跑者，甚至超过Claude-3.5-Sonnet..……更多

2024-08-09 09:38:00模态,腾讯,国产,模态,腾讯,元宝

思维链让大模型推理更准确？谷歌早于OpenAI押中o1模型核

几天前 OpenAI 新模型 o1 的发布，再次引发了人们对大语言模型的高度关注和讨论。而 o1 发布之所以如此“轰动”，是因为它与此前大模型由语言驱动用于聊天或语音助手有本质的不同。其不仅进入到复杂的领域，还表现出超强...……更多

2024-09-20 13:33:00模型,推理,思维,原理,核心,模型

全球首次！时序大模型突破十亿参数，华人团队发布Time-Mo

...而，构建一个兼具强大性能与高效运算的大规模时序预测模型始终是一个巨大的挑战。此外，高质量的大型公共时间序列数据库的匮乏进一步加剧了这一难题。近日，由来自普林斯顿大学、格里菲斯大学等全球多地的华人国际科...……更多

2024-10-23 09:55:00时序,模型,团队,训练,参数,突破

机器人迈向ChatGPT时刻！清华团队首次发现具身智能Sca

...专家 Ted Xiao 都忍不住为这项研究点赞，称其对机器人大模型时代具有里程碑意义！ Scaling Laws：从 ChatGPT 到机器人的制胜法则还记得 ChatGPT 为什么能横空出世吗？答案就是 scaling laws！现在，清华团队首次证明：这个法则在机器...……更多

2024-11-04 09:52:00清华,机器人,团队,机器,时刻,智能

比LoRA更高效！上交大&哈佛推出新微调框架，瞄准特定任务方

比LoRA更高效的模型微调方法来了——以常识推理为例，在参数量减少8~16倍的情况下，两种方法能达到相同效果。新方法名叫LoRA-Dash，由来自上海交通大学和哈佛大学的研究人员提出，主要针对特定任务微调模型往往需要大量计...……更多

2024-09-18 09:57:00哈佛,交大,框架,方向,任务,方向

姚期智院士大模型新研究：思维图DoT，用数学理论确保AI逻辑

姚期智院士领衔，推出大模型新推理框架，CoT“王冠”戴不住了。提出思维图（DiagramofThought），让大模型思考更像人类。团队更是为这种推理过程提供了数学基础，通过拓扑斯理论（Topos Theory）正式化（formalize）DoT，确保其逻...……更多

2024-09-24 13:36:00维图,院士,逻辑,模型,一致,理论

OpenAI开发者大会背后：又一批创业公司要遭“灭顶之灾”

...美国主权评级展望调整至负面；要革iPhone的命？内置GPT大模型的AIPin来了；更多内容，尽在《一周国际财经》。OpenAI开发者大会背后：又一批创业公司要遭“灭顶之灾”图片来源：视觉中国在ChatGPT横空出世一周年临近之际，本周...……更多

2023-11-11 20:09:00开发者,背后,大会,创业,开发,公司

迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测

...这是该团队在继 PMC-LLaMA 后，在持续构建开源医疗语言大模型的最新进展。该项目受到科创 2030—“新一代人工智能” 重大项目支持。在医疗领域中，大语言模型已经有了广泛的研究。然而，这些进展主要依赖于英语的基座模型...……更多

2024-09-30 09:51:00多语,大规,模型,语料,基准,大规模

Transformer推理天花板被谷歌打破？DeepMind

...间推理token，跟o1的核心技术CoT非常相似。传统的Transformer模型的致命弱点，就是擅长并行计算，但不擅长串行推理。而CoT，恰恰解决了这个问题。在这项工作中，Denny Zhou等人发现：传统的Transformer模型，只能解决AC0电路能解决的...……更多

2024-09-21 09:43:00天花,天花板,推理,首席,科学家,科学

AI也会「刷抖音」！清华领衔发布短视频全模态理解新模型 |

【新智元导读】音视频大语言模型在处理视频内容时，往往未能充分发挥语音的作用。video-SALMONN模型通过三部分创新：音视频编码和时间对齐、多分辨率因果Q-Former、多样性损失函数和混合未配对音视频数据训练。该模型不仅...……更多

2024-08-01 09:45:00模态,清华,领衔,模型,视频,音视

文本图格式大一统！首个大规模文本边基准TEG-DB发布 |

...步发展；2. 文本图数据格式和实验设置不统一，难以进行模型之间的比较；3. 由于缺乏全面的基准测试和分析，对图模型处理边文本信息能力仍然了解的很欠缺。论文地址：https://arxiv.org/abs/2406.10310代码地址：https://github.com/Zhuofe...……更多

2024-11-09 13:34:00大规,本图,基准,大规模,文本,格式