模型,参数,模型,基准,问题,推理头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

单卡搞定Llama 3.1（405B），最新大模型压缩工具来了！最近Llama-3.1登上开源顶峰，但其最强的405B版本模型900多GB的内存需求，对资源构成了更加苛刻的挑战。北航、商汤、南洋理工等团队联合推出的大模型压缩工具与基准LLMC，能...……更多

2024-08-05 09:34:00工具包,模型,工具,模型,算法,工具

关于LLM-as-a-judge范式，终于有综述讲明白了

...往无法判断精妙的属性并提供令人满意的结果。大型语言模型 (LLM) 的最新进展启发了 “LLM-as-a-judge” 范式，其中 LLM 被用于在各种任务和应用程序中执行评分、排名或选择。本文对基于 LLM 的判断和评估进行了全面的调查，为推...……更多

2024-12-04 09:49:00范式,模型,基准,偏见,数据,评估

苹果让大模型学会偷懒：更快吐出第一个token，准确度还保住

...其中最小的 8B 版本可能也依然会有明显延迟。为了提升模型的推理效率，研究者想出了多种多样的方法，但其中很多都会让模型牺牲一些准确度。近日，苹果和 Meta AI 的一个研究团队提出了一种新方法，可在保证准确度不明显...……更多

2024-08-05 09:35:00准确度,更快,模型,苹果,缓存,模型

推理性能提升30倍！英伟达发布史上最强AI芯片，黄仁勋：将成

...用计算机开始，伴随着Windows 95、加速计算乃至深度学习模型AlexNet的出现，再到2016年，黄仁勋亲手将第一台DGX-1超级计算机送给了OpenAI。而在2022年，随着聊天机器人ChatGPT横空出世，生成式AI带来了全新一轮产业革命。黄仁勋手绘...……更多

2024-03-19 08:53:00英伟,推理,芯片,性能,成功,产品

AI 的“心智理论”难题：Meta ExploreToM 探

...作开发了 ExploreToM 框架，旨在更有效地评估和训练大语言模型（LLM）的心智理论（Theory of Mind，ToM）能力。心智理论心智理论（Theory of Mind，ToM）是人类社会智能的基础之一，能让我们能够理解他人的想法、意图和信念。这种认...……更多

2024-12-21 09:27:00之路,心智,难题,突破,理论,模型

自主研制！我国发布全球首个百亿级遥感解译基础模型

...天信息技术大会上，我国自主研制的百亿级遥感解译基础模型——“空天·灵眸”3.0版正式发布。据了解，这是迄今全球首个百亿参数级空天一体遥感解译基础模型。3.0版内核工作架构基于热传导，这是联合团队自主研发的一套...……更多

2024-09-22 07:25:00遥感,模型,我国,基础,全球,空天

AI新时代揭幕！会“思考解题逻辑”的OpenAI推理大模型登

...，AI时代迎来崭新的起点——能够进行通用复杂推理的大模型终于走到台前。OpenAI在官网发布公告称，开始向全体订阅用户开始推送OpenAI o1预览模型——也就是此前被广泛期待的“草莓”大模型。OpenAI表示，对于复杂推理任务而...……更多

2024-09-13 13:34:00新时代,推理,逻辑,模型,模型,问题

超越GPT-4o！开源科研神器登场，4500万论文检索增强生

只需几秒钟，开源模型检索4500篇论文，比GPT-4o还靠谱！这就是由华盛顿大学和艾伦人工智能研究所（Ai2）打造的最新模型OpenScholar。它还是首个从论文到数据集、模型检查点都完全开源的科研助手模型。在由20位专家进行的500次...……更多

2024-11-27 09:58:00论文检索,神器,生成,科研,检索,论文

本周硅谷发生了什么？｜苹果Vision Pro正式开售；Ne

文｜王怡宁编辑｜邓咏仪尚恩一周纵览本周大模型厂商们依旧表现活跃。硅谷大厂方面，Meta更新了编程模型Code Llama 70B，是Code Llama系列中规模最大，性能最强的版本。一款名为“miqu-1-70b”的神秘模型现身Hugging Face，跑分接近GP...……更多

2024-02-05 11:37:00硅谷,字节,接口,人类,苹果,模型

让AI无处不在高通全面开启终端侧生成式AI大门

...，AI将重塑消费者对用户体验的感知，骁龙将成为所有AI模型在终端侧运行的首选平台。基于这样的价值考量，在今年骁龙峰会上，高通推出了两款全新平台，二者无不强调了终端侧生成式AI体验的需求，从底层为用户提供贴近生...……更多

2023-11-08 09:29:00高通,终端,生成,大门,高通,终端

苹果公司公布“mm1”多模态大模型

...dalLLMPre-training》的论文，其中介绍了一款“MM1”多模态大模型，该模型提供30亿、70亿、300亿三种参数规模，拥有图像识别和自然语言推理能力。IT之家注意到，苹果研究团队相关论文主要是利用MM1模型做实验，通过控制各种变量...……更多

2024-03-16 18:48:00苹果公司,模态,模型,苹果,公司,模型

影响英伟达根本逻辑的大争论：OpenAI改变策略意味着什么？

大模型预训练“缩放定律”定律失效？模型推理成“解药”，英伟达一家独大格局要变天？“缩放定律”指导下，AI大模型预训练目前遭遇瓶颈。据路透12日报道，硅谷主要AI实验室的新模型训练计划目前普遍进展不顺，新模型...……更多

2024-11-13 14:09:00英伟,争论,逻辑,意味,根本,策略

Meta祭出三篇最详尽Llama微调指南！千字长文，0基础小

...开的彻彻底底。这不，Meta一连放出三篇技术文章，从大模型适配方法出发，介绍了：如何使用特定领域数据微调LLM，如何确定微调适配自己的用例，以及如何管理良好训练数据集的经验法则。接下来，直接进入正题。适配大模...……更多

2024-08-27 12:03:00小白,长文,千字,基础,指南,训练

AI正加速迈进应用落地关键期

...真正意义上的“政策+产业”共振。事件驱动 DeepSeek线上模型版本升级至V3.18月 21日，DeepSeek发布了DeepSeek—V3.1大模型。本次升级后的模型采用了混合推理架构，即一个模型同时支持思考模式与非思考模式，用户可以使用“深度...……更多

2025-08-27 09:14:00关键期,落地,关键,应用,国产,精度

乔布斯时代之后，会迎来黄仁勋时代吗？

...AI能够做的工作有了更强烈的预期和紧迫感，而且各种大模型如雨后春笋一般地涌现出来，市场对于高性能芯片的需求度也爆棚了。黄仁勋推出B200的时候，人们忍不住要惊呼了。这是Hooper后的新一代架构，以数学家Blackwell命名。...……更多

2024-03-20 09:11:00乔布,时代,芯片,模型,英伟,布斯

OpenAI-o1思考替代法火了！焦剑涛高徒一作提出思考偏好

OpenAI-o1替代品来了，大模型能根据任务复杂度进行不同时间的思考。不限于推理性的逻辑或数学任务，一般问答也能思考的那种。最近畅销书《Python机器学习》作者Sebastian Raschka推荐了一项新研究，被网友们齐刷刷码住了。论文...……更多

2024-10-29 09:58:00高徒,偏好,模型,过程,基线,偏好

清华提出CharacterGLM；DeepMind联创发全新

...技术优势：它支持智谱 AI、百川智能等国内领先的大语言模型，通过微调和优化提高模型的准确率和可读性，通过开放 API 接口支持个性化的数据应用搭建。（来源：“CSDN”微信公众号）《马斯克多次失手，OpenAI 异军突起，硅...……更多

2023-12-06 09:22:00联创,模型,清华,早报,一代,零售

字节发布豆包1.5深度思考模型：“实拍级”图像生成

...火山引擎总裁谭待正式发布了备受瞩目的豆包1.5深度思考模型。谭待指出，豆包1.5深度思考模型在多个关键领域展现出卓越性能。在数学、编程、科学推理这类专业领域中，它能够精准高效地处理复杂问题；在创意写作等通用任...……更多

2025-04-17 11:54:00豆包,字节,深度,生成,模型,图像

AMD的GPU跑AI模型终于Yes了？PK英伟达H100不带

...过。但是，也需要说明这些测试存在局限：仅使用了一种模型，即来自 Meta 的 Llama 2 70B。希望未来能看到这些测试中使用更多不同的 AI 模型。对 MI300X 及 AMD 未来的 GPU 来说，这个结果很是不错。但到今年年底时，考虑到英伟达 B...……更多

2024-09-05 09:49:00英伟,模型,英伟,内存,推理,性能

通义千问系列AI开源模型升至Qwen2：5个尺寸，最高 12

...息，通义千问（Qwen）今天宣布经过数月的努力，Qwen 系列模型从 Qwen1.5 到 Qwen2 的重大升级，并已在 Hugging Face 和 ModelScope 上同步开源。IT之家附上 Qwen 2.0 主要内容如下：5 个尺寸的预训练和指令微调模型，包括 Qwen2-0.5B、……更多

2024-06-07 09:32:00通义,模型,尺寸,模型,训练,上下文

迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测

...这是该团队在继 PMC-LLaMA 后，在持续构建开源医疗语言大模型的最新进展。该项目受到科创 2030—“新一代人工智能” 重大项目支持。在医疗领域中，大语言模型已经有了广泛的研究。然而，这些进展主要依赖于英语的基座模型...……更多

2024-09-30 09:51:00多语,大规,模型,语料,基准,大规模

代码模型自我进化超越GPT-4o蒸馏！UIUC伯克利等提出自

【新智元导读】代码模型可以自己进化，利用自身生成的数据来进行指令调优，效果超越GPT-4o直接蒸馏！LLM作为智能的基座，可以衍生出各种能力。代码能力就是其中一种：程序补全、注释、优化、修bug、测试等等。而想要充...……更多

2024-11-29 09:26:00伯克,伯克利,进化,模型,代码,方法

马斯克 xAI 推出 Grok-1.5 大语言模型

...公司 xAI 今天在官方博客中宣布，正式推出 Grok-1.5 大语言模型。Grok-1.5 具有改进的推理能力和 128k 的上下文长度，其中最显著的改进之一是其在编码和数学相关任务中的表现。Grok-1.5 将在未来几天内在平台上向早期测试人员和...……更多

2024-03-29 14:00:00马斯,马斯克,模型,语言,基准,上下文

疯狂一夜！美国AMD、谷歌纷纷亮出大杀器，人类迎来巨变前夜？

...迄今为止功能最强大、最通用的多模态人工智能（AI）大模型：Gemini（中文称“双子座”）。具体来看，谷歌最新发布的Gemini 1.0系列，主要是英语模型，共包括三个不同尺寸版本：Ultra（超大杯）、Pro（大杯）和Nano（中杯），将...……更多

2023-12-07 13:02:00美国,人类,疯狂,焦点,媒体,英伟

多模态模型评测框架lmms-eval发布！全面覆盖，低成本，

...稿邮箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com随着大模型研究的深入，如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力，LLaVA-……更多

2024-08-22 09:50:00模态,框架,模型,评测,污染,成本