模型,参数,模型,基准,问题,推理头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

大模型新趋势之MoE：现状、挑战及研究方向

2024年，全球主流企业加快推出MoE大模型，1-5月发布千亿以上大模型均采用MoE优化架构，且数量超过近三年总和。MoE大模型架构凭借平衡大模型训推成本和计算效率等优势，更适合处理大规模数据和复杂任务，已成谷歌、OpenAI、...……更多

2024-11-04 16:00:00研究方向,模型,现状,方向,趋势,研究

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构

...的关注，但最近浙大、中科院等机构的学者们提出，先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准，并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型，似乎都很难完成更抽象层...……更多

2024-08-08 16:23:00模态,领衔,基准,推理,视觉,能力

反击OpenAI，谷歌放出最强悍大模型Gemini

...斯·哈萨比斯在谷歌官网联名发文，官宣了最新多模态大模型Gemini 1.0（双子星）版本正式上线。这个上线时间早于外界猜测的明年1月，保密程度很高，仅有少数媒体提前猜出。Gemini 1.0是谷歌筹备了一年之久的GPT4真正竞品，也是...……更多

2023-12-07 10:31:00强悍,模型,模态,模型,训练,能力

腾讯大模型混元Turbo：御气升昺云，梓桐金鼎开

9月5日，腾讯正式推出其新一代旗舰大模型——混元Turbo。相比前代模型，腾讯混元Turbo性能有显著提升，训练效率提升108%，推理效率提升 100%，推理成本降低 50%，解码速度提升 20%，效果在多个基准测试上对标GPT-4o。最新第三方...……更多

2024-09-14 14:04:00金鼎,腾讯,模型,腾讯,模型,推理

刚刚，Llama 3.2 来了！支持图像推理，还有可在手机上

...又又动荡了，另一边被誉为「真・Open AI」的 Meta 对 Llama 模型来了一波大更新：不仅推出了支持图像推理任务的新一代 Llama 11B 和 90B 模型，还发布了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。不仅如此，Meta 还...……更多

2024-09-27 13:42:00推理,可在,图像,运行,版本,支持

整合长期记忆，AI实现自我进化，探索大模型这一可能性

...。而这一切背后的机制是进化（evolution）。到了现今的大模型时代，强大的基础模型已经展现出了强大的智能水平，能完成多种多样的任务。但它们也有个缺点，训练之后就基本定型了，难以随着用户的使用而演进。但毫无疑问...……更多

2024-10-29 09:55:00进化,可能性,模型,整合,记忆,模型

$免训练大模型知识编辑，吸收新数据更高效｜EMNLP\'24$

免训练大模型知识编辑，吸收新数据更高效｜EMNLP'24

让大模型能快速、准确、高效地吸收新知识！被EMNLP 2024收录的一项新研究，提出了一种检索增强的连续提示学习新方法，可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识，同时不需...……更多

2024-10-30 09:57:00模型,训练,知识,数据,模型,知识

腾讯推出 Hunyuan-Large 开源大模型

IT之家11月5日消息，腾讯今日宣布推出Hunyuan-Large大模型，官方表示这是目前业界已经开源的基于Transformer的最大MoE模型，拥有3890亿总参数（389B）和520亿激活参数（52B）。腾讯今日在HuggingFace开源了Hunyuan-A52B-Pretrain、Hun……更多

2024-11-05 18:56:00腾讯,模型,模型,长上,腾讯,训练

多样任务真实数据，大模型在线购物基准Shopping MML

谁是在线购物领域最强大模型？也有评测基准了。基于真实在线购物数据，电商巨头亚马逊终于“亮剑”——联合香港科技大学、圣母大学构建了一个大规模、多任务评测基准Shopping MMLU，用以评估大语言模型在在线购物领域的...……更多

2024-11-21 09:45:00在线购物,基准,模型,任务,购物,数据

ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:

...稿邮箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com大语言模型 (LLM) 是如何解数学题的？是通过模板记忆，还是真的学会了推理思维？模型的心算过程是怎样的？能学会怎样的推理技能？与人类相同，还是超越了人类？只学一种类...……更多

2024-08-06 09:27:00推理,模型,内心,人类,世界,模型

智能体首达Kaggle Grandmaster,华为结构化推

前些时日，AI 大模型开始掌握操作计算机的能力，但整体而言，它们与物理世界互动的能力仍处于早期阶段。为了提高 LLM 在复杂的现实世界中的表现，研究者们提出了各种提示策略来提升大模型的推理和规划能力，比如思维链...……更多

2024-11-09 09:53:00华为,结构化,推理,思维,结构,智能

商汤又“夺金”！SuperCLUE-V多模态大模型基准发布1

...秋，“日日新·商量”又拿了金牌！今日，中文多模态大模型测评基准SuperCLUE-V发布10月榜单：商汤日日新·商量多模态大模型（SenseChat-Vision5.5）凭借多个任务上的出色表现，总得分位列国内大模型第一梯队，智夺金牌。商量多模...……更多

2024-10-14 13:34:00商汤,模态,基准,模型,模型,能力

李彦宏称开源赶不上闭源？Meta发布最强开源模型，马斯克评价

...家坚持开源的社交巨头，又默默放出了最新一代的开源大模型Llama3。美当地时间4月18日，Meta在官网上发布了两款开源大模型，参数分别达到80亿和700亿，是目前同体量下性能最好的开源模型。马斯克对此评价称“还不错”。Meta...……更多

2024-04-20 11:00:00马斯,马斯克,李彦,模型,评价,模型

高通发布新款云ai推理加速卡

...速卡——CloudAI100Ultra。这款产品专为生成式AI和大型语言模型而设计，提供相当于上一代产品四倍的性能。新款CloudAI100Ultra可部署的模型规模进一步扩大，单张150W的卡上可部署100B参数模型，在两张卡上则可部署高达175B参数。不...……更多

2023-11-16 09:38:00加速卡,高通,推理,高通,加速卡,高通公司

Llama版o1来了，来自上海AI Lab，强化学习代码已开

复刻OpenAI o1推理大模型，开源界传来最新进展：LLaMA版o1项目刚刚发布，来自上海AI Lab团队。简介中明确：使用了蒙特卡洛树搜索，Self-Play强化学习，PPO，以及AlphaGo Zero的双重策略范式（先验策略+价值评估）。在2024年6月，o1发...……更多

2024-11-06 09:49:00上海,代码,学习,训练,模型,蒙特卡洛

无一大模型及格！北大/通研院提出超难基准，评估长文本理解生

在长文本理解能力这块，竟然没有一个大模型及格！北大联合北京通用人工智能研究院提出了一个新基准数据集：LooGLE，专门用于测试和评估大语言模型（LLMs）长上下文理解能力。该数据集既能够评估LLMs对长文本的处理和检索...……更多

2024-08-08 09:39:00基准,北大,生成,模型,文本,评估

o1金牌团队揭秘AI超越人类惊人时刻！22分完整版视频全公开

...时刻。在22分钟完整版采访视频中，他们分享了自己对新模型的思考，以及背后的开发故事。OpenAI o1团队采访的完整版视频，终于上线了！全程22分钟，o1研发团队在项目Bob McGrew组织下，一起分享了「啊哈」时刻。有的人提到，...……更多

2024-09-23 09:50:00整版,金牌,团队,人类,时刻,视频

对标OpenAI o1！Kimi发布新一代推理模型：中考高考

...息，日前，国内人工智能公司月之暗面推出的Kimi国产大模型正式发布k0-math。k0-math是Kimi推出的首款推理能力强化模型，采用全新强化学习和思维链推理技术，通过模拟人脑的思考和反思过程，大幅提升解决数学难题的能力。据...……更多

2024-11-18 08:22:00推理,新一代,模型,高考,模型,基准

MMMU华人团队更新Pro版！多模态基准升至史诗级难度：过滤

...题、增加候选选项、引入纯视觉输入设置）更严格地评估模型的多模态理解能力；模型在新基准上的性能下降明显，表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型（MLLMs）在各个排行榜上展现的性...……更多

2024-09-18 13:31:00模态,史诗,基准,难度,问答,文本

腾讯推出新一代大模型“混元Turbo”，性能大幅提升，定价低

9月5日，腾讯宣布推出新一代大模型“混元Turbo”，相比前代模型，腾讯混元Turbo性能有显著提升，训练效率提升108%，推理效率提升100%，推理成本降低50%，解码速度提升20%，效果在多个基准测试上对标GPT-4o，第三方测评居国内第...……更多

2024-09-05 17:29:00腾讯,新一代,模型,定价,性能,腾讯

Pika爆火，但AI视频还没到「GPT时刻」；首个GPT-4

...PT时刻」》AI视频背后有两条技术路线，一条基于Transformer模型，另一条基于扩散模型（Diffusion model）。尽管AI视频技术取得进展，但还未达到真正的GPT时刻，即AI视频融入视频生产工作流并满足广泛需求的阶段。目前AI视频领域的...……更多

2023-12-14 09:34:00模型,微软,人形,早报,机器人,机器

苹果发布mm1.5-ui模型

...13日消息，近日，苹果公司推出了300亿参数的多模态AI大模型MM1.5，该版本是在前代MM1的架构基础上发展而来的。该模型继续遵循数据驱动的训练原则，着重探究在不同训练周期中混合各类数据对模型性能产生的影响，相关模型文...……更多

2024-10-13 10:57:00模型,苹果,模型,苹果公司,数据,苹果

自动化、可复现，基于大语言模型群体智能的多维评估基准

...BZUAI 等学术机构学者组成的开源组织，致力于发展大语言模型 (LLM)、世界模型 (World Model)、智能体模型 (Agent Model) 的技术以构建 AI 驱动的现实。Maitrix.org 此前成功开发了 Pandora 视频-语言世界模型、LLM Reasoners，以及……更多

2024-10-23 12:03:00多维,基准,群体,模型,自动化,评估

大模型是否有推理能力？DeepMind数月前的论文让AI社区

最近一段时间，随着 OpenAI o1 模型的推出，关于大型语言模型是否拥有推理能力的讨论又多了起来。比如苹果在前段时间的一篇论文中指出，只要给模型一些干扰，最聪明的模型也会犯最简单的错误（参见《给小学数学题加句「...……更多

2024-10-23 12:05:00推理,模型,能力,论文,社区,模型

腾讯发布最大开源MoE模型，3890亿参数免费可商用

...家本领，来挤开源赛道，突然发布了市面上最大的开源MoE模型。Hunyuan-Large，3890亿总参数，520亿激活参数。跑分超过Llama 3.1 405B等开源旗舰，上下文长度支持也高出一档来到256k。虽然Hunyuan-Large还不算腾讯内部的旗舰模型，但腾讯...……更多

2024-11-07 09:54:00腾讯,商用,模型,参数,模型,数据

00后华裔小哥哈佛辍学组团挑战英伟达，史上最快AI芯片Soh

...押注人工智能领域最大的赌注——一种只能运行Transformer模型的芯片，但其运行速度比GPU快几个数量级。也许注意力确实是你所需要的全部...」 Pika研究人员表示，每秒50万token简直太疯狂了。你可以在2秒内写出「圣经」，或者...……更多

2024-06-27 09:25:00小哥,英伟,哈佛,华裔,推理,芯片

英特尔第五代至强可扩展处理器发布：AI推理性能提升42%！

...。此外，第五代至强还能够支持运行200亿参数的大语言模型（LLM）。随着GPT-4、Meta的Llama 2和Stable Diffusion等大语言模型的兴起，英特尔也在推动其至强处理器对于相对较小规模的大模型的支持能力，对于这类工作负载，内存带...……更多

2023-12-16 13:49:00英特,英特尔,推理,处理器,性能,处理

Bengio团队提出多模态新基准，直指Claude 3.5和

...想要达成通用人工智能 AGI 的终极目标，首先要达成的是模型要能完成人类所能轻松做到的任务。为了做到这一点，大模型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链（Chain-of-Thought）等...……更多

2024-06-29 09:37:00模态,基准,弱点,团队,模型,任务

全模态对齐框架align-anything来啦：实现跨模态指

...、张钊为、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作，包括 Aligner（NeurIPS 2024 Oral）、ProgressGym（NeurIPS 2024 Spotlight）以及 Safe-RLHF（ICLR 2024 Spotlight）等系列……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据