推理,周期,训练,生命,推理,能效头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...云推出全面升级的GPU云服务，通过全新优化GPU套件，多GPU推理服务性能可最大提升100%。针对调用GPU算力最常用的容器技术，阿里云推出ACK云原生AI套件，帮助开发者及企业更高效地开发和部署AI应用，加速大模型应用落地。随着A...……更多

2024-07-19 17:21:00阿里,推理,模型,性能,升级,服务

黄仁勋：我从不在乎市场份额、英伟达唯一目标是创造新市场

...英伟达，老黄还讨论了AGI的智能扩展、机器学习的加速、推理与训练的重要性……虽然时长感人（近1个半小时），但一大波网友已经看完并交起了作业（开始卷了是吧！）网友：学起来！学起来！黄仁勋：未来推理的增长将远...……更多

2024-10-23 12:25:00新市,英伟,份额,从不,目标,市场

港中文团队提出大模型元推理范式，革新大模型的评价体系

...一定启示。日前，相关论文以《大型语言模型评价中的元推理革命》（MR-GSM8K: A Meta-Reasoning Revolution in Large Language Model Evaluation）为题发在 arXiv，曾忠燊是第一作者，香港中文大学教授贾佳亚担任通讯作者 [1]。图……更多

2024-03-04 10:23:00革新,模型,范式,中文,推理,团队

模拟5亿年自然进化史，全新蛋白质大模型ESM3诞生！前Met

...白质语言模型ESM3。不仅支持序列、结构、功能的all-to-all推理，团队还在实验中发现，它设计的新蛋白质相当于模拟自然界5亿年的进化。继AlphaFold 3更新后，我们又看到了一个生命科学领域的大模型ESM3。模型开发团队来自于名为...……更多

2024-06-27 09:31:00进化史,力作,老将,蛋白质,进化,蛋白

联想王传东：2027年AI PC将成为市场主流

...下也能使用；第三，更低的大模型使用成本，以本地免费推理为主、以云端公共推理为辅，一次性购买AIPC即可享受全生命周期的本地免费推理服务；第四，可信、安全的个人数据和隐私保障，个性化本地知识库、隐私数据的本...……更多

2023-12-17 21:00:00王传,主流,市场,推理,服务,个人

英特尔以全新软硬件助力千行百业释放AI潜能

...此外，据最新消息，GraniteRapids在运行80亿参数的Llama3模型推理时，延迟比第四代英特尔至强处理器表现出两倍的提升，并且能够以低于100毫秒的token延迟运行700亿参数的Llama3模型推理。携手生态合作伙伴助力数智变革现如今，...……更多

2024-04-26 22:38:00英特,英特尔,软硬,潜能,百业,全新

三星galaxys24系列全系搭载骁龙8移动平台

...的核心——高通HexagonNPU，增强的高通HexagonNPU让生成式AI推理速度更快，相比前代的推理速度快98%，且能效提升40%。最新的HexagonNPU还集成了微架构升级、增强的微切片推理、更低的内存带宽占用，以及可实现最优性能和能效的专...……更多

2024-02-08 18:17:00三星,移动,平台,三星,高通,三代

GPT刚刚公开「草莓」项目：推理能力翻倍，定价200美元？

... OpenAI 在大语言模型领域的新尝试，也可能是对人工智能推理能力一次新的革命性提升。根据目前流出的信息来看，相比以往的 GPT 模型，「草莓」在处理复杂问题、执行多步骤任务方面展现出前所未有的潜力，使其成为通用人...……更多

2024-09-12 09:49:00推理,草莓,定价,能力,项目,草莓

ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:

...M) 是如何解数学题的？是通过模板记忆，还是真的学会了推理思维？模型的心算过程是怎样的？能学会怎样的推理技能？与人类相同，还是超越了人类？只学一种类型的数学题，是会对通用智能的发展产生帮助？LLM 为什么会犯...……更多

2024-08-06 09:27:00推理,模型,内心,人类,世界,模型

3天把Llama训成Mamba，性能不降，推理更快！

...Mamba模型，并且设计了新的推测解码算法，加速了模型的推理。先来看一张其乐融融的图片（一眼AI）：右边的小羊驼代表Llama，而左边的蛇（Mamba）也是我们的老熟人了。至于到底能不能其乐融融，咱就不管了，之所以有此场景...……更多

2024-09-06 10:01:00推理,更快,性能,模型,输出,训练

首个o1复现开源RL框架OpenR来了，UCL、上交等高校联

...湖大学工学院助理教授（研究）杨林易。o1 作为 OpenAI 在推理领域的最新模型，大幅度提升了 GPT-4o 在推理任务上的表现，甚至超过了平均人类水平。o1 背后的技术到底是什么？OpenAI 技术报告中所强调的强化学习和推断阶段的 Sca...……更多

2024-10-15 09:56:00框架,团队,联合,模型,过程,步骤

谷歌最新自然语言推理算法

谷歌发布全新反向推理算法LAMBADA，无惧搜索空间爆炸！自动推理绝对算是自然语言处理领域的一大难题，模型需要根据给定的前提和知识推导出有效且正确的结论。尽管近年来NLP领域借着大规模预训练语言模型在各种「自然语...……更多

2023-01-09 21:57:00自然语言,算法,推理,自然,语言,目标

PC迎来AI时刻，英特尔、微软、联想等纷纷布局，产品价格将迎

...算力是上一代的8倍，可在PC上实现高能效的AI加速和本地推理，并适配超过10款国产大模型。英特尔的老对手AMD则抢先一步，上周发布Ryzen 8040系列处理器。该处理器集成了升级的专用AI引擎NPU，算力为16TOPS，AI性能相比上一代提升...……更多

2023-12-12 16:27:00英特,英特尔,微软,布局,时刻,价格

昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE

...万维宣布开源2千亿稀疏大模型Skywork-MoE，性能强劲，同时推理成本更低。Skywork-MoE基于之前昆仑万维开源的Skywork-13B模型中间checkpoint扩展而来，是首个完整将MoE Upcycling技术应用并落地的开源千亿MoE大模型，也是首个支持用单台409...……更多

2024-06-03 20:59:00万维,昆仑,模型,模型,万维,昆仑

手机上能跑的「GPT-4V」来啦！多图、视频理解首次上端！面

...类模型低 75%。端侧友好：量化后端侧内存仅占 6 GB；端侧推理速度高达 18 tokens/s，相比上代模型快 33%。并且发布即支持 llama.cpp、ollama、vllm 推理；且支持多种语言。统一高清框架，高效能力一拖三：小钢炮的传统优势 OCR 能力延...……更多

2024-08-07 09:42:00多图,小钢炮,模态,上端,手机,视频

大模型重构生命科学！最大基础模型面世，解锁DNA超长序列

...，从跨模态预训练、到下游任务的微调都可以完成。而在推理端，他们为该领域量身定制地打造了生物与AI融合的计算引擎。这个值得说道说道。因为在我们日常大模型语境中，可能只需要针对AI模型本身进行推理优化，就能在...……更多

2024-11-07 09:50:00模型,重构,生命科学,序列,生命,基础

MWC 2024速递丨押宝AI，产业巨头激战未来

...大挑战：算力供给瓶颈、严肃场景中的差错、聚焦训练但推理不足以及商业闭环的挑战。徐子阳提出，需从多方面实现AI技术进阶，包括突破技术瓶颈，加强架构、算法、算网和软硬件协同优化研究，以提升AI训练和推理效率...……更多

2024-06-28 23:45:00速递,巨头,产业,数据,西部数据,智能

李彦宏发布文心大模型4.0工具版，推理成本降到1%

...练效率提升到了原来的5.1倍，周均训练有效率达到98.8%，推理性能提升了105倍，推理的成本降到了原来的1%。“也就是说，客户原来一天调用1万次，同样成本之下，现在一天可以调用100万次。”此外，李彦宏在演讲中分享了百度...……更多

2024-04-16 13:37:00李彦,文心,推理,模型,成本,工具

英伟达发布Llama-3.1-Nemotron-51B AI

...型，Llama-3.1-Nemotron-51B 在保持了几乎相同的精度情况下，推理速度提高了 2.2 倍。准确率能效MT BenchMMLUText generation(128/1024)Summarization/ RAG (2048/128)Llama-3……更多

2024-09-26 09:49:00英伟,模型,模型,英伟,精度,内存

研究人员给了人工智能一个“内心独白”，结果大大提高了其性能

...工智能系统，让它在说话前先思考。内心独白提高了常识推理能力，并使其数学成绩翻了一番。一项新的研究表明，给人工智能系统一个“内心独白”会大大提高它们的推理能力。这种方法训练的人工智能系统，会在对提示做出...……更多

2024-03-21 16:13:00人工智能,研究人员,独白,人工,内心,性能

英伟达SC24六大技术亮点，不止加速超算500强

...快数据处理的cuPyNumeric、生物医药开源框架BioNeMo、新材料推理器NVIDIA ALCHEMI NIM微服务、气候预测平台Earth-2 NIM、CUDA-Q平台以及实现数字孪生的Omniverse Blueprint，为学术界和产业界提供更多支持，推动量子计算、药物发现以及新材……更多

2024-11-22 09:48:00英伟,亮点,技术,量子,英伟,模型

PC正在经历AI时代下一代Windows 12将是AI P

...态下也能使用；第三，降低大模型使用成本，在本地免费推理为主，云端公共推理为辅的情况下，一次购买AI PC即可享受全生命周期的本地免费推理服务；第四，提供可信、安全的个人数据和隐私保障，包括个性化本地知识库、...……更多

2023-12-17 21:02:00下一代,载体,正在,时代,推理,个人

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构

新智元报道编辑：乔杨【新智元导读】LLM的数学推理能力缺陷得到了很多研究的关注，但最近浙大、中科院等机构的学者们提出，先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准，并设计了一种...……更多

2024-08-08 16:23:00模态,领衔,基准,推理,视觉,能力

直面大模型“大成本”挑战，如何提高算力效率？

...算效率和算力开销两大问题成为新的行业焦点。对大模型推理成本的优化，可通过很多技术手段实现。首先是模型本身，模型结构、训练方法都可以持续改进，包括业界很关注的MoE(混合专家模型)，就是优化推理成本很好的解决...……更多

2024-06-03 14:07:00模型,效率,成本,模型,推理,成本

打通大模型产业应用的最后一公里!联想首次全面深入解读全栈智能

...能计算等；在AI服务器领域，联想从训练到训推一体再到推理的AI全场景都有完善的AI服务器产品矩阵。在设备之上，联想研发了在构筑智算中心时的关键模块——异构智算平台。同时，联想与国内外领先的AI算力生态企业广泛合...……更多

2024-01-14 22:52:00布局,模型,战略,智能,产业,应用

AI大模型应用商机：“AI+”还是“+AI”

...带来了更大的泛化能力，可实时对音频、视觉和文本进行推理，标志着AI大模型应用向更自然的人机交互持续迈进。GPT-4o的推出进一步推动了AI应用的繁荣，以AI大模型主导的创新应用前景也有望打开新的想象空间。对不同企业来...……更多

2024-05-16 14:00:00模型,还是,商机,应用,模型,联想集团

剧本推理游戏需要几个人才能玩

一般来说，剧本推理游戏最少是需要4个人才能玩的，但是如果要想有更好的体验感，最好还是要有5~8个人一起玩比较好，一般用时2~3个小时。知识讲解什么是剧本推理游戏？所谓的剧本推理游戏也称呼为“谋杀之谜”游戏，是...……更多

2023-01-19 00:45:00推理,剧本,个人,推理,剧本,玩家

面壁智能发布2B模型：适配主流手机，推理成本仅为GPT-4的

...在MMLU（多任务语言理解）、Knowledge（知识）、Reasoning（推理）、Comprehension（理解）等关键指标上均超越了Meta Llama 2的13B模型。这一个故事，在2024年2月1日的发布会上，也被AI模型层公司面壁智能的CEO李大海不断提起。对标Mistral..……更多

2024-02-03 16:03:00适配,推理,模型,主流,成本,智能