推理,性能,再次,重点,模型,推理头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...模型，腾讯混元Turbo性能有显著提升，训练效率提升108%，推理效率提升 100%，推理成本降低 50%，解码速度提升 20%，效果在多个基准测试上对标GPT-4o。最新第三方测评在国内位居第一。腾讯混云大模型已经落地腾讯700+个业务场景...……更多

2024-09-14 14:04:00金鼎,腾讯,模型,腾讯,模型,推理

NVIDIA首秀Blackwell GB200超级芯片系统：

...性能方面只给出了一个数据：Llama 3.1 700亿参数大模型的AI推理性能对比H200提高了足足1.5倍。散热怎么办？NVIDIA透露正在开发热水散热系统，可以将耗电量减少28％。不过，NVIDIA仍然没有给出Blackwell GPU服务器的出货时间，估计在...……更多

2024-08-26 09:50:00推理,芯片,性能,系统,性能,服务器

腾讯推出新一代大模型「混元Turbo」，性能大幅提升，定价低

...元Turbo”。腾讯介绍，该模型采用MoE架构，比上一代产品推理效率提升100%，推理成本降低50%，解码速度提升20%。腾讯公司副总裁、云与智慧产业事业群COO兼腾讯云总裁邱跃鹏宣布，腾讯混元Turbo在腾讯云上线，输入和输出价格只...……更多

2024-09-05 14:28:00腾讯,新一代,模型,定价,性能,腾讯

让OpenAI o1逆天的慢思考，360两月前就做出来了？周

...读】o1大火背后，最关键的技术是CoT。模型通过一步一步推理，恰恰是「慢思考」的核心要义。而这一观点，其实这家国内大厂早就率先实现了。OpenAI的理念，居然被国内公司抢先践行了？比起OpenAI，这家公司的idea提出得更早，...……更多

2024-09-21 09:50:00周鸿,前瞻,应用,模型,推理,协作

长上下文能力只是吹牛？最强GPT-4o正确率仅55.8%，开

...较长的小说了。更重要的是，LLM真的能在这个长度上进行推理吗？近日，有两篇独立研究分别表明：长上下文水分很大！LLM实际上并不能「理解」内容。读小说挑战首先是来自UMass、AI2和普林斯顿的研究人员，推出了一项针对性...……更多

2024-07-23 17:12:00正确率,长上,下文,模型,只是,能力

Meta首款多模态Llama 3.2开源！1B羊驼宝宝，跑在

...I正在壮大。能力一览11B和90B这两款模型，不仅支持图像推理场景，包括图表和图形在内的文档级理解、图像描述以及视觉定位任务，而且还能基于现有图表进行推理并快速给出回答。比如，你可以问「去年哪个月销售业绩最好...……更多

2024-09-27 13:39:00模态,宝宝,模型,图像,训练,文本

本周硅谷发生了什么？｜苹果Vision Pro正式开售；Ne

...推出数据分析工具“办公小浣熊”面壁智能发布2B模型，推理成本仅为GPT-4的1/360科大讯飞发布全民开放大模型星火V3.5百川智能发布Baichuan 3大模型，更好理解中文阿里巴巴开发的自主多模态AI代理MobileAgent上线苹果Vision Pro正式在...……更多

2024-02-05 11:37:00硅谷,字节,接口,人类,苹果,模型

MMMU华人团队更新Pro版！多模态基准升至史诗级难度：过滤

...不断提升，例如GPT-4o在大学水平上的多学科多模态理解和推理（MMMU）基准测试中取得了69.1%的准确率。不过，基准测试结果是否真的能反映模型对多样化主题的深入理解，仍然有争议，或者说模型是否只是利用了统计模式，而非...……更多

2024-09-18 13:31:00模态,史诗,基准,难度,问答,文本

菲尔兹奖得主亲测GPT-4o，经典过河难题破解失败！最强Cl

... 3.5依旧答错了。LeCun在此嘲讽大模型一番，大模型竟可以推理...？问题在于，LLM没有常识，不理解现实世界，也不会规划和推理。LLM行不行，就看提示了一位网友分析总结了，以上LLM失败的原因。他表示，LLM本身就是个「哑巴」...……更多

2024-07-01 08:58:00菲尔,得主,难题,经典,农夫,模型

智谱AI推出第三代基座大模型可在手机上部署

...具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景。以代码功能为例，它既可以让代码“小白”也具备技术能力、为女友写一段能呈现爱心图样的代码，也可以成为程序员的帮手，让它帮助生成...……更多

2023-10-28 08:25:00三代,基座,可在,模型,手机,模型

NPU IP累计出货超1亿颗！芯原股份一站式AI解决方案揭秘

...的IP更重要，一定要有比较好的PPA。因为端侧主要是要做推理，也要有一些浮点运算的能力，更关注的是低比特的量化及压缩能力。而在云端一定是高性能、非常高的TOPS，它要能够去做训练和推理。而且不光是单卡的训练推理，...……更多

2024-06-14 11:39:00解决方案,股份,方案,芯片,模型,处理器

Claude 3.5深夜觉醒，学会模仿人类用电脑！编程干翻o

...、输入文本，还能查找代码错误、自动搜集信息填表。AI推理已至瓶颈，下一个爆破点，就是AI操作电脑！Claude 3.5深夜迎来重磅升级！不出所料，Anthropic AI这周终于有了大动作——首发Claude 3.5 Haiku，全新升级版Claude 3.5 Sonnet也来...……更多

2024-10-23 09:55:00人类,编程,模型,能力,开发,任务

超擎数智重磅发布擎天、锋锐、元景系列AI服务器，打造人工智能

...擎天、锋锐、元景系列AI服务器产品,为大规模数据训练和推理提供强劲性能,帮助AI用户高效构建AI基础设施和应用环境,满足AI场景下的多元算力需求,为AI新质生产力提供强劲引擎。擎天系列L20 AI服务器,4U8卡PCle擎天系列L20 AI服务...……更多

2024-04-28 14:05:00人工智能,重磅,生产力,人工,服务器,引擎

港中文团队提出大模型元推理范式，革新大模型的评价体系

...一定启示。日前，相关论文以《大型语言模型评价中的元推理革命》（MR-GSM8K: A Meta-Reasoning Revolution in Large Language Model Evaluation）为题发在 arXiv，曾忠燊是第一作者，香港中文大学教授贾佳亚担任通讯作者 [1]。图……更多

2024-03-04 10:23:00革新,模型,范式,中文,推理,团队

系统级玩家微软、苹果先后出牌，端侧大模型路径清晰了？

...MGSM（跨语言数学能力）提升 2.3%，而DROP（文本段落分析推理）则下降了 3%。但与此同时，杀手级应用仍未出现。根据第三方网站SimilarWeb的监测数据，早在去年6月，ChatGPT流量即已见顶，当月其网站与移动客户端的全球流量（PV）...……更多

2024-06-21 09:16:00微软,路径,模型,先后,苹果,玩家

大模型上岗三甲医院，给每个医生都配个“病历质控助手”

...理、术语标准化后构建患者画像，再经由惠每医疗大模型推理计算做出提醒或预警，同时大模型还可以基于用户的反馈持续进行优化。图：惠每科技病历内涵质控方案架构最终，在界面的呈现上，惠每科技这个系统会有医生端和...……更多

2024-06-27 09:11:00三甲,三甲医院,病历,助手,模型,医生

Kimi爆火背后：访问量仅次于文心一言和阿里通义，国内外大模

...次采取扩容等措施保证流量异常增高后的稳定，这对Kimi推理算力、成本等也构成挑战。实际上，长文本能力已是国内外大模型追逐热点。复旦大学计算机科学技术学院教授张奇对搜狐科技表示，很多大模型仅停留在长度和简单...……更多

2024-03-23 14:00:00卷上,通义,阿里,文心,下文,模型

Meta祭出三篇最详尽Llama微调指南！千字长文，0基础小

...类型的信息：- 仅输入和输出文本，也就是少样本学习- 推理追踪：添加中间推理步骤，可参阅思维链（COT）提示- 计划和反思追踪：添加信息，教LLM计划和反思其解决问题的策略，可参阅ReACT 选择正确的适配方法要决定上述哪...……更多

2024-08-27 12:03:00小白,长文,千字,基础,指南,训练

推理性能飙升1.5倍！微软疯狂下单GB200芯片提升其AI算

...，新一代GB200服务器系统在Llama 3.1 700亿参数大模型上的AI推理性能对比H200提高了足足1.5倍。此外，微软还计划在低温数据中心部署GB200服务器，以缓解冷却系统的潜在压力。其他云服务提供商订单量则显著低于微软，如亚马逊在2...……更多

2024-10-20 11:52:00微软,推理,芯片,性能,疯狂,微软

字节、阿里云大降价之后，百度：两款主力大模型全面免费

...是百度自研的轻量级大语言模型，兼顾优异的模型效果与推理性能，适合低算力AI加速卡推理使用。ERNIE Speed则是百度的自研高性能大语言模型，通用能力优异，适合作为基座模型进行精调，能更好地处理特定场景问题，同时具...……更多

2024-05-21 17:30:00云大,阿里,字节,主力,模型,模型

支持1024帧、准确率近100％，英伟达「LongVILA」

...微调，(4) LLM 的上下文扩展，以及 (5) 长监督微调。对于推理，MM-SP 解决了 KV 缓存内存使用率的挑战，这在处理非常长的序列时会成为瓶颈。通过使用 LongVILA 增加视频帧数，实验结果表明该研究在 VideoMME 和长视频字幕任务上的...……更多

2024-08-22 09:51:00英伟,准确率,支持,视频,序列,训练

RAG没有银弹！四级难度，最新综述覆盖数据集、解决方案，教你

...成到LLMs中的三种主要方式。从简单的事实检索到复杂的推理任务，每个级别都有其独特的难点和解决方案，需要不同的技术和方法来优化性能。受参数量和知识更新的限制，大模型在执行很多真实场景下的任务时，都需要连接...……更多

2024-11-22 09:54:00银弹,数据,姿势,难度,解决方案,方案

商汤生成式AI业务飙涨256%，成为中国大模型、智算服务市场

...劲需求、“日日新SenseNova”大模型能力的飞跃式提升以及推理成本的快速下降，带动模型调用量增长迅速。报告期内，“绝影”智能汽车业务的表现也极为亮眼。其业务收入达1.7亿元，同比增长100%。上半年新增交付70.5万辆车，...……更多

2024-09-13 13:50:00商汤,市场占有率,占有率,中国,生成,模型

科学家提出情景学习新范式，让学霸大模型向学弱大模型输送能力

...十亿左右。“做大”，能让大模型具备更强的涌现能力和推理能力，从而适用于难度更高的任务。“做小”，能让大模型获得更优秀的推理能力，从而能被部署到手机、手表、耳机、录音笔等各类小微终端之中。情景学习（ICL，...……更多

2024-03-01 09:36:00模型,范式,科学家,情景,能力,科学

最强大模型训练芯片H200发布！

...味着什么？来看测试数据。在HBM3e加持下，H200让Llama-70B推理性能几乎翻倍，运行GPT3-175B也能提高60%。对AI公司来说还有一个好消息：H200与H100完全兼容，意味着将H200添加到已有系统中不需要做任何调整。最强AI芯片只能当半年除...……更多

2023-11-14 20:51:00芯片,模型,训练,英伟,内存,节点

4090笔记本0.37秒直出大片！英伟达联手MIT清华祭出S

...仅解码器LLM）作为文本编码器，以增强对提示词的理解和推理能力。尽管T2I生成模型多年来取得了显著进展，但大多数现有模型仍依赖CLIP或T5进行文本编码，这些模型往往缺乏强大的文本理解和指令跟随能力。与CLIP或T5不同，Gem...……更多

2024-10-18 09:49:00英伟,清华,架构,大片,性能,笔记本

腾讯推出新一代大模型“混元Turbo”，性能大幅提升，定价低

...模型，腾讯混元Turbo性能有显著提升，训练效率提升108%，推理效率提升100%，推理成本降低50%，解码速度提升20%，效果在多个基准测试上对标GPT-4o，第三方测评居国内第一。在腾讯全球数字生态大会上，腾讯公司副总裁、云与智...……更多

2024-09-05 17:29:00腾讯,新一代,模型,定价,性能,腾讯

AI时代CPU不老！Intel五代至强五大革新：340亿参数

...架的支持，特别是PyTorch、TensorFlow等等，在AI训练、实时推理、批量推理等方面，基于不同算法，性能提升最多可达40％，甚至可以处理340亿参数的大模型。根据Intel提供的数据，五代至强SPECInt整数计算性能提升21％，AI负载性能...……更多

2024-03-26 05:00:00革新,小意思,参数,时代,性能,芯片

云天励飞发布14nm Chiplet大模型推理芯片

...理陈宁介绍，DeepEdge10是国内首创的国产14nm Chiplet大模型推理芯片，采用自主可控的国产工艺，内含国产RISC-V核，支持大模型推理部署。依托自研芯片DeepEdge10创新的D2D chiplet架构打造的X5000推理卡，已适配并可承载SAM CV大模型、Lla...……更多

2023-11-16 18:36:00云天,推理,芯片,模型,芯片,云天

优刻得助力智谱AI解锁智能生活

...强结合，GLM-4稳定、高效运行于云端，并具备大规模实时推理能力，成功实现了成本效益和服务质量的平衡。这一创新使得智谱大模型能够深入理解用户需求，快速作出响应，为用户提供智能化生活的便利与高效。自2022年起，优...……更多

2024-02-29 22:25:00智能,生活,模型,推理,规模,能力