• 我的订阅
  • 头条热搜
RAG没有银弹!四级难度,最新综述覆盖数据集、解决方案,教你「LLM+外部数据」的正确使用姿势
...成到LLMs中的三种主要方式。从简单的事实检索到复杂的推理任务,每个级别都有其独特的难点和解决方案,需要不同的技术和方法来优化性能。受参数量和知识更新的限制,大模型在执行很多真实场景下的任务时,都需要连接...……更多
苹果让大模型学会偷懒:更快吐出第一个token,准确度还保住了
...小的 8B 版本可能也依然会有明显延迟。为了提升模型的推理效率,研究者想出了多种多样的方法,但其中很多都会让模型牺牲一些准确度。近日,苹果和 Meta AI 的一个研究团队提出了一种新方法,可在保证准确度不明显下降的...……更多
苹果新论文证明LLM大模型存在缺陷!没有进行真正的逻辑推理
...tical Reasoning”的论文,揭示了大型语言模型(LLM)在数学推理方面的显著局限性。尽管这些模型在生成人类水平的文本方面表现出色,但当处理简单的数学问题时,即使问题仅进行了微小的改动,如添加无关信息,模型的表现也...……更多
商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单
...73.56的高分,并在数理逻辑维度取得第一,体现其强大的推理能力。 SenseChat-Vision5.5基础能力突出,数理逻辑维度超越GPT-4o本次SuperCLUE-V涵盖了国内外最具代表性的11个开源/闭源多模态理解大模型,聚焦多维度能力评估,包括基...……更多
...大模型的超低价格引发行业震动。据悉,豆包主力模型的推理输入价格只有0.0008元/千Tokens,比行业便宜99.3%。对此,谭待坦言,“降价是用技术优化成本来实现的。如果只是补贴,用亏损换收入是不可持续的,火山引擎不会走这...……更多
00后华裔小哥哈佛辍学组团挑战英伟达,史上最快AI芯片Sohu推理性能超H100二十倍!
...元导读】史上最快Transformer芯片诞生了!用Sohu跑Llama 70B,推理性能已超B200十倍,超H100二十倍!刚刚,几位00后小哥从哈佛辍学后成立的公司Etached,宣布再融资1.2亿美元。有史以来最快的Transformer芯片,刚刚诞生了?去年21岁哈佛...……更多
o1带火的CoT到底行不行?新论文引发了论战
...To CoT or not to CoT?OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链(CoT)的兴趣。一时之间,似乎思维链很快就会成为所有 LLM 的标配,但思维链并非万能,就连 OpenAI 自己也提到 o1 在某些任务上的表现并不比 GPT-4o 强...……更多
豆包大模型公布价格清单 支持国内最高并发标准
...示豆包通用模型不同版本、不同规格的价格信息。在模型推理定价大幅低于行业价格的基础上,豆包通用模型的 TPM(每分钟Tokens)、RPM(每分钟请求数)均达到国内最高标准。以豆包主力模型 pro-32k 为例,价格比行业低99%,TPM...……更多
李彦宏:大模型场景下开源是最贵的,多模态是通往AGI的必经之路
...练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。会上,百度发布了文心大模型4.0的工具版,该工具版可以让开发者体验代码解释器功能,开发者不仅可以通过自然语言...……更多
ASC24超算大赛启动会在京举行,大模型推理等成为赛题
...在上海大学举行的总决赛。据悉,今年的赛题包括大模型推理优化、渗流数值模拟,以及国际通行基准测试HPL和HPCG等。来自高性能计算和人工智能领域的中国科学院院士、中国工程院院士、专家学者及参赛师生代表等参加了启...……更多
文 | 周鑫雨编辑 | 邓咏仪36氪获悉,AI推理部署解决方案厂商“清昴智能”近日完成了数千万元Pre-A+轮融资,启赋资本、达晨财智领投,老股东奇绩创坛跟投。此前,清昴智能已获得某世界500强科技巨头公司的千万元战略投资。...……更多
OpenAI机器人亮相,大模型有了“肉身”,英伟达微软都有投资
...学习还能决策可以看到,Figure 01不管是在理解能力,还是推理反应都非常强大。团队特别强调,所有这些行为都没有经过远程操作,而是通过机器人自主学习。并且整段视频没有任何加速,也没有任何剪辑,全部一镜到底拍摄。...……更多
智能体首达Kaggle Grandmaster,华为结构化推理补齐思维链短板
...中的表现,研究者们提出了各种提示策略来提升大模型的推理和规划能力,比如思维链、思维树和思维图谱。这些进步与工具集成一起,推动着通用 AI 智能体的发展,让它们现在已经能够用 LLM 输出的决策策略来解决序列决策问...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...Mamba模型,并且设计了新的推测解码算法,加速了模型的推理。先来看一张其乐融融的图片(一眼AI):右边的小羊驼代表Llama,而左边的蛇(Mamba)也是我们的老熟人了。至于到底能不能其乐融融,咱就不管了,之所以有此场景...……更多
微软开源爆火1bit大模型推理框架!千亿参数模型量化后单CPU可跑
微软开源1bit大模型推理框架!现在1000亿参数大模型量化后单CPU可跑,速度可达每秒5-7个token。就是今年爆火论文The Era of 1-bit LLMs的官方代码实现,开源不到一周GitHub已揽获7.9k Star。传统大模型参数以16位浮点数(如FP16或BF16)形...……更多
...算效率和算力开销两大问题成为新的行业焦点。对大模型推理成本的优化,可通过很多技术手段实现。首先是模型本身,模型结构、训练方法都可以持续改进,包括业界很关注的MoE(混合专家模型),就是优化推理成本很好的解决...……更多
黄仁勋对话Transformer七子:我们被困在原始模型里,还需要更强大的新架构
...其不断交互才能变得聪明,待在实验室里并不会造福世界推理是下一个重要的进步节点,能提升数据训练效率,产生更有价值的结果对话实录部分要点整理Transformer因何横空出世?Illia Polosukhin:如果要做出能真正读取搜索结果的...……更多
自动化、可复现,基于大语言模型群体智能的多维评估基准
...上万的大规模语言模型(LLM),这些模型的各项能力(如推理和生成)也越来越强。因此,在多样的应用场景中对其进行性能基准测试已成为了一项重大挑战。目前最受欢迎的基准测试是 Chatbot Arena,它通过收集用户对模型输出...……更多
智启新元年:PC成为AI落地首选终端
...了具备高性能计算能力的通用加速芯片,是大模型训练、推理的主要算力来源;云计算的发展和普及,则使软硬件充分解耦,大模型开发者可以以相对低的成本调用大规模的算力、存储和网络资源,开发进程大大加快;同时,Tra...……更多
黄仁勋:我从不在乎市场份额、英伟达唯一目标是创造新市场
...英伟达,老黄还讨论了AGI的智能扩展、机器学习的加速、推理与训练的重要性……虽然时长感人(近1个半小时),但一大波网友已经看完并交起了作业(开始卷了是吧!)网友:学起来!学起来! 黄仁勋:未来推理的增长将远...……更多
语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了
...到,人类大脑生成和解析语言的神经网络并不负责形式化推理,而且提出推理并不需要语言作为媒介。这篇论文声称「语言主要是用于交流的工具,而不是思考的工具,对于任何经过测试的思维形式都不是必需的」,引发了科技...……更多
Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏
...。Intel还采用KV Caching、PagedAttention机制和张量并行,提高推理效率。Intel的硬件也可利用软件框架和工具包进行加速,并获得出色的大模型推理性能,包括PyTorch以及Intel PyTorch扩展包、OpenVINO工具包、DeepSpeed、Hugging F……更多
大模型价格战“卷”向何方?|深度
...千亿参数MoE架构模型。MoE架构中基于多个专家并行机制,推理时只激活部分专家,以稀疏性压缩了参数数量和推理成本。“这就可以极大地节省算力耗费”。而率先掀起价格战的幻方DeepSeek-V2,就是其通过架构创新,实现了大模...……更多
苹果发布 OpenELM,基于开源训练和推理框架的高效语言模型
...,苹果在 Hugging Face 平台上发布了一个“具有开源训练和推理框架的高效语言模型”,名为 OpenELM。当然,这是一项开源语言模型,其源码及预训练的模型权重和训练配方可在苹果 Github 库中获取。IT之家将官方简介翻译如下:参...……更多
收入占比40%、电话会议点名16次,英伟达:推理端的需求被低估了
...让人印象深刻的是,英伟达在财报电话会议的一个观点:推理端的爆发,可能很多人还是低估了。据英伟达电话会议披露,公司全年数据中心里已经有40%的收入来自推理业务,超出了绝大部分人预期。而在这次财报电话会议里,...……更多
16家头部大模型公司上海神秘碰头,现场人挤人人人
...最为关键的三大层面,即:算力层:用于基础模型训练和推理的基础设施 模型层:使用基础模型加速生成式AI应用构建 应用层:开箱即用的生成式AI应用至于能力如何,我们直接来看下最为直观的效果。在生成式AI应用方面,...……更多
​OpenAI推出“全能模型”GPT-4o,支持语音、视频、文字实时交互
...。在对话过程中,模型会出现一些短暂的停顿,这是它在推理下一步该说什么,但这并不令人意外。OpenAI 展示了一场节奏非常自然的人类与人工智能的对话。(来源:OPENAI)该模型还可以实时推理视觉问题。佐夫用手机拍摄了...……更多
又慢又贵?OpenAI推理模型“草莓”来了,GPT-5还有多远
...9月12日,人工智能(AI)巨头OpenAI发布代号“草莓”的AI推理模型OpenAI o1系列,包括OpenAI o1-preview以及小版本的o1-mini。据OpenAI介绍, o1会花更多时间思考问题,然后再做出反应,就像人一样。通过训练学会了完善自己的思考过程...……更多
清华开源混合精度推理系统MixQ:大模型近无损量化并提升推理吞吐
一键部署LLM混合精度推理,端到端吞吐比AWQ最大提升6倍!清华大学计算机系PACMAN实验室发布开源混合精度推理系统——MixQ。MixQ支持8比特和4比特混合精度推理,可实现近无损的量化部署并提升推理的吞吐。△图1 MixQ吞吐与已有...……更多
算子开发到推理加速,一位00后开发者的“升级打怪”之旅
...框架降低了大模型训练的门槛,目前正在做大模型分布式推理加速,希望可以帮助其他开发者在生产环境中高效部署在线推理服务。在昇腾AI的生态里,像郑辉这样为大模型浪潮默默贡献自己力量的开发者不胜枚举。他们还不是...……更多
更多关于科技的资讯:
3月11日,中国协作机器人第一股越疆科技(2432.HK)发布了全球首款“灵巧操作+直膝行走”具身智能人形机器人。越疆科技称
2025-03-11 19:01:00
华为新专利可实现电动车自动掉头,漂移掉头或变得易如反掌
天眼查知识产权信息显示,近日,华为数字能源技术有限公司申请的“一种电动车辆自动掉头的控制方法、控制器以及电动车辆”专利公布
2025-03-11 19:06:00
陵城农商银行“一站式”办理,减少个体户融资流程
德州市陵城区滋镇惠农农资店里,店主刘鹏正忙着给村里的种植户配货。他的店铺主要销售化肥、种子、农药等农业生产资料,每到春耕和秋收时节
2025-03-11 20:13:00
云生AI 提质增效  2025AI赋能招聘与人效提升分享会成都站圆满落幕
3月6日,“云生AI提质增效”2025AI赋能招聘与人效提升分享会正式开启全国巡回分享的大幕,首站在四川成都成功举办。数百位企业代表来宾亲临现场学习交流
2025-03-11 20:17:00
世俱杯奖杯首度亮相中国,海信携手FIFA点亮山城
科技之光与足球荣耀在山城重庆璀璨相遇。3月10日,2025世俱杯奖杯震撼亮相海信重庆解放碑快闪店。作为2025海信XFIFA世俱杯奖杯中国行的重要环节
2025-03-11 20:17:00
王腾把小米15 Ultra拆了 指出美中不足的一点
快科技3月11日消息,今晚REDMI品牌总经理王腾晒视频称,自己把友商的小米15 Ultra拆了,看看有啥优秀的影像能力和算法能继承到REDMI
2025-03-11 22:19:00
小米回应SU7 Ultra充电达不到标称的快充速度:使用第三方充电桩有影响
快科技3月11日消息,小米汽车今日晚间发布了答网友问(第122集)。有网友询问,为什么我的小米SU7 Ultra充电达不到标称的快充速度
2025-03-11 22:19:00
最前线|亿咖通科技2024年第四季度当季盈利
亿咖通科技(来源:企业官方)亿咖通科技(纳斯达克股票代码:ECX)于3月11日发布了2024年第四季度及全年业绩报告,宣布实现全面盈利
2025-03-11 22:25:00
“穷游”当道,文旅市场如何接招?聊城大学传媒技术学院专题调研给出答案曾经被视为小众旅行方式的“穷游”,如今已成为席卷文旅市场的文化现象
2025-03-11 22:34:00
禾赛科技盘中股价暴涨超41% 消息称禾赛激光雷达拿下奔驰大单
快科技3月11日消息,今日晚间,美股禾赛科技开盘后股价一路暴涨,截止当前发稿,股价已上涨超41.79%。消息面上,禾赛科技在今日公布的2024年Q4财报中透露
2025-03-11 22:49:00
又一时速350公里高铁有新进展:厦门至广州仅需2.5小时
快科技3月11日消息,中国铁路宣布,漳汕高铁(漳州至汕头)漳江湾跨海特大桥日前迎来了重要的工程节点——海上首个桩基顺利开钻
2025-03-11 22:49:00
神仙姐姐有望代言智界!余承东辟谣网传与刘亦菲恋情:我都没见过她
快科技3月11日消息,不知道从何时起,网上传出了余承东与刘亦菲相恋的消息,这确实让不少网友惊掉下巴。据国内媒体报道称,针对近日网传与刘亦菲恋情
2025-03-11 20:19:00
支付宝严厉打击“0元享、免费租”套路:用户可以主动退
快科技3月11日消息,支付宝开放平台发布公告,通报了对于违规使用“芝麻先享”、“商家扣款”等API接口的治理情况,严厉打击“0元享
2025-03-11 20:19:00
《王者荣耀》全新限时玩法上线:魏蜀吴等八大势力
快科技3月11日消息,《王者荣耀》宣布五五限时玩法【势力对决】现已上线体验服。当五排队伍选择的英雄均属于同一势力时,激活对应的势力技能
2025-03-11 20:19:00
以“精工匠信“重塑品质高度:海信中央空调定义舒适生活新标准
在中央空调行业,产品性能与安装服务始终是用户体验的双重基石。海信中央空调基于对消费痛点的深刻洞察,以“精工匠信”为核心理念
2025-03-11 20:22:00