• 我的订阅
  • 头条热搜
李彦宏:大模型场景下开源是最贵的,多模态是通往AGI的必经之路
...是尽可能为大家提供所需的开发工具,这包括了1个基础模型系列和三大AI开发工具,“今天的中国,有10亿互联网用户,有强大的基础大模型,有足够多的AI应用场景,有全球最完备的产业体系,国家也在大力鼓励和支持‘人工...……更多
本文转自:经济参考报“随着AI从1.0进入2.0大模型技术阶段,我们迎来了有史以来最重要的科技革命和平台革命。”零一万物CEO、创新工场董事长李开复日前在接受记者采访时表示,算力作为AI 2.0发展的关键环节,需要采用更务...……更多
“技术故障”背刺巴菲特,金融大模型到底靠不靠谱?
...忧——传统软件问题尚能引发如此大的问题,那么站在大模型时代当下,AI+金融,是否又能做到准确可信?正所谓实践是检验真理唯一标准,要回答的这个问题,我们不妨了解一下已经在金融领域“上岗”了的AI大模型。大模型...……更多
本文转自:人民日报客户端沈文敏如今,AI大模型可以带来智能生活新体验。近日,智谱AI发布认知智能大模型,其新一代基座大模型GLM-4性能大幅提升,逼近GPT-4,展现了业界领先的多模态大语言模型能力。据介绍,通过智谱大...……更多
...景确实高度碎片化,但是这个并不是行业还未重复利用大模型的真正原因,根本原因是,相对于医疗和教育来说,制造业核心工艺公开数据相对较少,所以很难预训练大模型。顾凡称,大模型领域最重要的是找准核心业务应用场...……更多
...我们有信心用技术手段降低成本,市场也需要更低价的大模型。”5月15日,字节跳动豆包大模型在火山引擎原动力大会上正式发布。火山引擎总裁谭待在接受媒体采访时,谈到了大模型的定价策略。豆包大模型的超低价格引发行...……更多
Llama3.1根本卖不动!业内人士:开源模型成本反而更高
Meta的开源大模型Llama 3在市场上遇冷,进一步加剧了大模型开源与闭源之争的关注热度。据外媒The Information报道,Meta的开源大模型Llama 3一直难以在全球最大云厂商——亚马逊的AWS上获得关注,AWS的企业客户更倾向于使用Anthropic...……更多
搞医学影像,为什么都青睐于CPU?
...特尔® 至强® 可扩展处理器上,测试了不同参数规模的AI模型在同步和异步模式下的推理表现。测试数据显示,对于参数量为31,185,568的较大模型,在BF16精度和异步模式下,第五代英特尔® 至强® 铂金8592+处理器相比第二代英特尔...……更多
零一万物Yi-1.5来了,国产开源大模型排行榜再次刷新
...机器之心编辑部在 OpenAI 发布会的前一天,来自中国的大模型公司零一万物,让开源大模型社区活跃了起来:Yi 大模型家族新成员「Yi-1.5」模型正式开源。在项目主页可以看到,Yi-1.5 包括一系列预训练和微调模型,分为 6B、9B、3...……更多
阿里云CTO周靖人:全面投入升级AI大基建
...准,全面升级从服务器到计算、存储、网络、数据处理、模型训练和推理平台的技术架构体系,让数据中心成为一台超级计算机,为每个AI和应用提供高性能、高效的算力服务。大会现场,通义大模型迎来了年度重磅发布,基础...……更多
本文转自:劳动报大模型“价格战”重塑行业生态应用市场定价或受影响■劳动报记者 陈宁近期,一场由互联网巨头引领的大模型“价格战”在业内引发轩然大波。记者注意到,其连锁效应已逐渐渗透至应用市场,对用户使用...……更多
硅谷大模型“价格战”上演,一味“卷”价格会有未来吗?
5月以来,国内大模型打响了“价格战”。从每百万个Token只要1块钱,到只要8毛钱、5毛钱……国内大厂如字节跳动、百度、智谱AI、科大讯飞等不断接力,有厂商甚至直接打出了“免费”的口号,震惊整个科技圈子。实际上,硅...……更多
大模型推理乘上RISC-V快车?国内AI芯片创企推大模型系列一体机
...算力需求大爆发的转折之年,如今随着国内两批超20个大模型获得审批、种类多样的大模型相关应用显现,企业对私有化部署的需求也水涨船高。面向这一行业趋势,2023年世界互联网大会乌镇峰会上,国内云端RISC-V大芯片创企希...……更多
腾讯云升级 AI 全家桶,混元对标 GPT-4o
...腾讯云这次也公布了一系列进展。首先是发布了新一代大模型「混元 Turbo」,相较前代,混元 Turbo 性能大幅提升:训练效率提高 108%,推理效率提升 100%,推理成本降低 50%,目前,混元 Turbo 已在腾讯云上线,提供多个版本供企...……更多
大模型为何纷纷降价
本文转自:科技日报从以分计价到以厘计价大模型为何纷纷降价观众正在了解大模型相关产品。 郭海鹏/视觉中国【AI世界】◎本报记者 吴叶凡 崔 爽近日,各大电商平台开启了年中购物促销活动。但令人们始料未及的是,许多...……更多
百川智能发布baichuan3稳定语言模型
1月29日,百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中,Baichuan3都展现了出色的能力,尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
... checkpoint、训练日志和训练数据都已经开源。尽管大语言模型 (LM) 在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的,因为它们的构建...……更多
豆包大模型公布价格清单 支持国内最高并发标准
...网讯(记者 姬文艳) 近期,火山引擎官网更新了豆包大模型的定价详情,全面展示豆包通用模型不同版本、不同规格的价格信息。在模型推理定价大幅低于行业价格的基础上,豆包通用模型的 TPM(每分钟Tokens)、RPM(每分钟请...……更多
谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
...著的能力跟进,可见其技术发展与创新的潜力。除了Gemini模型外,Gemma这一系列轻量级的SOTA开放模型似乎与我们距离更近。它基于Gemini模型相同的研究和技术构建,旨在让每个人都拥有构建AI的工具。谷歌持续扩展Gemma家族,包...……更多
对话云天励飞董事长陈宁:2030年人类将实现AGI,推理芯片将是蓝海市场|钛媒体AGI
...向合作伙伴开放“云天天书-2.0-68B”(680亿参数)行业大模型方案,从而把大模型应用成本降到千元级别。云天励飞表示,“深目”AI 模盒具备算法边缘侧在线学习能力,能够做到“3个90%”——覆盖场景超过90%、算法精度超过90%...……更多
商汤生成式AI业务飙涨256%,成为中国大模型、智算服务市场占有率领头羊
...动做收缩调整。商汤在财报中指出,受惠于中国市场对大模型和智算服务的强劲需求、“日日新SenseNova”大模型能力的飞跃式提升以及推理成本的快速下降,带动模型调用量增长迅速。报告期内,“绝影”智能汽车业务的表现也...……更多
GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型?
【新智元导读】是时候用CPU通用服务器跑千亿参数大模型了!马斯克19天建成由10万块H100串联的世界最大超算,已全力投入Grok 3的训练中。与此同时,外媒爆料称,OpenAI和微软联手打造的下一个超算集群,将由10万块GB200组成。...……更多
中国最大开源MoE模型,255B参数无条件免费商用,元象发布
元象XVERSE发布中国最大MoE开源模型:XVERSE-MoE-A36B,该模型总参数255B,激活参数36B,达到100B模型性能的「跨级」跃升。同时训练时间减少30%,推理性能提升100%,使每token成本大幅下降。在多个权威评测中,元象MoE效果大幅超越多...……更多
Meta版慢思考来了!田渊栋团队整合快慢思考,能走迷宫推箱子
...升还成本更低。能解决迷宫、推箱子等复杂问题。通过让模型在推理轨迹和最终答案上进行训练,再基于特定策略丢掉部分轨迹,Dualformer模型可以在模仿慢思考的同时,像快思考一样走捷径。由此能形成更简洁的思维链(CoT)...……更多
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
2.4B 的 Memory3比更大的 LLM 和 RAG 模型获得了更好的性能。近年来,大型语言模型 (LLM) 因其非凡的性能而获得了前所未有的关注。然而, LLM 的训练和推理成本高昂,人们一直在尝试通过各种优化方法来降低成本。本文来自上海算...……更多
科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力
近日,上海算法创新研究院大模型团队的研究员李志宇和同事提出一种情景学习新范式:SLEICL(基于强模型增强的情景学习,Strong LLM Enhanced ICL),能更好地加速小模型的学术研究和产业落地。借助这一方法可以大幅提升小模型...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...开的彻彻底底。这不,Meta一连放出三篇技术文章,从大模型适配方法出发,介绍了:如何使用特定领域数据微调LLM,如何确定微调适配自己的用例,以及如何管理良好训练数据集的经验法则。接下来,直接进入正题。适配大模...……更多
pytorchtorchao正式发布,提供了一系列优化工具集
...下架构优化库torchao现已正式发布,该优化库主要专注于模型的量化和稀疏性优化,能够在保证性能的同时降低模型的计算成本和RAM用量,从而提升模型运行效率,IT之家附GitHub页面地址(点此访问)。据介绍,torchao提供了一系...……更多
百川智能、阿里云等进入开源大模型领域,开启商业化前奏
闭源商业化的“百模大战”暂告段落,开源大模型仍旧热闹。今年7月Meta推出开源且免费的大型语言模型LLama2后,基于该模型微调的大模型不断涌现。此外,阿联酋阿布扎比技术创新研究所推出大参数模型Falcon180B,国内8、9月份...……更多
阿里云通义千问主力模型价格直降97%,大模型商业化拐点已至
5月21日,阿里云抛出重磅炸弹:通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%。这意味着,1块钱可以买200万tokens,相当于5本《新华字典》的文字量。这款模型最高支持1千万tokens长文本...……更多
更多关于社会的资讯:
近期,一种被称为“剩菜盲盒”的消费方式在都市生活中悄然兴起。傍晚的酒店自助餐厅里、深夜的甜品店柜台前,十几元的餐盒成了不少人的新选择
2025-11-21 17:06:00
广州茶博会“创见20周年 ”纪念茶会:岁月芳华 生生不息
2006年,经国家商务部批准,创办了中国(广州)国际茶业博览会,由中国茶叶流通协会、广东省茶业行业协会、广州益武国际展览有限公司共同主办
2025-11-21 17:11:00
广西桂平通报:5人经抢救无效死亡
华商网讯 11月21日,广西桂平市公安局发布警情通报,全文如下:2025年11月20日,省道S206线桂平市社步镇宁江村路段发生一起道路交通事故
2025-11-21 17:13:00
元氏县第四届中小学生篮球联赛圆满落幕
河北新闻网讯(闫婷婷)11月20日,为期4天的2025年元氏县第四届中小学生篮球联赛圆满落幕。图为比赛现场。图为比赛现场
2025-11-21 17:17:00
河北新闻网讯(刘世伟)近日,赞皇县劳动人事争议人民调解委员会通过不懈努力,成功化解一起因员工家庭变故请假引发的劳动争议
2025-11-21 17:18:00
鲁网11月21日讯对孩子来说,“钱”是超市里的棒棒糖、玩具架上的小汽车;对家长而言,如何帮孩子建立正确的金钱观,是成长中重要的一课
2025-11-21 17:29:00
罕见肺癌治疗新突破: 联合新疗法让六旬老人重燃希望
近日,山东第一医科大学附属肿瘤医院呼吸内科一病区主任王海永团队接诊一例SMARCA4 缺失型非小细胞肺癌患者。67岁的苗先生因持续咳嗽于当地检查后发现右肺下叶5
2025-11-21 17:29:00
山东第一医科大学附属肿瘤医院成功实施超显微外科技术之淋巴管-静脉吻合(LVA)
近日,山东第一医科大学附属肿瘤医院子宫肿瘤二病区成功为一名宫颈癌术后下肢淋巴水肿患者实施了超显微淋巴管-静脉吻合术,这标志着山东第一医科大学附属肿瘤医院在淋巴水肿治疗领域取得了重大突破
2025-11-21 17:29:00
隔离栏无警示“藏身”暗处 车主经历“惊魂一刻” 合肥长江西路肥西段这一隐患点待消除
大皖新闻讯 11月20日,合肥一位车主在社交平台发布了一段行车记录视频,记录下夜间驾车途中遭遇的惊险一幕。该车主当晚从六安返回合肥
2025-11-21 17:35:00
东南网11月21日讯 近日,三明尤溪疾控发布一起某诊所违规医保报销案件。案件介绍尤溪某诊所未按照《医疗质量安全核心制度要点》的要求制定
2025-11-21 17:40:00
益海嘉里金龙鱼公共事务部执行总监姜元荣:传承食养文化,助力健康中国战略|2025,我说中国式现代化(12)
【编者按】习近平总书记在二十大报告中擘画了“以中国式现代化全面推进中华民族伟大复兴”的宏伟蓝图。实现中国式现代化,是中华儿女的共同心愿
2025-11-21 17:44:00
紧急处置!G320国道货车事故两小时快速抢通
11月18日上午10时许,上饶市广信公路中心巡路人员在日常路面巡查中发现,G320国道K590+600路段发生一起货车单方碰撞波形护栏事故
2025-11-21 17:48:00
蚌埠一小区水费“激增”引质疑 水务公司回应:水表远传系统出现故障,已修复
大皖新闻讯 近日,蚌埠市龙子湖区湖山樾小区多位住户集中反映,近期自来水费激增。在记者采访时,当地中环水务回应称,水表远传系统故障导致数据抄录出现偏差
2025-11-21 18:11:00
河北省第六届乐亭大鼓书会暨第五届“京津冀”优秀鼓曲展演正式开锣
图为乐亭大鼓《貂蝉进帐》表演。金张宇摄河北新闻网讯(高永泽)11月20日下午,由河北省曲艺家协会、唐山市文旅局、滦南县人民政府主办
2025-11-21 18:50:00