• 我的订阅
  • 头条热搜
推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型
【新智元导读】大模型热,企业落地难?就在刚刚,百川智能推出「1+3」产品矩阵,一站式解决大模型商业化难题。「系列优质通用数据+领域增强训练工具链」,仅需10分钟就能让企业自主成为模型定制增强专家,实现行业最...……更多
百川智能、阿里云等进入开源大模型领域,开启商业化前奏
...8、9月份推出的开源大模型则包括阿里云Qwen-7B、Qwen-14B,百川智能Baichuan2-7B、Baichuan2-13B等。近日,香港中文大学贾佳亚团队还联合MIT发布长文本开源大语言模型LongAIpaca,号称全球首个70B参数长文本开源大语言模型,显示开源之...……更多
百川智能发布baichuan3稳定语言模型
1月29日,百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中,Baichuan3都展现了出色的能力,尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表...……更多
李开复辟谣「掉队」传闻,零一万物推「白菜价」顶级模型
...国内的大模型创业公司「六小虎」(月之暗面、Minimax、百川智能、智谱 AI、零一万物、阶跃星辰)开始在不同的道路上做出选择。Minimax 被传年营收预计 7000 万美金,同一时间流出的信息,还包括海螺 AI 由于视频大模型的推出...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中,用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4回答趣味推理问题。4月23日,在2024商汤技术交流日上,商...……更多
...于同属于国产大模型“六小虎”的MiniMax(2021年成立)、百川智能(2023年成立)、月之暗面(2023年成立)、阶跃星辰(2023年成立)和零一万物(2023年成立),智谱AI在大模型领域研究起步更早,技术积累更为深厚。也正因为如...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...同时开放了GPT商店。另外,商汤、面壁智能、科大讯飞、百川智能等厂商本周也更新了大模型。另外脑机接口也有了重要历史进展,马斯克的脑机接口公司Neuralink完成了公司首例人脑植入手术。据马斯克透露,患者目前恢复情况...……更多
阿里云通义千问主力模型价格直降97%,大模型商业化拐点已至
...供更丰富的模型和工具链。阿里云百炼平台上汇聚通义、百川、ChatGLM、Llama系列等上百款国内外优质模型,内置大模型定制与应用开发工具链,开发者可以便捷地测试比较不同模型,开发专属大模型,并轻松搭建RAG等应用。从选...……更多
“技术故障”背刺巴菲特,金融大模型到底靠不靠谱?
...要实时数据处理和决策支持,大模型的推理涉及到大量的矩阵乘法计算,对硬件的矩阵乘法计算能力提出较高要求,计算复杂性可能导致响应时间延迟,不利于实时应用。加之大模型训练和推理过程需要大量的计算资源和能量消...……更多
chatgpt低成本复现流程开源
...键。低成本微调的LoRA在微调部分,Colossal-AI支持使用低秩矩阵微调(LoRA)方法。LoRA方法认为大语言模型是过参数化的,其在微调中的参数改变量是一个低秩的矩阵,可以将其分解为两个更小的的矩阵的乘积,即在微调时,固定...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...流日活动,发布行业首个“云、端、边”全栈大模型产品矩阵,以满足不同规模场景的应用需求,并且全新升级“日日新SenseNova5.0”大模型体系,其综合能力全面对标GPT-4Turbo,技术领跑加速生成式AI向产业落地的全面跃迁,实现...……更多
CPU,正在被AI时代抛弃?
...中两个重要阶段的需求,即在预填充阶段,需要高算力的矩阵乘法运算部件;在解码阶段,尤其是小批量请求时,需要更高的内存访问带宽。这些需求CPU都可以很好地满足。 以英特尔举例,从2017年第一代至强®可扩展处理器开...……更多
大模型价格战“卷”向何方?|深度
...国内AI圈两个“顶流”李开复与王小川的表态耐人寻味。百川智能创始人王小川认为,如果(大模型)是面向B端企业客户,那往后就是直接卖云服务的方式,中间的应用层反倒会繁荣起来,有不少新机会。不过,在王小川也看来...……更多
大模型降价背后,国产大模型的竞争逻辑变了
...众多与AI相关的创业公司也在持续涌现,业内更是出现了百川智能、月之暗面、MiniMax、智谱AI等AI四小龙。随着大厂下调API价格,包括新AI四小龙在内的创投公司,都将面临全新的考验。一方面,以BAT为首的云服务商,成为了“降...……更多
chatgpt低成本复现流程来了
...键。低成本微调的LoRA在微调部分,Colossal-AI支持使用低秩矩阵微调(LoRA)方法。LoRA方法认为大语言模型是过参数化的,其在微调中的参数改变量是一个低秩的矩阵,可以将其分解为两个更小的的矩阵的乘积,即在微调时,固定...……更多
国产大模型第一梯队玩家,为什么pick了CPU?
...化,各方面都考虑到位了。硬件方面,英特尔®AMX(高级矩阵扩展)技术,正是为大模型推理重深度学习中大量的矩阵乘法运算专门优化的,可以理解成”CPU里的TensorCore”。有了英特尔®AMX,处理器每个时钟周期可完成高达2048个...……更多
...自:北京日报本报讯(记者 孙奇茹)北京人工智能企业百川智能近日发布角色大模型Baichuan-NPC,基于此推出的“角色创建平台+搜索增强知识库”,可以让游戏厂商、初创团队无需编写任何代码,仅通过简单的文字描述就能快速...……更多
百川智能完成3亿美元A1轮融资,阿里、腾讯、小米等巨头参投
...叶峰《每日经济新闻》记者获悉,10月17日,王小川旗下百川智能官宣已完成A1轮战略融资,融资金额3亿美元,阿里、腾讯、小米、深创投等科技巨头及多家顶级投资机构参投。对于百川智能的这一轮融资,有知情人士告诉每经...……更多
腾讯大模型混元Turbo:御气升昺云,梓桐金鼎开
...算力效能优秀;打造了底座+模型+工具+应用的大模型产品矩阵,为客户提供了一系列AI数字化解决方案。5T基础平台软件产品兼容国内主流芯片。一、混元Turbo之评测混元Turbo的核心技术混元Turbo的发布凝聚了腾讯团队长期以来对...……更多
搜狐医药 | 北京儿童医院发布国内首个儿科大模型,积极推进AI儿科医生应用
...附属北京儿童医院(以下简称,北京儿童医院)联合北京百川智能科技有限公司(以下简称,百川智能)、小儿方健康科技(北京)有限公司(以下简称,小儿方)正式发布国内首个儿科大模型--“福棠·百川”儿科大模型,同...……更多
影响英伟达根本逻辑的大争论:OpenAI改变策略意味着什么?谁在撒谎?
...展不顺。据科技媒体The Information报道,OpenAI开发的下一个旗舰模型“Orion”,目前已经完成20%的训练。尽管表现已接近现有的GPT-4,但进步幅度却远不如前两代旗舰模型之间的飞跃。Orion在语言任务上表现更好,但在编码等任务上...……更多
ai生命周期:ai训练和ai推理的完美结合
...。比如灵活高效的AVX-512扩展指令集,可高效执行大量的矩阵和向量计算,显著提高卷积和矩阵乘法的速度,尤其是BF16数据类型可提高吞吐量,避免INT8数据的量化风险,而且还是双周期的256位流水线设计,效率和能效都更高。比...……更多
GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型?
...强大计算单元中处理。对此,它需要支持向量化指令集、矩阵计算指令集,来实现大量的矩阵乘法和张量运算。 其次,是解码阶段,即在问题全部输入之后,模型开始输出结果的阶段。在这个阶段,对大模型唯一要求便是,输...……更多
腾讯推出新一代快思考模型混元 Turbo S,将在腾讯元宝逐步灰度上线
...你刚说完问题,它已经准备好开头了”。腾讯混元新一代旗舰大模型Turbo S发布能够实现“秒回”2月27日下午,腾讯混元自研的快思考模型Turbo S正式发布。区别于DeepSeek-R1、混元T1等需要“想一下再回复”的慢思考模型,混元Turbo ...……更多
阿里云的AI路线图
...型系列就是基于阿里云人工智能平台PAI训练而成。此外,百川智能、智谱AI、零一万物、昆仑万维、vivo、复旦大学等企业及机构均在阿里云上训练大模型。人工智能馆围绕MaaS(模型即服务)理念,从人工智能开发者、模型工具...……更多
谈大模型免费和被美双重制裁,周鸿祎“诉苦\
...”产品,这里的15家大模型厂商包括智谱AI、商汤科技、百川智能、火山引擎、百度智能云、腾讯、科大讯飞、华为云、MiniMAX、零一万物、面壁智能。合作后,在360安全卫士、安全浏览器、搜索、智能硬件四个重点场景下,用户...……更多
骁龙8至尊版混合架构、成本揭秘:更贵是不可避免的!
...高通也有充分的考虑,尤其是内存占用方面。比如Llama和百川的70亿参数大模型版,即使压缩到16位整数精度进行处理,也会占用13GB左右的内存,而通过高通的软件和相应的解决方案,将内存需求大幅降至约3.5GB。高通预计,未来...……更多
...并行能够使得batch size(批尺寸)大大增加,从而提高GPU矩阵乘法的效率,提高吞吐。batch size在深度学习中是一个非常重要的超参数,指模型在训练过程中每次使用的数据量大小。它决定了每次模型更新时使用的训练样本数量,...……更多
创新引领,桔子数科荣获“年度金融科技创新品牌”
...生态体系。桔子数科已推出自主研发的智能体开发平台“百川”,该平台聚焦AI技术与金融业务全链条的深度融合,支持多种主流大模型的集成,加速推进AI大模型在金融领域的垂直落地。当前,凭借“百川”平台的卓越性能和...……更多
清华开源混合精度推理系统MixQ:大模型近无损量化并提升推理吞吐
...化为低比特可能会出现较大的精度损失。其原因在于激活矩阵中存在离群值(图4)。一个有效的方法是SmoothQuant,主要思想是通过平滑激活矩阵来降低量化激活的误差。 △图4 激活矩阵中存在离群值混合精度量化则是一类全新...……更多
更多关于科技的资讯:
获充换电大会官方推荐及星级认证, 公牛充电桩全场景方案引关注
9月27日至29日,2025中国汽车充换电生态大会在合肥举行,此次大会由国家能源局电力司、安徽省汽车办、中国汽车工业协会共同指导
2025-10-09 17:04:00
“北京榜样•最美互联网从业者”提名人选|我爱我家陈少亮:数字浪潮中的筑梦人
2025年的北京,秋阳穿过写字楼玻璃幕墙,在键盘上投下斑驳光影。在我爱我家集团总部技术中心,陈少亮正盯着屏幕上的数据流图
2025-10-09 17:05:00
中新经纬10月9日电 工信部网站9日消息,工业和信息化部、国家标准化管理委员会近期联合发布《云计算综合标准化体系建设指南(2025版)》(下称《指南》)
2025-10-09 13:06:00
当下,网络热搜榜单已经成为我们感知世界的一个重要窗口。这个窗口展示的内容是否真实、健康、积极,直接影响着数亿网民的认知判断
2025-10-09 10:31:00
高低2025年国庆中秋双节,中国电影市场成绩亮眼:国庆档总票房破17亿元,10月2日年度总票房达425.02亿元,超2024年全年
2025-10-09 10:49:00
厦门网讯(厦门日报记者 李晓平)如今,拍照不再停留在平面,“一站式”3D人像打印,正让影像“立”起来,成为更多人的选择
2025-10-08 08:12:00
小牛FX风速款首销战报:5小时全渠道销量14252台,以“价值重构”引爆全民抢购潮
2025年9月29日,全球高端智能电动车领导品牌小牛电动正式发布FX风速款首销战报。数据显示,这款被业界称为“价格屠夫”的新品在9月28日首发后
2025-10-08 09:00:00
稳就业 稳企业 稳市场 稳预期|从 “设备制造” 到 “全链服务”:陕西电子长岭电气纺织机电产业的进阶之路
9月29日,由陕西省委宣传部举办的“稳就业、稳企业、稳市场、稳预期”主题媒体行活动,带领陕西多家主流媒体走进陕西电子陕西长岭电气有限责任公司参观考察
2025-10-08 17:51:00
近日,中国物流与采购联合会公布全国第十批5A级供应链服务企业名单,华远国际陆港集团正式通过评审,获评“5A级供应链服务企业”
2025-10-08 18:01:00
货丰价稳、活动密集、销售井喷、消费升级……在这个中秋国庆假期,我市消费市场“热”力值拉满,处处繁荣兴旺、活力十足。10月8日
2025-10-08 18:32:00
佳盛机电乘风而上,今年前8月产值同比增长超38%抢占新赛道,270多名员工假期忙“冲刺”南报网讯(通讯员单维亮记者张希)“我们是智能电网产业链条上的配套企业
2025-10-07 08:41:00
培育壮大十大千亿级产业集群丨十堰臻融:创新与技改“双轮”驱动 产值同比增长30%
十堰广电讯(全媒体记者 何旭 通讯员 胡新)科技创新是提升核心竞争力关键。十堰臻融汽车科技有限公司以智能化装备升级与专利技术研发为双引擎
2025-10-07 20:43:00
沉浸式AR科技盛宴:打造“可触摸”的科普实验室,重构科普新形态
这个国庆去哪玩?中国科学技术馆告诉你!2025年10月1日——10月7日由中国科学技术馆、北京峰火文化科技有限公司、Rokid联合打造的以“探境・AR科技智慧”为主题的AR体验活动正火热开展中
2025-10-07 09:05:00
2025年全国大学生计算机大赛总决赛落幕 西工大获奖数量质量再创新高
近日,2025年全国大学生计算机系统能力大赛各赛道总决赛圆满落幕。本届大赛吸引了来自清华大学、北京大学、复旦大学、华中科技大学
2025-10-07 11:40:00
太划算!遵义多重补贴点燃消费热情
多彩贵州网讯国庆中秋“双节”同至,遵义市推出的“悦·遵义‘双节’欢乐购”促消费活动覆盖整个长假,其中“焕新过节·乐享生活”家电家居促销活动形式丰富
2025-10-07 14:51:00