• 我的订阅
  • 头条热搜
推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型
【新智元导读】大模型热,企业落地难?就在刚刚,百川智能推出「1+3」产品矩阵,一站式解决大模型商业化难题。「系列优质通用数据+领域增强训练工具链」,仅需10分钟就能让企业自主成为模型定制增强专家,实现行业最...……更多
百川智能、阿里云等进入开源大模型领域,开启商业化前奏
...8、9月份推出的开源大模型则包括阿里云Qwen-7B、Qwen-14B,百川智能Baichuan2-7B、Baichuan2-13B等。近日,香港中文大学贾佳亚团队还联合MIT发布长文本开源大语言模型LongAIpaca,号称全球首个70B参数长文本开源大语言模型,显示开源之...……更多
百川智能发布baichuan3稳定语言模型
1月29日,百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中,Baichuan3都展现了出色的能力,尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表...……更多
李开复辟谣「掉队」传闻,零一万物推「白菜价」顶级模型
...国内的大模型创业公司「六小虎」(月之暗面、Minimax、百川智能、智谱 AI、零一万物、阶跃星辰)开始在不同的道路上做出选择。Minimax 被传年营收预计 7000 万美金,同一时间流出的信息,还包括海螺 AI 由于视频大模型的推出...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中,用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4回答趣味推理问题。4月23日,在2024商汤技术交流日上,商...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...同时开放了GPT商店。另外,商汤、面壁智能、科大讯飞、百川智能等厂商本周也更新了大模型。另外脑机接口也有了重要历史进展,马斯克的脑机接口公司Neuralink完成了公司首例人脑植入手术。据马斯克透露,患者目前恢复情况...……更多
阿里云通义千问主力模型价格直降97%,大模型商业化拐点已至
...供更丰富的模型和工具链。阿里云百炼平台上汇聚通义、百川、ChatGLM、Llama系列等上百款国内外优质模型,内置大模型定制与应用开发工具链,开发者可以便捷地测试比较不同模型,开发专属大模型,并轻松搭建RAG等应用。从选...……更多
“技术故障”背刺巴菲特,金融大模型到底靠不靠谱?
...要实时数据处理和决策支持,大模型的推理涉及到大量的矩阵乘法计算,对硬件的矩阵乘法计算能力提出较高要求,计算复杂性可能导致响应时间延迟,不利于实时应用。加之大模型训练和推理过程需要大量的计算资源和能量消...……更多
CPU,正在被AI时代抛弃?
...中两个重要阶段的需求,即在预填充阶段,需要高算力的矩阵乘法运算部件;在解码阶段,尤其是小批量请求时,需要更高的内存访问带宽。这些需求CPU都可以很好地满足。 以英特尔举例,从2017年第一代至强®可扩展处理器开...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...流日活动,发布行业首个“云、端、边”全栈大模型产品矩阵,以满足不同规模场景的应用需求,并且全新升级“日日新SenseNova5.0”大模型体系,其综合能力全面对标GPT-4Turbo,技术领跑加速生成式AI向产业落地的全面跃迁,实现...……更多
大模型价格战“卷”向何方?|深度
...国内AI圈两个“顶流”李开复与王小川的表态耐人寻味。百川智能创始人王小川认为,如果(大模型)是面向B端企业客户,那往后就是直接卖云服务的方式,中间的应用层反倒会繁荣起来,有不少新机会。不过,在王小川也看来...……更多
大模型降价背后,国产大模型的竞争逻辑变了
...众多与AI相关的创业公司也在持续涌现,业内更是出现了百川智能、月之暗面、MiniMax、智谱AI等AI四小龙。随着大厂下调API价格,包括新AI四小龙在内的创投公司,都将面临全新的考验。一方面,以BAT为首的云服务商,成为了“降...……更多
国产大模型第一梯队玩家,为什么pick了CPU?
...化,各方面都考虑到位了。硬件方面,英特尔®AMX(高级矩阵扩展)技术,正是为大模型推理重深度学习中大量的矩阵乘法运算专门优化的,可以理解成”CPU里的TensorCore”。有了英特尔®AMX,处理器每个时钟周期可完成高达2048个...……更多
...自:北京日报本报讯(记者 孙奇茹)北京人工智能企业百川智能近日发布角色大模型Baichuan-NPC,基于此推出的“角色创建平台+搜索增强知识库”,可以让游戏厂商、初创团队无需编写任何代码,仅通过简单的文字描述就能快速...……更多
百川智能完成3亿美元A1轮融资,阿里、腾讯、小米等巨头参投
...叶峰《每日经济新闻》记者获悉,10月17日,王小川旗下百川智能官宣已完成A1轮战略融资,融资金额3亿美元,阿里、腾讯、小米、深创投等科技巨头及多家顶级投资机构参投。对于百川智能的这一轮融资,有知情人士告诉每经...……更多
腾讯大模型混元Turbo:御气升昺云,梓桐金鼎开
...算力效能优秀;打造了底座+模型+工具+应用的大模型产品矩阵,为客户提供了一系列AI数字化解决方案。5T基础平台软件产品兼容国内主流芯片。一、混元Turbo之评测混元Turbo的核心技术混元Turbo的发布凝聚了腾讯团队长期以来对...……更多
GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型?
...强大计算单元中处理。对此,它需要支持向量化指令集、矩阵计算指令集,来实现大量的矩阵乘法和张量运算。 其次,是解码阶段,即在问题全部输入之后,模型开始输出结果的阶段。在这个阶段,对大模型唯一要求便是,输...……更多
ai生命周期:ai训练和ai推理的完美结合
...。比如灵活高效的AVX-512扩展指令集,可高效执行大量的矩阵和向量计算,显著提高卷积和矩阵乘法的速度,尤其是BF16数据类型可提高吞吐量,避免INT8数据的量化风险,而且还是双周期的256位流水线设计,效率和能效都更高。比...……更多
影响英伟达根本逻辑的大争论:OpenAI改变策略意味着什么?谁在撒谎?
...展不顺。据科技媒体The Information报道,OpenAI开发的下一个旗舰模型“Orion”,目前已经完成20%的训练。尽管表现已接近现有的GPT-4,但进步幅度却远不如前两代旗舰模型之间的飞跃。Orion在语言任务上表现更好,但在编码等任务上...……更多
谈大模型免费和被美双重制裁,周鸿祎“诉苦\\\
...”产品,这里的15家大模型厂商包括智谱AI、商汤科技、百川智能、火山引擎、百度智能云、腾讯、科大讯飞、华为云、MiniMAX、零一万物、面壁智能。合作后,在360安全卫士、安全浏览器、搜索、智能硬件四个重点场景下,用户...……更多
阿里云的AI路线图
...型系列就是基于阿里云人工智能平台PAI训练而成。此外,百川智能、智谱AI、零一万物、昆仑万维、vivo、复旦大学等企业及机构均在阿里云上训练大模型。人工智能馆围绕MaaS(模型即服务)理念,从人工智能开发者、模型工具...……更多
骁龙8至尊版混合架构、成本揭秘:更贵是不可避免的!
...高通也有充分的考虑,尤其是内存占用方面。比如Llama和百川的70亿参数大模型版,即使压缩到16位整数精度进行处理,也会占用13GB左右的内存,而通过高通的软件和相应的解决方案,将内存需求大幅降至约3.5GB。高通预计,未来...……更多
清华开源混合精度推理系统MixQ:大模型近无损量化并提升推理吞吐
...化为低比特可能会出现较大的精度损失。其原因在于激活矩阵中存在离群值(图4)。一个有效的方法是SmoothQuant,主要思想是通过平滑激活矩阵来降低量化激活的误差。 △图4 激活矩阵中存在离群值混合精度量化则是一类全新...……更多
围绕算力+数据,矩阵起源建设开源 AI 原生软件平台
...摸索中。 MatrixOS正式发布 为应对AI大模型时代的挑战,矩阵起源发布MatrixOS产品。MatrixOS是一个开源开放的AI-Native操作系统,链接算力、数据、知识、模型与企业应用,提供一整套端到端的AIStack服务框架。 MatrixOS秉承开放理念...……更多
天时、地利、人和,AIPC的新时代,AMD准备好了
...场,AMD邀请到了来自联想、华硕这类OEM厂商以及始智AI、百川智能、有道、游戏加加、生数等ISV参会,分享了他们对于AIPC的展望,从硬件到软件全面为AI产业赋能。联想分享了他们与AMD这20年来的合作,作为全球领先电脑品牌,...……更多
ChatGPT一周年,机会在大厂还是小公司?
...内,我们的工作方式、生活方式会有天翻地覆的变化。”百川智能创始人、CEO王小川在12月1日的2023腾讯ConTech大会中谈到。大会上,他与长江商学院教授、数字化转型中心主任孙天澍,以及复旦大学计算机学院教授、Moss系统负责...……更多
李彦宏:大模型场景下开源是最贵的,多模态是通往AGI的必经之路
...司 Mistral发布的模型)都有相当的影响力,国内的智源、百川、阿里的通义也都是开源模型,市场上不缺百度这一家开源的模型。百度要开源还得自己去维护一套开源的版本,这不划算。李彦宏的判断是,闭源才有真正的商业模...……更多
2023年AI的钱被谁赚走了?
...和互联网大厂对于AI的投入可谓大手笔:MiniMax、智谱AI、百川智能、月之暗面、零一万物等大模型初创企业已完成数轮融资,其中MiniMax估值达到25亿美元,月之暗面新一轮估值已达到30亿美元。科大讯飞(002230.SZ)、商汤(00020.HK...……更多
搞医学影像,为什么都青睐于CPU?
...看AI推理部分。东软借助处理器内置的英特尔® AMX(高级矩阵扩展)技术,让CPU也能轻松驾驭深度学习任务。英特尔® AMX针对广泛的硬件和软件进行了优化,在前代VNNI和BF16技术的基础上,进一步增强了矩阵计算能力,最大限度...……更多
英特尔第五代至强可扩展处理器发布:AI推理性能提升42%!
...先在布局设计上,相对于第四代至强的4 Tile Die设计,64核旗舰级的第五代至强采用了2 Tile Die 设计(英特尔将其称之为XCC),这样做有几个好处,即更少的模块意味着更少的数据移动,从而可以降低功耗。不过,虽然Tile的数量更...……更多
更多关于科技的资讯:
高通打赢芯片诉讼!未违反Arm许可协议
快科技12月21日消息,当地时间周五,高通公司在与芯片设计公司Arm进行的一场诉讼中取得胜利。据悉,Arm此前指控高通通过收购芯片创业公司Nuvia获得并使用了Arm的技术
2024-12-21 10:01:00
快买正版!国际唱片业:现在中国互联网每天上百万AI做的音乐都是非法盗版
快科技12月21日消息,国际唱片业协会大中华区总兼中国区首席代表郭彪公开表示,现在中国互联网上每天有上百万AI做的音乐
2024-12-21 10:01:00
女子每天凌晨2点多被隔壁鸡鸭声惊醒:一波接一波根本停不下来
12月21日消息,有过农村生活经验的朋友对公鸡打鸣肯定不陌生,这些叫声非常嘹亮,在安静的凌晨能传出非常远的距离。而且如果有多只公鸡
2024-12-21 10:31:00
于东来直播员工午休打麻将引围观:要让员工每周工作36小时、月薪8千+
快科技12月21日消息,一个企业的老板,公开直播手下员工打麻将,这是什么体验?昨天于东来个人账号开播,带网友云逛胖东来办公区域
2024-12-21 10:31:00
周鸿祎:AGI发展遇瓶颈 智能体和专业大模型将扛大旗
快科技12月21日消息,近两年AI发展迅速,但目前种种迹象表明,一些AI巨头寄予厚望的AGI(通用人工智能)之路似乎已经遭遇瓶颈
2024-12-21 10:31:00
江苏:2024世界智能制造大会在南京开幕
本文转自:人民网2024年12月20日,以“加快打造智能制造升级版,因地制宜发展新质生产力”为主题的2024世界智能制造大会在南京开幕
2024-12-21 11:10:00
大众帮办|遭美团强制调低房价,百元酒店陷“低价内卷”困局
“美团一单能给我们调低20元,现在快到年底了,调价幅度又要加大,调价助手又关不掉,后期也不给商家补偿,有时候害怕进订单
2024-12-21 11:18:00
三年破万!小鹏汽车欧洲第10000辆交付:中国新势力第一
快科技12月21日消息,小鹏汽车达成了一项新成就——首家在欧洲市场交付达成1万辆的中国造车新势力,这距离其首次向欧洲出口汽车仅3年时间
2024-12-21 11:31:00
近期关于“年轻人开始反向驯化大数据杀熟”的关键词冲上热搜,引发全网热议。大数据杀熟,这个听起来颇具科技感的词汇,实则是对消费者权益的严重侵害
2024-12-21 11:57:00
世界智能制造大会在宁举行,玄武大模型工厂携“友”参展
“智慧”的制造业,是什么模样?12月20日至22日,2024世界智能制造大会在宁举行。大会期间,依托江苏国际数据港建设的玄武大模型工厂携“友”亮相——既有灵活摇动酒杯而滴酒不洒
2024-12-21 13:44:00
花几个亿建智算中心,八成的GPU租不出去丨焦点分析
作者丨邱晓芬编辑丨苏建勋在过去两年的中国AI行业,有一项奇观:许多没有任何GPU背景、算力行业经验的上市公司,将智算中心当做他们发展第二曲线的抓手
2024-12-21 12:12:00
超算+AI,我国科研团队解锁地球20亿年生命演化“密码”
南京大学科研团队联合中外多家科研单位,研究通过建立早期地球化石大数据,揭示了地球大约从20亿年到5亿年前早期生命多样性演化历程
2024-12-21 08:57:00
社交应用收入排名超ChatGPT,“出道晚增长快”的产品如何靠短剧崛起
“当地人不太爱存钱,有了钱就消费,比较推崇享乐主义,泛娱乐产品在当地比较有市场”一位在巴西做娱乐应用的出海人讲述,在这个拥有2
2024-12-21 09:07:00
抽卡效率提升4.8倍!东北大学等开源优化版Stable-Diffusion.cpp:分辨率越高越快,生成质量更好
【新智元导读】北京大学等研究团队优化了Sdcpp框架,通过引入Winograd算法和多项策略,显著提升了图像生成速度和内存效率
2024-12-21 09:14:00
谷歌版o1突发即屠榜!思考速度比所有模型快5倍,能解摩斯代码
谷歌版o1来了!在奥特曼“双十二”倒数第二天——他们发布Gemini 2.0 Flash Thinking,顾名思义,以闪电般的速度解决复杂问题并展示其思考过程的实验模型
2024-12-21 09:15:00