• 我的订阅
  • 头条热搜
林达华谈大模型发展之路:未来会有更高效的模型结构出现
...模型的上下文长度快速增长,超长上下文解锁新应用,但推理计算代价高昂,上下文本身对于信息不会进行压缩,不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年,人工智能领域风起云涌...……更多
摩尔线程GPU适配超图软件大模型:打造国产地理空间AI
...型系列产品,经双方严格测试,顺利完成产品兼容认证。适配调优后的软件在摩尔线程GPU上整体运行稳定,性能卓越,为用户提供更为安全、稳定、可靠的保障。超图软件成立于1997年,是聚焦地理信息软件、空间智能领域的基...……更多
芯片战场丨瞄准大模型 摩尔线程首个千卡智算中心落地
...体化的GPU智算系统整合能力的考验,GPU分布式计算系统的适配、算力集群的管理和高效推理引擎的应用等,都是提高算力中心可用性的重要因素。而国产智算中心的发展,更是依托于将各方需求和优势充分融合,产业聚力才能实...……更多
摆脱Transformer依赖?这家AI初创公司推出国内首个非Attention机制大模型
...能效果——记忆能力提升3倍、速度提升7倍的同时,实现推理吞吐量的5倍提升。 至于为何另辟蹊径,寻求非Transformer的大模型路径,岩芯数智CEO刘凡平指出,以大规模著称的Transformer,在实际应用中的高算力和高成本,让不少中...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...彻彻底底。这不,Meta一连放出三篇技术文章,从大模型适配方法出发,介绍了:如何使用特定领域数据微调LLM,如何确定微调适配自己的用例,以及如何管理良好训练数据集的经验法则。接下来,直接进入正题。适配大模型预...……更多
字节跳动豆包大模型发布,火山引擎全栈AI服务助力企业智能化转型
...系列可精调,具备更强的理解、生成、逻辑等综合能力,适配问答、总结、创作、分类等丰富场景;豆包通用模型lite:字节跳动自研LLM模型轻量版,对比专业版提供更低token 成本、更低延迟,为企业提供灵活经济的模型选择;...……更多
工业互联智能创新中心在两江协同创新区成立
...入式数据采集器支持多种主流工业协议及数据模型的智能适配,能提供统一设备监控平台以及边端智能数据采集器,可大幅降低数据采集和分析的开发成本和维护成本。目前,该系统已在某汽车主机厂应用,使物流设备异常率降...……更多
国产大模型第一梯队玩家,为什么pick了CPU?
...占绝对大头的因素——算力。 现在提及大模型的训练和推理,很多人的第一反应或许就是想到了GPU。诚然GPU在高性能上占据着一定的优势,但它所存在“硬伤”也是比较明显,那便是供应不足、价格昂贵。何以破局?国产大模...……更多
百川智能发布baichuan3稳定语言模型
...处理和代码生成领域的强大实力。不仅如此,其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4,是中文医疗任务表现最佳的大模型。Baichuan3还突破“迭代式强化学习”技术...……更多
《永劫无间》手游首次将具有18亿参数的大语言模型引入终端侧
...别准确率提升20%。智谱高通与智谱合作,为骁龙8至尊版适配优化 GLM-4V端侧视觉大模型,支持丰富的多模态交互方式。GLM-4V端侧视觉大模型能够实现令人惊叹的处理能力,以超过 70tokens/秒的速度在终端侧高速运行。此外通过与骁...……更多
大模型到了该「验收」的时候
...的大模型合作中,双方能够只基于少量提示样本就完成了适配业务场景的风控模型定制,相比于传统的建模方式,模型KS性能提升超过20%,跨场景泛化性测试性能提升了高达53%。此外,还有研发提效、办公协同等等场景,不一而...……更多
联想王传东:AI PC重塑产业生态 新应用崛起
...施方面,联想在中国已完成绝大多数GPU技术的产品布局或适配,初步形成全栈AI服务器产品矩阵,并连同先进存储、数据网络、超融合、高性能计算以及正在开发的异构算力调度平台,能够为客户提供先进智算中心解决方案,同...……更多
腾讯版“GPT-4o”来了!混元Turbo首发并上线,效率翻倍价格砍半
...片。同时,腾讯云还推动办公应用与国产软硬件生态系统适配。以腾讯会议为例,腾讯会议能够在国产基础设施之上,支持SaaS和混合云部署模式,能够有效兼顾内、外部沟通的灵活需求。基础软件之外,腾讯的系列自研应用软...……更多
阿里云通义千问主力模型价格直降97%,大模型商业化拐点已至
...大模型性能逐渐提升,AI应用创新正进入密集探索期,但推理成本过高依然是制约大模型规模化应用的关键因素。云厂商的降价策略,不仅是对当前市场的一次重大推动,更是对未来商业智能化转型的一次深远布局。阿里云智能...……更多
摩尔线程与360达成战略合作,将共同打造“360智脑大模型一体机”
...具竞争力的方案。360 大模型产品也已经与摩尔线程完成适配,基于摩尔线程夸娥(KUAE)千卡智算集群,360 集团已成功完成了 70 亿和 700 亿参数的大模型分布式训练任务。摩尔线程方面称,测试结果显示全程软硬件即插即用,集...……更多
面壁智能的端侧大模型面壁MiniCPM正式亮相
...大的底层支撑,先是算力方面,凭借全流程高效infra10倍推理加速,能够将成本降低90%;其次在算法方面,面壁模型通过高效模型训练配置实现模型能力快速形成;数据处理方面,凭借现代化数据工厂形成从数据治理到多维评测...……更多
商汤绝影在行业内率先实现了原生多模态大模型的车端部署
...扩展并支持主流车载计算硬件,兼容多种主流操作系统,适配多个车载芯片的部署平台。商汤绝影称HyperPPL 针对车载多人场景进行优化,使得车内多人并发情况下,车端多模态大模型的模型推理效率相比单人没有明显降低。据IT...……更多
阿里云挥出“三板斧”:免费也要挣到钱
...完成了通义千问大模型小尺寸版本的端侧部署,该部署可适配天玑 8300 移动平台,可实现离线状态下即时且精准的多轮人机对话问答。联发科相关负责人告诉时代周报记者,双方未来还将打造面向应用开发者和终端设备厂商的生...……更多
2024惠普商用ai战略暨aipc新品发布会在京举行
...全链路工具能力。同时,基于和惠普Z系列工作站的全栈适配,一体机可提供主流大模型的一键上架和部署推理,此外,一体机还可预装标准的大模型场景应用,用户开箱即可使用。惠普Z系列药物计算AI一体机:惠普Z系列药物计...……更多
大模型降价背后,国产大模型的竞争逻辑变了
...市场拱手让人。另一方面,随着大模型产业的快速发展,推理成本飞速下降,也成为终端降价的基础。据百度官方透露,相比一年前,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了1...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...用混合专家架构,超10TB tokens训练,覆盖大量合成数据,推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中,用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...应的数据集不仅基于公开的文本或图像数据集进行改造和适配,还通过人工收集或算法合成构造了部分更为复杂和具有挑战性的数据。图5 MultiTrust任务列表与大语言模型(LLMs)的可信评价不同,MLLM的多模态特征带来了更多样、...……更多
...研芯片DeepEdge10创新的D2D chiplet架构打造的X5000推理卡,已适配并可承载SAM CV大模型、Llama2等百亿级大模型运算,可广泛应用于AIoT边缘视频、移动机器人等场景。(小标题)已创新打造系列化芯片目前,全球边缘计算的市场价值呈...……更多
史上最快AI芯片「Sohu」,速度10倍于B200,哈佛辍学生打造
...歌、Meta、微软、OpenAI、Anthropic 等各家的模型,未来还会适配模型调整。由于 Sohu 仅能运行一种算法,因此可以删除绝大多数控制流逻辑,从而允许拥有更多数学块。也因此,Sohu 实现了 90% 以上的 FLOPS 利用率,而使用 TRT-LLM 的 G...……更多
掰开安卓手机 满屏都是三个字:大模型
...上做好准备。首先,需要先增强智能终端对不同大模型的适配能力,即使是架构算法存在差异也同样能装进手机。即使最新大模型体积超出预期,也要能确保在不影响性能的情况下,将之应用到智能终端。这里依旧以高通为例。...……更多
CITE2024,昇腾硬核实力打造极致体验,宝德斩获创新大奖
...术实力与卓越创新实力。 展会现场,融合主流大模型和适配昇腾算力打造的AI训推一体机PR410EI、昇腾智能边缘小站PI300T、鲲鹏服务器PR210KT、盘古台式机PT620W等宝德自强®系列终端产品以及丰富的解决方案轮番上阵,技术交流声...……更多
加速落地 京东云大模型已支持数百个场景
...、性能、效果三者取得一个比较好的平衡点。京东云自研推理引擎,协同大小模型,为大模型产业落地提供最佳实践,如通过利用推测解码,用小模型辅助大模型进行推理,加速大模型推理速度,降低成本。在大模型应用开发上...……更多
Infocomm China2024见闻:大家每天忙于开会,却还没吃透怎么用好AI
...久?会议硬件产品正逐渐吸纳先进的互联网技术实现功能适配和场景融合。腾讯会议的展区非常显眼,这多半还源自多家硬件生态伙伴的“遥相呼应”,MAXHUB、罗技、耳目达、poly、维海德、亿联网络等多个硬件厂商,均展示了...……更多
...终端CPU芯片,即使是发布多年的老款机器也能流畅运行,推理成本仅为国际同行的百分之一。据悉,面壁智能核心技术团队源于清华NLP实验室,是在国内较早开展大模型研究的团队之一,是2020年12月“悟道”大模型首发的主力团...……更多
摩尔线程、360达成战略合作!打造360智脑国产算力底座
...成本的平衡。不仅如此,360大模型产品还与摩尔线程完成适配,基于摩尔线程夸娥(KUAE)千卡智算集群,360集团已成功完成了70亿和700亿参数的大模型分布式训练任务。测试结果显示,全程软硬件即插即用,集群训练稳定性达到...……更多
更多关于科技的资讯:
海外媒体发稿:品牌出海的“流量密码”
出海浪潮中的品牌挑战在经济全球化的大背景下,品牌出海已然成为众多企业寻求突破与发展的重要战略选择。越来越多的中国品牌将目光投向海外
2025-03-11 23:37:00
谋划“十五五”数字化转型关键行动 广药集团与华为签署全面战略合作协议
2025年3月10日,广州医药集团有限公司(以下简称“广药集团”)与华为技术有限公司(以下简称“华为”)在华为东莞松山湖基地签署全面战略合作协议
2025-03-11 23:41:00
雷诺CEO:欧洲汽车业应向中国学习 避免彻底落后
快科技3月11日消息,据新华社报道,法国《法兰西西部报》近日发表题为《雷诺集团负责人卢卡·德·梅奥:“中国人教会了我们什么”》的文章
2025-03-11 23:49:00
经济大省挑大梁丨千方百计开拓市场 外贸企业抱团出海抢单忙
今天,韩国国际模具及相关产业展在首尔举行,黄岩十多家模具企业首次组团参展,不少企业都带来了各类汽车模具、精密电子模具等最新产品
2025-03-12 00:04:00
丰田、日产们终于想通了 开始搞国产车换壳了
在国内市场被暴揍了这么多年以后,合资的车企们好像终于想明白了。就在最近这一两个星期,咱们很熟悉的日系御三家:丰田、日产和本田纷纷在国内发布了自家的纯电动新车
2025-03-12 00:19:00
《白雪公主》真人电影新片段和海报:皇后送公主毒苹果
近日迪士尼真人电影《白雪公主》新片段,以及杜比和IMAX版等新海报发布,片段展示了白雪公主与皇后的谈话。海报则展示了皇后送白雪公主毒苹果的场景
2025-03-12 00:19:00
稚晖君和机器人 离不开自行车
2021 年 6 月,稚晖君在 B 站上发布了一条「自动驾驶自行车」的视频,一经推出迅速火爆,也让他后来成为人们口中的「华为天才少年」
2025-03-12 00:19:00
小米15 Ultra首销量翻倍!6000-8000价位第一 创历史新高
快科技3月12日消息,小米15 Ultra在3月3日正式首销,一周时间过去,有第三方机构的数据显示,该机首周销量对比前代直接翻倍
2025-03-12 00:19:00
这些平顶山就像天空之岛!是失落的世界 到处是食肉植物
在南美洲北部国家委内瑞拉雨林的深处,有一些神秘的山脉,这些山脉是完全平顶的,而周围由几乎完全垂直悬崖构成,整座山就像一块凸起的桌子一样
2025-03-12 00:19:00
中国首个商业中型可回收火箭!蓝箭航天星云一号整机试车圆满成功
快科技3月11日消息,2025年2月22日,深蓝航天自主研发的星云一号火箭配套二子级液氧煤油真空发动机“雷霆RV”进行了第二轮整机试车
2025-03-12 00:49:00
第20万台小米SU7将在本周下线 工厂订单已排到明年
有数据分析师表示,截止2025年3月9日,小米汽车已经累计交付19.1万辆汽车,预计第20万辆小米SU7将在本周下线,下周正式交付给用户
2025-03-12 00:49:00
有了“长毛猛犸鼠” 我们真的能“复活猛犸象”吗
美国生物技术公司 Colossal Biosciences 在 3 月 4 日宣布,他们创造出了一批“长毛猛犸鼠”,称这是复活猛犸象的第一步
2025-03-12 01:19:00
龙芯CPU打造纯国产税务系统:中国银联都用它!
快科技3月12日消息,龙芯中科介绍了基于龙芯CPU处理器的纯国产税务系统信创方案,既满足了信创改造需求,也实现了税务系统的智能化升级
2025-03-12 01:49:00
本文转自:人民日报海外版夜幕降临,华灯初上,城市中大大小小的台球厅开始热闹起来。明亮的灯光下,一张张台球桌整齐排列,球杆碰撞声
2025-03-12 03:49:00
本文转自:人民日报海外版厉新建 杨占东在“AI+旅游”的发展过程中,我们要更多思考如何建立人与AI良好协作的新模式,AI的“聪明才智”必不可少
2025-03-12 03:50:00