• 我的订阅
  • 头条热搜
面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线
...发布了训练数据规模近1T、参数规模仅2B的模型:聚焦于适配端侧硬件的端侧大模型MiniCPM-2B。为什么瞄准端侧场景?李大海给出的理由,仍然是旺盛的市场需求,和云端协同的部署趋势。自2023年下半年起,三星、华为、小米、特...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...制条件,提高视频内容生成的一致性和可控性; 5.算力适配通用化,在模型推理运行方面,针对重点行业客户应用,与多家国内外算力厂商的产品适配,形成了算力模型一体化产品; 6.模型进步持续化,为保障技术的持续领先...……更多
国产GPU为底座,摩尔线程首个千卡智算中心落地
...一体化大模型解决方案,积极与广泛的生态伙伴开展兼容适配及技术调优等工作,共同推动国产大模型生态的全面繁荣。在最后的圆桌对话环节,摩尔线程副总裁董龙飞与中能建绿色数字科技(中卫)有限公司董事长墙虎、智谱...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...话时表示:“商汤的云边端全栈组合,可以很好地赋能和适配小米物联网生态。我们希望与商汤共同为我们的用户打造更具智能化的产品体验。”左为小米集团小爱总经理王刚,右为商汤科技联合创始人、首席科学家王晓刚此外...……更多
跨越算力鸿沟丨星凡科技2024AI算力集群产品发布会圆满成功
...三重使能平台,帮助大模型开发者解决国产芯片性能低、适配难,开发成本高、难度大等一揽子问题。1.神机AIOS致力于打造国内首个算力中心运营全场景AGI,通过Agent自然语言交互智能帮助开发者极简极低打造行业大模型,减少...……更多
PC迎来AI时刻,英特尔、微软、联想等纷纷布局,产品价格将迎上涨
...一代的8倍,可在PC上实现高能效的AI加速和本地推理,并适配超过10款国产大模型。英特尔的老对手AMD则抢先一步,上周发布Ryzen 8040系列处理器。该处理器集成了升级的专用AI引擎NPU,算力为16TOPS,AI性能相比上一代提升60%,支持...……更多
百川智能、阿里云等进入开源大模型领域,开启商业化前奏
...用于自身业务优化并对外开放合作。 大模型分为训练和推理两个过程,前者将大模型训练成型,后者即为应用。由于训练大模型需极大算力,开发成本高昂,业界多有关于不需“重复造轮”的讨论。例如,入场做大模型后,百...……更多
联想王传东:2027年AI PC将成为市场主流
...下也能使用;第三,更低的大模型使用成本,以本地免费推理为主、以云端公共推理为辅,一次性购买AIPC即可享受全生命周期的本地免费推理服务;第四,可信、安全的个人数据和隐私保障,个性化本地知识库、隐私数据的本...……更多
突破遥感基础模型关键技术!我国科研人员研发出遥感智能训推一体机
...多个边缘场景低成本灵活部署。在自主创新方面,一体机适配了昇腾AI环境与昇思MindSpore框架,实现了软硬一体的自主创新。“空天·灵犀”遥感智能训推一体机搭载的高精度、高时效轻量化基础模型,能够在自然资源、交通住...……更多
空天信息+人工智能 中国科研团队成功研发遥感智能训推一体机
...。在自主创新方面,“空天·灵犀”遥感智能训推一体机适配昇腾人工智能环境与昇思人工智能计算框架(MindSpore),实现软硬一体。中国科学院空天院赛博智能团队透露,未来,基于昇腾人工智能的“空天·灵犀”遥感智能训推一...……更多
对话云天励飞董事长陈宁:2030年人类将实现AGI,推理芯片将是蓝海市场|钛媒体AGI
...芯片DeepEdge10 Max创新的D2D chiplet架构打造的X5000推理卡,已适配并可承载10亿级SAM、百亿级Llama2等大模型运算,可广泛应用于AIoT边缘视频、移动机器人等场景。据介绍,“深目”AI模盒内置的自研多模态大模型“云天天书”,包含...……更多
“整活”保险业务,AI大模型哪家强?
...,保险业也不例外。号称神通广大的AI大模型能否完美“适配”保险行业?10月10日发布的《人工智能大模型保险行业应用评测报告》(以下简称《报告》)便揭晓了答案。根据《报告》,10个主流大模型在知识问答领域表现普遍...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
...模型的上下文长度快速增长,超长上下文解锁新应用,但推理计算代价高昂,上下文本身对于信息不会进行压缩,不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年,人工智能领域风起云涌...……更多
芯片战场丨瞄准大模型 摩尔线程首个千卡智算中心落地
...体化的GPU智算系统整合能力的考验,GPU分布式计算系统的适配、算力集群的管理和高效推理引擎的应用等,都是提高算力中心可用性的重要因素。而国产智算中心的发展,更是依托于将各方需求和优势充分融合,产业聚力才能实...……更多
摆脱Transformer依赖?这家AI初创公司推出国内首个非Attention机制大模型
...能效果——记忆能力提升3倍、速度提升7倍的同时,实现推理吞吐量的5倍提升。 至于为何另辟蹊径,寻求非Transformer的大模型路径,岩芯数智CEO刘凡平指出,以大规模著称的Transformer,在实际应用中的高算力和高成本,让不少中...……更多
工业互联智能创新中心在两江协同创新区成立
...入式数据采集器支持多种主流工业协议及数据模型的智能适配,能提供统一设备监控平台以及边端智能数据采集器,可大幅降低数据采集和分析的开发成本和维护成本。目前,该系统已在某汽车主机厂应用,使物流设备异常率降...……更多
百川智能发布baichuan3稳定语言模型
...处理和代码生成领域的强大实力。不仅如此,其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4,是中文医疗任务表现最佳的大模型。Baichuan3还突破“迭代式强化学习”技术...……更多
联想王传东:AI PC重塑产业生态 新应用崛起
...施方面,联想在中国已完成绝大多数GPU技术的产品布局或适配,初步形成全栈AI服务器产品矩阵,并连同先进存储、数据网络、超融合、高性能计算以及正在开发的异构算力调度平台,能够为客户提供先进智算中心解决方案,同...……更多
面壁智能的端侧大模型面壁MiniCPM正式亮相
...大的底层支撑,先是算力方面,凭借全流程高效infra10倍推理加速,能够将成本降低90%;其次在算法方面,面壁模型通过高效模型训练配置实现模型能力快速形成;数据处理方面,凭借现代化数据工厂形成从数据治理到多维评测...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...用混合专家架构,超10TB tokens训练,覆盖大量合成数据,推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中,用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4...……更多
...研芯片DeepEdge10创新的D2D chiplet架构打造的X5000推理卡,已适配并可承载SAM CV大模型、Llama2等百亿级大模型运算,可广泛应用于AIoT边缘视频、移动机器人等场景。(小标题)已创新打造系列化芯片目前,全球边缘计算的市场价值呈...……更多
掰开安卓手机 满屏都是三个字:大模型
...上做好准备。首先,需要先增强智能终端对不同大模型的适配能力,即使是架构算法存在差异也同样能装进手机。即使最新大模型体积超出预期,也要能确保在不影响性能的情况下,将之应用到智能终端。这里依旧以高通为例。...……更多
CITE2024,昇腾硬核实力打造极致体验,宝德斩获创新大奖
...术实力与卓越创新实力。 展会现场,融合主流大模型和适配昇腾算力打造的AI训推一体机PR410EI、昇腾智能边缘小站PI300T、鲲鹏服务器PR210KT、盘古台式机PT620W等宝德自强®系列终端产品以及丰富的解决方案轮番上阵,技术交流声...……更多
Infocomm China2024见闻:大家每天忙于开会,却还没吃透怎么用好AI
...久?会议硬件产品正逐渐吸纳先进的互联网技术实现功能适配和场景融合。腾讯会议的展区非常显眼,这多半还源自多家硬件生态伙伴的“遥相呼应”,MAXHUB、罗技、耳目达、poly、维海德、亿联网络等多个硬件厂商,均展示了...……更多
李彦宏发布文心大模型4.0工具版,推理成本降到1%
...练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。“也就是说,客户原来一天调用1万次,同样成本之下,现在一天可以调用100万次。”此外,李彦宏在演讲中分享了百度...……更多
...终端CPU芯片,即使是发布多年的老款机器也能流畅运行,推理成本仅为国际同行的百分之一。据悉,面壁智能核心技术团队源于清华NLP实验室,是在国内较早开展大模型研究的团队之一,是2020年12月“悟道”大模型首发的主力团...……更多
AI推理速度提升超10倍,Groq LPU能否取代英伟达GPU?
...美国人工智能初创公司Groq最新推出的面向云端大模型的推理芯片引发了业内的广泛关注。其最具特色之处在于,采用了全新的Tensor Streaming Architecture (TSA) 架构,以及拥有超高带宽的SRAM,从而使得其对于大模型的推理速度提高了1...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...去年团队花了近一个月的时间做完了华为昇腾训练架构的适配,芯片的国产替代帮助节省了不少成本。目前,生数科技采取的是To B和To C两条腿走路的商业化模式:对B端提供MaaS服务,对C端提供多模态生成应用。目前,生数科技...……更多
智启新元年:PC成为AI落地首选终端
...了具备高性能计算能力的通用加速芯片,是大模型训练、推理的主要算力来源;云计算的发展和普及,则使软硬件充分解耦,大模型开发者可以以相对低的成本调用大规模的算力、存储和网络资源,开发进程大大加快;同时,Tra...……更多
昇思MindSpore 2.3全新发布
...专项技术支持和市场联合推广,支持更多伙伴从昇思迁移适配走向原生开发;昇思开源社区实习活动,通过代码实践,让开发者真正的实践成长。颁发昇思MindSpore杰出贡献导师和开发者作为Gitee-国内第一大开源代码托管平台,开...……更多
更多关于科技的资讯:
苹果发布ios18.2首个公测版,siri接入chatgpt
今天凌晨,苹果正式发布了iOS18.2首个公测版,将更多AI功能大批量推送给用户。其中最重要的就是Siri接入ChatGPT了
2024-11-09 02:25:00
amd锐龙79800x3d处理器上市,基于Zen 5架构
11月8日消息,随着AMD锐龙79800X3D处理器正式上市,微星宣布为旗下AMD5主板陆续推出最新的AGESA1.2
2024-11-09 02:31:00
消息称英特尔可能下月发布battlemage显卡
11月8日消息,消息源@金猪升级包昨日(11月7日)发布微博,曝料称英特尔可能下月发布锐炫(Arc)Battlemage显卡
2024-11-09 02:36:00
苹果2024款macmini正式发售,内存最高64GB
11月8日消息,苹果2024款Macmini今日正式发售,搭载M4/M4Pro芯片,内存升至16GB起步,最高64GB
2024-11-09 02:37:00
雷诺将于明年推出下一代clio紧凑型两厢轿车
11月8日消息,汽车媒体autocar昨日(11月7日)发布博文,报道称雷诺(Renault)将于明年推出下一代Clio紧凑型两厢轿车
2024-11-09 02:48:00
小鹏p7+大定31528台!打破小鹏历史纪录
11月7日晚间,小鹏汽车发布了全球首款AI汽车小鹏P7+。11月8日,CNMO注意到,小鹏汽车董事长何小鹏宣布,小鹏P7+打破小鹏历史所有纪录
2024-11-09 02:53:00
梅赛德斯-amg首款纯电动suv预计于2026年正式亮相
近日,梅赛德斯-AMG发布了首款纯电动SUV的预告,新车预计于2026年正式亮相。据了解,这款SUV基于全新的AMG.EA架构打造
2024-11-09 03:06:00
realmeui6.0首批机型正式版本月升级计划公布
11月8日消息,realmeUI产品经理@康达Leo今日在微博分享了realmeUI6.0首批机型正式版本月升级计划。IT之家整理如下
2024-11-09 03:47:00
11月8日,据荣耀手机官方消息,全新荣耀手表5的正式开售时间为今天上午10点08分。目前,全新荣耀手表5的曜石黑、晨辉金配色售价为999元
2024-11-09 03:55:00
小米su7ultra量产版11月15日广州车展亮相
11月8日消息,虽然已经确认要等到明年3月才会上市,但小米 SU7Ultra 量产版已于昨日完成工信部申报,目前81.49万元预售中
2024-11-09 04:18:00
英特尔因处理器存在缺陷被起诉
11月8日消息,科技媒体theregister于11月6日发布博文,报道称由于2022年的第13代、2023年的第14代桌面处理器存在缺陷
2024-11-09 04:24:00
赵海燕 西北妇女儿童医院在现代医疗体系中,消毒供应中心(CSSD)扮演着举足轻重的角色。它不仅是医院感染控制的前沿阵地
2024-11-09 04:34:00
李星 对外经济贸易大学中国金融学院摘要:数字金融的快速发展正在深刻改变企业的金融化进程,成为企业获取资金、优化财务结构
2024-11-09 04:34:00
李佳佳 迪庆日报社摘要:传统媒体和新兴媒体融合,是媒体行业适应时代变革的必然趋势。在新兴媒体迅速崛起的情况下,传统媒体需要从内容创新
2024-11-09 04:34:00
“中国市场是我们发展的必选项”(环球热点)
本文转自:人民日报海外版多国外商齐聚第七届进博会——“中国市场是我们发展的必选项”(环球热点)本报记者观众在进博会尼康相机展台参观
2024-11-09 05:08:00