• 我的订阅
  • 头条热搜
面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线
...发布了训练数据规模近1T、参数规模仅2B的模型:聚焦于适配端侧硬件的端侧大模型MiniCPM-2B。为什么瞄准端侧场景?李大海给出的理由,仍然是旺盛的市场需求,和云端协同的部署趋势。自2023年下半年起,三星、华为、小米、特...……更多
...高推理成本、高资源占用这“三高”,以及算力层的硬件适配,一直是困扰模型落地的最后一公里。尤其在AI+消费级硬件成为行业趋势的当下,如何让大模型在有限算力的终端设备上跑起来,也成为不少终端厂商亟需解决的难题...……更多
优刻得首个「国产千卡智算集群」落地,支持智源千亿大模型训练
...、数据传输和算力调度等方面具有极高的效率。经过精心适配和调优,优刻得国产智算集群现已在上海青浦智算中心全面部署,智源研究院正基于国产算力更高效地完成大模型的训推工作。突破算力瓶颈,技术自主可控基于国内...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...制条件,提高视频内容生成的一致性和可控性; 5.算力适配通用化,在模型推理运行方面,针对重点行业客户应用,与多家国内外算力厂商的产品适配,形成了算力模型一体化产品; 6.模型进步持续化,为保障技术的持续领先...……更多
文心大模型4.0 Turbo来了!百度推出文心快码2.5,已覆盖内部80%程序员
...、动静统一自动并行、编译器自动优化以及大模型多硬件适配等特色。百度智能代码助手Baidu Comate升级至2.5版本,开发、业务迭代及企业落地速度大幅提升,并拥有了全新的中文名“文心快码”,正式加入百度“文心大家族”。...……更多
蚂蚁数科SOFAStack发布全栈AI服务,助力企业用好大模型
...aaS平台SOFAStack正式发布大模型服务平台AI Max。该平台兼容适配主流开源大模型、国产算力,向企业提供进行模型训练、部署、评估、优化等一站式模型工作台,并实现可视化研发、管理多种具备行业知识库的Agent(智能体)应用...……更多
...完成底层芯片到上层操作系统及应用开发的软硬一体深度适配;能够在较低的功耗下运行且适合电池供电的移动设备;有电子围栏技术感知周围的场景。端侧模型也需要链接智能音箱、安全监控、自动化家居控制系统等,提供更...……更多
...初期聚焦于SpiritX智算操作系统的自主研发。该系统不仅适配国内主流GPU(图形处理器)厂商,通过调度算法优化、算子优化、集群网络优化提升国产GPU在大模型训练与推理场景中的性能,还能够适配国内外主流开源、商用大模...……更多
国产GPU为底座,摩尔线程首个千卡智算中心落地
...一体化大模型解决方案,积极与广泛的生态伙伴开展兼容适配及技术调优等工作,共同推动国产大模型生态的全面繁荣。在最后的圆桌对话环节,摩尔线程副总裁董龙飞与中能建绿色数字科技(中卫)有限公司董事长墙虎、智谱...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...话时表示:“商汤的云边端全栈组合,可以很好地赋能和适配小米物联网生态。我们希望与商汤共同为我们的用户打造更具智能化的产品体验。”左为小米集团小爱总经理王刚,右为商汤科技联合创始人、首席科学家王晓刚此外...……更多
跨越算力鸿沟丨星凡科技2024AI算力集群产品发布会圆满成功
...三重使能平台,帮助大模型开发者解决国产芯片性能低、适配难,开发成本高、难度大等一揽子问题。1.神机AIOS致力于打造国内首个算力中心运营全场景AGI,通过Agent自然语言交互智能帮助开发者极简极低打造行业大模型,减少...……更多
GPU受限,国内AI大模型能否交出自己的答卷?
...芯片尚需生态支撑事实上,比起硬件性能上的差异,软件适配与兼容让国内客户接受更难。当大模型和应用层面的竞争拉响,从商业角度思考,采用国产AI芯片参战并不是好的选择。从硬件性能上,使用国产AI芯片计算会比采用...……更多
国产GPU万卡集群终于来了!摩尔线程CEO张建中:做难而正确的事
...品兼容性。“目前几乎所有的CPU企业都和我们的GPU完成了适配,我们一个驱动可以支持几乎所有的CPU,”他谈道,“我们希望完美体验系统让国内的CPU、操作系统和我们的GPU工作在一起的时候,可以为客户提供一个完整且很好的...……更多
PC迎来AI时刻,英特尔、微软、联想等纷纷布局,产品价格将迎上涨
...一代的8倍,可在PC上实现高能效的AI加速和本地推理,并适配超过10款国产大模型。英特尔的老对手AMD则抢先一步,上周发布Ryzen 8040系列处理器。该处理器集成了升级的专用AI引擎NPU,算力为16TOPS,AI性能相比上一代提升60%,支持...……更多
CPU,正在被AI时代抛弃?
...方面进行技术探索——硬件层面的升级和软件层面的优化适配。千帆大模型平台采用xFT,主要进行了以下三方面的优化:●系统层面:利用英特尔®AMX/AVX512等硬件特性,高效快速地完成矩阵/向量计算;优化实现针对超长上下文...……更多
...算效率和算力开销两大问题成为新的行业焦点。对大模型推理成本的优化,可通过很多技术手段实现。首先是模型本身,模型结构、训练方法都可以持续改进,包括业界很关注的MoE(混合专家模型),就是优化推理成本很好的解决...……更多
百川智能、阿里云等进入开源大模型领域,开启商业化前奏
...用于自身业务优化并对外开放合作。 大模型分为训练和推理两个过程,前者将大模型训练成型,后者即为应用。由于训练大模型需极大算力,开发成本高昂,业界多有关于不需“重复造轮”的讨论。例如,入场做大模型后,百...……更多
联想王传东:2027年AI PC将成为市场主流
...下也能使用;第三,更低的大模型使用成本,以本地免费推理为主、以云端公共推理为辅,一次性购买AIPC即可享受全生命周期的本地免费推理服务;第四,可信、安全的个人数据和隐私保障,个性化本地知识库、隐私数据的本...……更多
突破遥感基础模型关键技术!我国科研人员研发出遥感智能训推一体机
...多个边缘场景低成本灵活部署。在自主创新方面,一体机适配了昇腾AI环境与昇思MindSpore框架,实现了软硬一体的自主创新。“空天·灵犀”遥感智能训推一体机搭载的高精度、高时效轻量化基础模型,能够在自然资源、交通住...……更多
空天信息+人工智能 中国科研团队成功研发遥感智能训推一体机
...。在自主创新方面,“空天·灵犀”遥感智能训推一体机适配昇腾人工智能环境与昇思人工智能计算框架(MindSpore),实现软硬一体。中国科学院空天院赛博智能团队透露,未来,基于昇腾人工智能的“空天·灵犀”遥感智能训推一...……更多
“技术故障”背刺巴菲特,金融大模型到底靠不靠谱?
...尔®至强®CPUMax系列处理器在硬件能力、软件优化、生态适配、总拥有成本优势等方面都与金融场景非常契合,不失为业界大模型落地的一种新思路。如何评价?随着数字化转型的不断深入,大模型为金融行业带来的机遇与挑战...……更多
对话云天励飞董事长陈宁:2030年人类将实现AGI,推理芯片将是蓝海市场|钛媒体AGI
...芯片DeepEdge10 Max创新的D2D chiplet架构打造的X5000推理卡,已适配并可承载10亿级SAM、百亿级Llama2等大模型运算,可广泛应用于AIoT边缘视频、移动机器人等场景。据介绍,“深目”AI模盒内置的自研多模态大模型“云天天书”,包含...……更多
“整活”保险业务,AI大模型哪家强?
...,保险业也不例外。号称神通广大的AI大模型能否完美“适配”保险行业?10月10日发布的《人工智能大模型保险行业应用评测报告》(以下简称《报告》)便揭晓了答案。根据《报告》,10个主流大模型在知识问答领域表现普遍...……更多
谷歌发布gemma2大语言模型,共有两种大小
...亿参数(27B)两种大小。Gemma2大语言模型相比较第一代,推理性能更高、效率更高,并在安全性方面取得了重大进步。谷歌在新闻稿中表示,Gemma2-27B模型的性能媲美两倍规模的主流模型,而且只需要一片英伟达H100ensorCoreGPU或TPU...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
...模型的上下文长度快速增长,超长上下文解锁新应用,但推理计算代价高昂,上下文本身对于信息不会进行压缩,不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年,人工智能领域风起云涌...……更多
芯片战场丨瞄准大模型 摩尔线程首个千卡智算中心落地
...体化的GPU智算系统整合能力的考验,GPU分布式计算系统的适配、算力集群的管理和高效推理引擎的应用等,都是提高算力中心可用性的重要因素。而国产智算中心的发展,更是依托于将各方需求和优势充分融合,产业聚力才能实...……更多
摆脱Transformer依赖?这家AI初创公司推出国内首个非Attention机制大模型
...能效果——记忆能力提升3倍、速度提升7倍的同时,实现推理吞吐量的5倍提升。 至于为何另辟蹊径,寻求非Transformer的大模型路径,岩芯数智CEO刘凡平指出,以大规模著称的Transformer,在实际应用中的高算力和高成本,让不少中...……更多
字节跳动豆包大模型发布,火山引擎全栈AI服务助力企业智能化转型
...系列可精调,具备更强的理解、生成、逻辑等综合能力,适配问答、总结、创作、分类等丰富场景;豆包通用模型lite:字节跳动自研LLM模型轻量版,对比专业版提供更低token 成本、更低延迟,为企业提供灵活经济的模型选择;...……更多
国产大模型第一梯队玩家,为什么pick了CPU?
...占绝对大头的因素——算力。 现在提及大模型的训练和推理,很多人的第一反应或许就是想到了GPU。诚然GPU在高性能上占据着一定的优势,但它所存在“硬伤”也是比较明显,那便是供应不足、价格昂贵。何以破局?国产大模...……更多
工业互联智能创新中心在两江协同创新区成立
...入式数据采集器支持多种主流工业协议及数据模型的智能适配,能提供统一设备监控平台以及边端智能数据采集器,可大幅降低数据采集和分析的开发成本和维护成本。目前,该系统已在某汽车主机厂应用,使物流设备异常率降...……更多
更多关于科技的资讯:
大疆消费级无人机djineo曝光,配备螺旋桨保护罩
近日,CNMO注意到,有爆料人士在X(原推特)上曝光了大疆的新款消费级无人机——DJINeo。据了解,这应该是一款紧凑的
2024-07-30 19:27:00
CNMO注意到,在经历了连续两周销量下滑的低谷后,小米汽车的单周销量重新回到了上坡路并突破了此前记录,达到了约3900辆
2024-07-30 19:29:00
redminote14系列正式入网:主打外围体验
自去年9月发布以来,RedmiNote13系列凭借1099元起的亲民价格定位,迅速赢得了市场的热烈反响与广泛好评。而今
2024-07-30 19:31:00
双向8车道!世界最大吨位非对称曲线斜拉转体桥首座主墩塔柱封顶
快科技7月30日消息,据媒体报道,由中铁四局集团承建的世界最大吨位非对称曲线斜拉转体桥——九江快速路跨庐山站转体斜拉桥首个主墩塔柱顺利封顶
2024-07-30 19:32:00
极具魅力却常被忽视!宝马6系GT新车型上市:售63.09万元
快科技7月30日消息,宝马集团近日宣布,旗下唯一在售的BMW GT车型——BMW 6系GT以630900元人民币的价格焕新上市
2024-07-30 19:32:00
宝马、兰博基尼、奔驰都是大客户!全球知名汽车座椅制造商Recaro破产
快科技7月30日消息,据报道,德国的传统汽车座椅制造商Recaro Automotive现已资不抵债,申请破产。埃斯林根地方法院周一下令启动临时自我管理
2024-07-30 19:32:00
价格太高卖不掉!广汽菲克长沙工厂流拍:第二次拍卖降3.8亿元
快科技7月30日消息,广汽菲克长沙工厂在首次拍卖中因无人出价而流拍后,即将进行第二次拍卖,起拍价较首次降低了3.83亿元
2024-07-30 19:32:00
华为Mate 70系列发布时间暂定于11月
7月30日,CNMO注意到,知名爆料人士数码闲聊站发文透露,华为拥有一套自研的超声波指纹解锁方案,在功耗和解锁速度方面都有不错的表现
2024-07-30 19:35:00
华为soundx4音箱要到9月才会推出
SoundX系列是华为在智能音箱领域的高端之作,目前已经有3年没有进行大更新。不少人,尤其是花粉,对新品十分期待。此前
2024-07-30 19:36:00
奥迪a6e-tron预告图发布,四环标志如钻石般闪耀
近日,奥迪发布了首张A6e-tron的预告图,这款全新的电动中大型轿车将在7月31日正式亮相。尽管官方目前对新车的具体信息依旧保密
2024-07-30 19:39:00
苹果可能在早期开发中一直在使用谷歌硬件
苹果发布的最新人工智能研究显示,苹果一直在使用谷歌硬件来构建AppleIntelligence的早期基础。这篇名为“苹果智能基金会语言模型”的研究论文非常具有专业性
2024-07-30 19:41:00
小功率太阳能电池逆变首选,九款微型太阳能逆变器拆解汇总
微型逆变器是将太阳能电池发电转换成交流电的逆变器,将太阳能电池板连接到逆变器的输入端,逆变器输出端可以与其他逆变器并联
2024-07-30 14:06:00
善用海洋资源,夏威夷部署首座电网级波浪能设备
夏威夷第一座电网级波浪能设备将登场。爱尔兰公司OceanEnergy已在夏威夷欧胡岛海岸附近的美国海军波浪能试验场,部署1
2024-07-30 14:07:00
文生视频大模型,短视频的过弯点?
随着今年初Sora的横空出世,这个可以创建长达一分钟视频的文生视频模型就成为了国内厂商追逐的焦点。6月初,快手自研的视频生成大模型“可灵”正式上线
2024-07-30 14:08:00
企业创新创投联盟走进科大讯飞,共话AI未来
近期,企业创新创投联盟携成员单位、科创企业及投资机构等50余位代表共同走进科大讯飞合肥总部,与讯飞创投共同深入交流“人工智能+”时代的产业机遇
2024-07-30 14:09:00