• 我的订阅
  • 头条热搜
面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线
...发布了训练数据规模近1T、参数规模仅2B的模型:聚焦于适配端侧硬件的端侧大模型MiniCPM-2B。为什么瞄准端侧场景?李大海给出的理由,仍然是旺盛的市场需求,和云端协同的部署趋势。自2023年下半年起,三星、华为、小米、特...……更多
...高推理成本、高资源占用这“三高”,以及算力层的硬件适配,一直是困扰模型落地的最后一公里。尤其在AI+消费级硬件成为行业趋势的当下,如何让大模型在有限算力的终端设备上跑起来,也成为不少终端厂商亟需解决的难题...……更多
推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型
...还能为其模型优化提供精确指导。不仅如此,通过大量的适配工作,百川智能还实现了多平台适配的私有化部署方案,和英伟达、华为、寒武纪、高通、MTK、天数等主流芯片都能适配。多、快、好、省,深受合作伙伴好评那些拿...……更多
优刻得首个「国产千卡智算集群」落地,支持智源千亿大模型训练
...、数据传输和算力调度等方面具有极高的效率。经过精心适配和调优,优刻得国产智算集群现已在上海青浦智算中心全面部署,智源研究院正基于国产算力更高效地完成大模型的训推工作。突破算力瓶颈,技术自主可控基于国内...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...制条件,提高视频内容生成的一致性和可控性; 5.算力适配通用化,在模型推理运行方面,针对重点行业客户应用,与多家国内外算力厂商的产品适配,形成了算力模型一体化产品; 6.模型进步持续化,为保障技术的持续领先...……更多
Llama3.1根本卖不动!业内人士:开源模型成本反而更高
...出新的产品。在闭源的商业模型中,厂商把模型和硬件都适配好了,调到了最优状态,客户直接复制成熟经验就可以。但如果你用开源,还要自己去适配调,投入的算力成本、工程师的成本更高。所以我们说企业应用模型要“算...……更多
文心大模型4.0 Turbo来了!百度推出文心快码2.5,已覆盖内部80%程序员
...、动静统一自动并行、编译器自动优化以及大模型多硬件适配等特色。百度智能代码助手Baidu Comate升级至2.5版本,开发、业务迭代及企业落地速度大幅提升,并拥有了全新的中文名“文心快码”,正式加入百度“文心大家族”。...……更多
蚂蚁数科SOFAStack发布全栈AI服务,助力企业用好大模型
...aaS平台SOFAStack正式发布大模型服务平台AI Max。该平台兼容适配主流开源大模型、国产算力,向企业提供进行模型训练、部署、评估、优化等一站式模型工作台,并实现可视化研发、管理多种具备行业知识库的Agent(智能体)应用...……更多
...完成底层芯片到上层操作系统及应用开发的软硬一体深度适配;能够在较低的功耗下运行且适合电池供电的移动设备;有电子围栏技术感知周围的场景。端侧模型也需要链接智能音箱、安全监控、自动化家居控制系统等,提供更...……更多
...初期聚焦于SpiritX智算操作系统的自主研发。该系统不仅适配国内主流GPU(图形处理器)厂商,通过调度算法优化、算子优化、集群网络优化提升国产GPU在大模型训练与推理场景中的性能,还能够适配国内外主流开源、商用大模...……更多
国产GPU为底座,摩尔线程首个千卡智算中心落地
...一体化大模型解决方案,积极与广泛的生态伙伴开展兼容适配及技术调优等工作,共同推动国产大模型生态的全面繁荣。在最后的圆桌对话环节,摩尔线程副总裁董龙飞与中能建绿色数字科技(中卫)有限公司董事长墙虎、智谱...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...话时表示:“商汤的云边端全栈组合,可以很好地赋能和适配小米物联网生态。我们希望与商汤共同为我们的用户打造更具智能化的产品体验。”左为小米集团小爱总经理王刚,右为商汤科技联合创始人、首席科学家王晓刚此外...……更多
GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型?
...的加速卡设计的AI大模型,通用服务器的处理器与之并不适配。原因很明显:后者虽然拥有高通用性和高性能的计算核心,但并没有并行工作的环境。通常来说,通用服务器会将先将模型的权重传给一个CPU,然后再由它去串联其...……更多
跨越算力鸿沟丨星凡科技2024AI算力集群产品发布会圆满成功
...三重使能平台,帮助大模型开发者解决国产芯片性能低、适配难,开发成本高、难度大等一揽子问题。1.神机AIOS致力于打造国内首个算力中心运营全场景AGI,通过Agent自然语言交互智能帮助开发者极简极低打造行业大模型,减少...……更多
当大模型Scaling Law继续,万卡集群算力释放在百舸找到一条通途
...伟达、英特尔等国内外主流 AI 芯片的混合训练,并全面适配。同时通过「控制台」轻松一键发起,易用性很高。百舸 4.0 还通过大模型训推加速套件 AIAK 支持了更多使用场景、多种模型架构和主流训推方式,全能属性拉满。 当...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...保证模型的训练稳定性和收敛速度;3)专家特定学习率适配策略,根据学习率和Batch size的缩放原则,为不同专家适配不同的最佳学习率,以提高模型训练效率。3、高质量的合成数据:混元团队在天然文本语料库的基础上,利用...……更多
国产GPU万卡集群终于来了!摩尔线程CEO张建中:做难而正确的事
...品兼容性。“目前几乎所有的CPU企业都和我们的GPU完成了适配,我们一个驱动可以支持几乎所有的CPU,”他谈道,“我们希望完美体验系统让国内的CPU、操作系统和我们的GPU工作在一起的时候,可以为客户提供一个完整且很好的...……更多
PC迎来AI时刻,英特尔、微软、联想等纷纷布局,产品价格将迎上涨
...一代的8倍,可在PC上实现高能效的AI加速和本地推理,并适配超过10款国产大模型。英特尔的老对手AMD则抢先一步,上周发布Ryzen 8040系列处理器。该处理器集成了升级的专用AI引擎NPU,算力为16TOPS,AI性能相比上一代提升60%,支持...……更多
张云泉:集中力量,促进国产AI大模型发展
...导低功耗推理芯片和算子库技术攻关,鼓励大模型压缩、适配和性能调优等技术研发,通过规模效应实现成本共担,降低模型推理算力成本,形成经济适用国产大模型推理产业链。此外,可为大模型企业和愿意通过大模型手段智...……更多
CPU,正在被AI时代抛弃?
...方面进行技术探索——硬件层面的升级和软件层面的优化适配。千帆大模型平台采用xFT,主要进行了以下三方面的优化:●系统层面:利用英特尔®AMX/AVX512等硬件特性,高效快速地完成矩阵/向量计算;优化实现针对超长上下文...……更多
...算效率和算力开销两大问题成为新的行业焦点。对大模型推理成本的优化,可通过很多技术手段实现。首先是模型本身,模型结构、训练方法都可以持续改进,包括业界很关注的MoE(混合专家模型),就是优化推理成本很好的解决...……更多
百川智能、阿里云等进入开源大模型领域,开启商业化前奏
...用于自身业务优化并对外开放合作。 大模型分为训练和推理两个过程,前者将大模型训练成型,后者即为应用。由于训练大模型需极大算力,开发成本高昂,业界多有关于不需“重复造轮”的讨论。例如,入场做大模型后,百...……更多
联想王传东:2027年AI PC将成为市场主流
...下也能使用;第三,更低的大模型使用成本,以本地免费推理为主、以云端公共推理为辅,一次性购买AIPC即可享受全生命周期的本地免费推理服务;第四,可信、安全的个人数据和隐私保障,个性化本地知识库、隐私数据的本...……更多
算力浪费超50%!百度AI计算部负责人拆解大模型时代的算力成本
...算力优势,构建一系列复杂的加速库和框架,有针对性地适配不同应用场景。目前,我们已处于AI大集群超算时代。单一的芯片已经不足以独立解决问题,因此需要大规模的芯片协同解决一个问题,GPU集群规模甚至达到10万卡。...……更多
突破遥感基础模型关键技术!我国科研人员研发出遥感智能训推一体机
...多个边缘场景低成本灵活部署。在自主创新方面,一体机适配了昇腾AI环境与昇思MindSpore框架,实现了软硬一体的自主创新。“空天·灵犀”遥感智能训推一体机搭载的高精度、高时效轻量化基础模型,能够在自然资源、交通住...……更多
空天信息+人工智能 中国科研团队成功研发遥感智能训推一体机
...。在自主创新方面,“空天·灵犀”遥感智能训推一体机适配昇腾人工智能环境与昇思人工智能计算框架(MindSpore),实现软硬一体。中国科学院空天院赛博智能团队透露,未来,基于昇腾人工智能的“空天·灵犀”遥感智能训推一...……更多
“技术故障”背刺巴菲特,金融大模型到底靠不靠谱?
...尔®至强®CPUMax系列处理器在硬件能力、软件优化、生态适配、总拥有成本优势等方面都与金融场景非常契合,不失为业界大模型落地的一种新思路。如何评价?随着数字化转型的不断深入,大模型为金融行业带来的机遇与挑战...……更多
对话云天励飞董事长陈宁:2030年人类将实现AGI,推理芯片将是蓝海市场|钛媒体AGI
...芯片DeepEdge10 Max创新的D2D chiplet架构打造的X5000推理卡,已适配并可承载10亿级SAM、百亿级Llama2等大模型运算,可广泛应用于AIoT边缘视频、移动机器人等场景。据介绍,“深目”AI模盒内置的自研多模态大模型“云天天书”,包含...……更多
“整活”保险业务,AI大模型哪家强?
...,保险业也不例外。号称神通广大的AI大模型能否完美“适配”保险行业?10月10日发布的《人工智能大模型保险行业应用评测报告》(以下简称《报告》)便揭晓了答案。根据《报告》,10个主流大模型在知识问答领域表现普遍...……更多
谷歌发布gemma2大语言模型,共有两种大小
...亿参数(27B)两种大小。Gemma2大语言模型相比较第一代,推理性能更高、效率更高,并在安全性方面取得了重大进步。谷歌在新闻稿中表示,Gemma2-27B模型的性能媲美两倍规模的主流模型,而且只需要一片英伟达H100ensorCoreGPU或TPU...……更多
更多关于科技的资讯:
冲泡即食、真材实料:海福盛冻干粥3.1元/杯大促
海福盛冻干粥5杯日常售价24.9元,今日下单可领6元优惠券,到手18.9元,包邮到家。购买链接:天猫(券后18.9元)下单赠送芙蓉鲜蔬汤一杯
2024-12-19 17:00:00
有效期3年:瑞慈全身体检套餐279元大促(立减800元)
天猫瑞慈体检旗舰店,成人全身体检套餐日常售价1079元,可领限量800元券,实付279元入手。全国66门店通用,有效期3年
2024-12-19 17:00:00
男子给已婚女同事发“么么哒”被辞退!法院判决:公司赔偿3万9
快科技12月19日消息,近日,据媒体报道,一则法院判决案例在网络流传,网文称安徽宣城一名“70后”男职工因给已婚女同事发“我想你”“么么哒”等聊天内容等原因遭到公司的辞退
2024-12-19 17:00:00
曝富士康已建立折叠屏iPhone测试线:厚度/重量尚未达到苹果标准
快科技12月19日消息,每年关于苹果的爆料,除了下一代iPhone之外,大家最熟悉的节目可能就是折叠屏iPhone了,年年都有传闻出现
2024-12-19 17:00:00
主人杀年猪 二哈偷吃猪肉被撑死:没有饱腹感、喂养需适量
12月19日消息,很多动物其实没有饱腹感,会一直进食,甚至有可能被撑死。近日在四川泸州,一户人家杀年猪,切好的肉放在桌子上
2024-12-19 17:00:00
中兴罕见涨停 股价创近一年来新高 夺A股成交冠军
快科技12月19日消息,作为A股硬科技领域的代表公司,中兴通讯今日盘中触及涨停板,股价创下近一年来的新高,总市值也重回1800亿元以上
2024-12-19 17:00:00
2024年,茅台悠蜜的美好遇见
营收连续5年蝉联第一。——在水果发酵酒领域,茅台悠蜜可谓是异军突起。12月18日,贵州茅台(集团)生态农业产业发展有限公司(以下简称“茅台生态农业公司”)2024年市场营销工作会议在贵阳市举行
2024-12-19 17:18:00
正安县中等职业学校:产教融合培育直播电商“新农人”
多彩贵州网讯 在当今数字化经济蓬勃发展的时代,直播电商作为一种新兴的商业模式,正以惊人的速度改变着人们的消费方式和市场格局
2024-12-19 17:19:00
远大医药获治疗干眼症的全球首创创新产品的独家开发及商业化权益
远大医药获得治疗干眼症的全球首创创新产品的独家开发及商业化权益OC-01和OC-02是两种高选择性的乙酰胆碱能受体激动剂
2024-12-19 17:21:00
@山东人:2024,你的钱都去哪了?参与调查赢奖品!
2024作为消费促进年,我国一系列促消费持续落地,有效释放了内需潜力,多数商品销售增势良好,升级类商品较快增长。根据国家统计局数据
2024-12-19 17:23:00
圣诞装蒂法3D模型分享:圣诞老人版“耶路撒泠”
随着圣诞节越来越近,“3D区”博主、模型渲染爱好者@DRAYQ今天在推特中分享了自己制作的圣诞装蒂法3D建模同人图。我们的“耶路撒冷”换上了圣诞老人短裙后像是要把衣服都要撑破了
2024-12-19 17:30:00
2026北京车展提前官宣:总面积超38万平米打破历史规模纪录
快科技12月19日消息,2026(第十九届)北京国际汽车展览会已正式定档。将于2026年4月24日至5月3日在北京中国国际展览中心(顺义馆)和首都国际会展中心(新国展二期)隆重举行
2024-12-19 17:30:00
余承东:很多车厂想和我们合作 抱歉 我手里没有那么多资源了
快科技12月19日消息,鸿蒙智行年度直播今日于海南三亚举办,余承东与四界老总相聚直播间,跟撒贝宁、尼格买提、陈伟鸿跨界对话
2024-12-19 17:30:00
鲜果酿造 口感纯正!云小耳黑莓果汁大促:48元券 6罐到手11.9元
云小耳黑莓果汁242ML*6罐日常售价为59.9元,下单领取48元优惠券,到手价为11.9元。购买链接:天猫(券后11
2024-12-19 17:30:00
商务部回应美方考虑禁售TP-Link路由器:别搞有罪推定
快科技12月19日消息,有报道称,美国商务部、国防部和司法部的调查人员以国安问题为由,已经对中国路由器品牌厂商TP-Link展开调查
2024-12-19 17:30:00