• 我的订阅
  • 头条热搜
掰开安卓手机 满屏都是三个字:大模型
...上做好准备。首先,需要先增强智能终端对不同大模型的适配能力,即使是架构算法存在差异也同样能装进手机。即使最新大模型体积超出预期,也要能确保在不影响性能的情况下,将之应用到智能终端。这里依旧以高通为例。...……更多
CITE2024,昇腾硬核实力打造极致体验,宝德斩获创新大奖
...术实力与卓越创新实力。 展会现场,融合主流大模型和适配昇腾算力打造的AI训推一体机PR410EI、昇腾智能边缘小站PI300T、鲲鹏服务器PR210KT、盘古台式机PT620W等宝德自强®系列终端产品以及丰富的解决方案轮番上阵,技术交流声...……更多
加速落地 京东云大模型已支持数百个场景
...、性能、效果三者取得一个比较好的平衡点。京东云自研推理引擎,协同大小模型,为大模型产业落地提供最佳实践,如通过利用推测解码,用小模型辅助大模型进行推理,加速大模型推理速度,降低成本。在大模型应用开发上...……更多
Infocomm China2024见闻:大家每天忙于开会,却还没吃透怎么用好AI
...久?会议硬件产品正逐渐吸纳先进的互联网技术实现功能适配和场景融合。腾讯会议的展区非常显眼,这多半还源自多家硬件生态伙伴的“遥相呼应”,MAXHUB、罗技、耳目达、poly、维海德、亿联网络等多个硬件厂商,均展示了...……更多
摩尔线程、360达成战略合作!打造360智脑国产算力底座
...成本的平衡。不仅如此,360大模型产品还与摩尔线程完成适配,基于摩尔线程夸娥(KUAE)千卡智算集群,360集团已成功完成了70亿和700亿参数的大模型分布式训练任务。测试结果显示,全程软硬件即插即用,集群训练稳定性达到...……更多
腾讯大模型混元Turbo:御气升昺云,梓桐金鼎开
...模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升 100%,推理成本降低 50%,解码速度提升 20%,效果在多个基准测试上对标GPT-4o。最新第三方测评在国内位居第一。腾讯混云大模型已经落地腾讯700+个业务场景...……更多
...终端CPU芯片,即使是发布多年的老款机器也能流畅运行,推理成本仅为国际同行的百分之一。据悉,面壁智能核心技术团队源于清华NLP实验室,是在国内较早开展大模型研究的团队之一,是2020年12月“悟道”大模型首发的主力团...……更多
李彦宏发布文心大模型4.0工具版,推理成本降到1%
...练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。“也就是说,客户原来一天调用1万次,同样成本之下,现在一天可以调用100万次。”此外,李彦宏在演讲中分享了百度...……更多
阿里云CTO周靖人:全面投入升级AI大基建
...、计算、存储、网络、数据库、大数据,并与AI场景有机适配、融合,加速模型的开发和应用,打造一个AI时代的最强AI基建。周靖人表示:“云厂商拥有全栈技术储备,并通过基础设施的全面升级,让AI训练、推理、部署和应用...……更多
AI推理速度提升超10倍,Groq LPU能否取代英伟达GPU?
...美国人工智能初创公司Groq最新推出的面向云端大模型的推理芯片引发了业内的广泛关注。其最具特色之处在于,采用了全新的Tensor Streaming Architecture (TSA) 架构,以及拥有超高带宽的SRAM,从而使得其对于大模型的推理速度提高了1...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...去年团队花了近一个月的时间做完了华为昇腾训练架构的适配,芯片的国产替代帮助节省了不少成本。目前,生数科技采取的是To B和To C两条腿走路的商业化模式:对B端提供MaaS服务,对C端提供多模态生成应用。目前,生数科技...……更多
位列第一梯队,腾讯混元再度领跑国内大模型
...维度的综合性测评基准,由十大基础任务组成,包括逻辑推理、代码、语言理解、长文本、角色扮演等。本次报告选取了国内外具有代表性的32个大模型4月份的版本,通过多维度综合性测评,真实准确地反映了国内外大模型在中...……更多
大模型价格战“卷”向何方?|深度
...千亿参数MoE架构模型。MoE架构中基于多个专家并行机制,推理时只激活部分专家,以稀疏性压缩了参数数量和推理成本。“这就可以极大地节省算力耗费”。而率先掀起价格战的幻方DeepSeek-V2,就是其通过架构创新,实现了大模...……更多
大模型「标王」硬气:不做Sora ,要帮更多企业做出Sora
...性能损失 5%,已经是业界最高水平。除了「多」,训练、推理也又「快」又「稳」。从发布到上线仅三个月,生数科技就完成了对 Vidu 的快速迭代。为啥这么快?因为百舸会把不同地点、不同规模、不同集群的算力统一管理起来...……更多
智启新元年:PC成为AI落地首选终端
...了具备高性能计算能力的通用加速芯片,是大模型训练、推理的主要算力来源;云计算的发展和普及,则使软硬件充分解耦,大模型开发者可以以相对低的成本调用大规模的算力、存储和网络资源,开发进程大大加快;同时,Tra...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...ingo 更新了 35.5% (1.8B) 的模型参数,ManipLLM 更新了 LLM 中的适配器 (41.3M),包含 0.5% 的模型参数,而我们的微调 Policy head (3.7M) 仅占模型参数的 0.1%。RoboMamba 比以前基于 MLLM 的方法更新的参数少了 10 ……更多
CybotStar——大模型一站式应用开发平台
...私有服务器、软硬一体等灵活的部署方式,支持IDE插件、适配网页、API、IM办公软件多元场景,适用于各种任务和部署环境。CybotStar聚焦四大核心能力,助力产业机构竞逐AI新时代。内容生成:CybotStar提供多模态的内容生成能力...……更多
“大装置+大模型”战略:助力商汤迅速获取生成式AI商业化果实
...“商量”,不仅发布了不同参数量级的模型版本,还可以适配移动端等不同终端及场景的应用需求。与此同时,商汤大模型在去年8月首批通过《生成式人工智能服务管理暂行办法》备案,生成式AI商业化得以迅速推进,广泛服务...……更多
昇思MindSpore 2.3全新发布
...专项技术支持和市场联合推广,支持更多伙伴从昇思迁移适配走向原生开发;昇思开源社区实习活动,通过代码实践,让开发者真正的实践成长。颁发昇思MindSpore杰出贡献导师和开发者作为Gitee-国内第一大开源代码托管平台,开...……更多
搞医学影像,为什么都青睐于CPU?
...ACS/RIS产品中,就采用了基于CPU的方案运行三维可视化、AI推理等工作负载。在三维可视化加持下,融合影像分析等技术,让医务人员通过旋转、缩放、分割、图像增强等操作,从多角度清晰了解到医学影像中各结构之间的空间位...……更多
云计算一哥终于搞多模态了:一口气6个大模型,还有个3nm芯片!
...mazon Nova Premier:亚马逊最强多模态大模型,可处理复杂的推理任务,也可用于蒸馏客户定制化的模型。在现场,Andy也晒出了Amazon Nova在CRAG、BFCL、VisualWebBench和Mind2Web等Benchmarks上取得的分数。从成绩中不难看出,其在检索增强……更多
豆包再降价,字节“饱和式”进攻仍在继续
...。如果说豆包在C端是不停地探索应用与用户付费意愿的适配度,那在用户付费意愿更强的B端,豆包的重点在于探索豆包大模型与客户的契合度。今年5月份,豆包已经确定了在B端的业务落地思路:火山引擎负责基座模型、开发...……更多
让AI无处不在 高通全面开启终端侧生成式AI大门
...效提升了40%。Hexagon NPU集成了硬件加速单元、微型区块推理单元、性能加强的张量/标量/矢量单元,同时所有单元共享2倍带宽的大容量共享内存。 这意味着用户在搭载第三代骁龙8的设备上可以按照自己的需要自由生成类似于...……更多
大模型步入推理Scaling时代,SambaNova如何挑战英伟达的霸主地位
...震。o1 能像人类一样「思考」复杂问题,拥有优秀的通用推理能力。在未经专门训练的情况下,o1 能够直接拿下数学奥赛金牌,甚至能在博士级别的科学问答环节上超越人类专家。在性能跃升之外,更重要的是,它揭示了大模型...……更多
火山引擎ai大模型赋能千行百业成趋势
...业务落地方面缺少实践经验,难以让大模型与业务更好地适配,应用效果也难保障,这些都造成企业在模型选型方面难以抉择。同时模型使用的成本也难以控制,包括模型训练和精调的算力成本、海量数据采集、清洗和标注的数...……更多
大模型推理乘上RISC-V快车?国内AI芯片创企推大模型系列一体机
...格以外,还由于其具备良好的可编程性,可以更加快速地适配各类不同参数的大模型,针对新衍生的不同模型结构、算子实现快速优化升级。除此以外,为了适应大模型推理的需求,希姆计算还从系统层面进行提升,通过服务器...……更多
无问芯穹夏立雪:破解算力焦虑,我做了大模型算力领域的“淘宝”丨36氪专访
...问芯穹」相当于在大模型和芯片之间,打造了一个更灵活适配的中间层,让百花齐放的大模型层和多元异构硬件层,实现统一部署。也可以这么理解,「无问芯穹」相当于做了一个大模型算力领域的“淘宝”,下游的大模型厂商...……更多
ChatGPT 火爆,程序员会不会被取代?答案都在这里!
...评测方法、大模型如何能持续学习、怎么显著提升训练和推理的效率这等。从左起:吴海涛、肖仰华、王文广、蒋涛、林咏华、于建岗、王千祥、王昊奋复旦大学教授肖仰华:大模型绝不仅仅是模型系统和算力,数据是非常重要...……更多
深耕AI框架创新土壤 华为打造开放计算生态
...研合作。作为支持大模型创新的“孵化器”,昇思已原生适配了50多个大模型。丁诚表示,同时有1700多名社区伙伴采用昇思框架,累积孵化了超过2000个解决方案,在互联网、金融、能源、交通等15个行业获得了广泛应用。南向使...……更多
当AI大模型卷向服务机器人,会有哪些新故事?|硬氪分析
...莫拉维克悖论提出,和传统假设不同,计算机要实现例如推理等人类所具备的高阶智慧、仅需少量的计算能力,而若要直觉、感知等能力,却需要巨大的运算能力。 简单来说,电脑可以在和人类围棋对弈中轻松取胜,但如果让...……更多
更多关于科技的资讯:
妻子称蔡磊双手臂完全瘫痪:身体状况持续恶化
快科技2月5日消息,蔡磊妻子段睿在接受采访时表示,过去一年,蔡磊身体情况持续恶化,如今全身肌肉严重萎缩,双手臂完全瘫痪
2025-02-05 21:42:00
21.88万元起!长城灵魂S2000摩托车第二批将于2月7日开售
快科技2月5日消息,2月7日14:00,长城灵魂S2000摩托车第二批将正式开售。该系列摩托车自去年11月开启大定,分批次发售
2025-02-05 22:12:00
【新春走基层】抓生产、赶订单!汇川多家企业春节不打烊,全力冲刺“开门红”
多彩贵州网讯 一边是热闹欢腾的节日场景,一边是热火朝天的赶工现场,春节期间,汇川经济发展热度不减,多家企业全力以赴抓生产
2025-02-05 22:54:00
MacBook到底比Windows好在哪 三个月使用体验分享
笔者用了十多年的Windows笔记本,小米笔记本已经用了五年的时间,一直在等新的小米笔记本。可惜的是,小米笔记本一直没有更新
2025-02-05 23:12:00
小米SU7内饰细节优化:主驾更软、后排更舒适
快科技2月5日消息,据媒体报道,小米SU7新款内饰进行了多项升级,但官方尚未正式公布。有博主发现,新款内饰材质从仿麂皮换成了皮质材料
2025-02-05 23:12:00
饺子导演名下多家企业已注销:共关联13家企业
快科技2月5日消息,据灯塔专业版数据,截至2月5日19时11分,影片《哪吒之魔童闹海》票房突破54.14亿元,超过《你好
2025-02-05 23:12:00
建议转存 远离肺癌肝癌从这些小习惯开始
快科技2月5日消息,据媒体报道,研究指出,肺癌、肝癌、胃癌、结直肠癌和食道癌是导致癌症死亡的前五位类型,占癌症死亡总数的 67
2025-02-05 23:12:00
价格接近400万元!法拉利首款纯电动车将于今年秋季发布
快科技2月5日消息,日前,法拉利首席执行官在财务业绩发布会上证实,法拉利首款纯电动汽车将于今年秋季发布,具体日期或为10月9日
2025-02-05 16:42:00
告别黄牛!任天堂为Switch 2大量备货:信心满满保障需求
快科技2月5日消息,任天堂即将发布的Switch 2游戏机备受玩家期待,而任天堂也正在积极准备,以确保这款新游戏机不会重蹈初代Switch因缺货而被黄牛囤积炒卖的覆辙
2025-02-05 16:42:00
舒适防臭耐磨:三枪中筒男女运动商务袜5双到手14.9元
天猫三枪袜品旗舰店,三枪中筒男女运动商务袜5双当前售价24.9元,限时限量10元券,实付14.9元包邮。款式简约百搭,舒适防臭又耐磨
2025-02-05 16:42:00
无人机避障黑科技横空出世!时速73km 夜间也能跟踪目标
快科技2月5日消息,据媒体报道,近日,中国香港大学科技团队研发的无人机自主避障技术,吸引了众多无人机爱好者的目光。据介绍
2025-02-05 16:42:00
轴距加长赶上X5 新一代国产宝马X3配置曝光:选装很丰富
快科技2月5日消息,近日,新一代国产宝马X3的相关消息曝光,包括部分配置。据悉,新车将将于2月上市,一季度开启交付,共三款车型
2025-02-05 17:12:00
中国联通首条自由空间光承载业务顺利开通:无需物理介质 跨湖高速传输
快科技2月5日消息,中国联通官方介绍,中国联通研究院联合江苏联通、蓝星光域对研发设备成果进行了现场验收,现场部署环境是跨湖1
2025-02-05 17:12:00
天钡GT37迷你主机首发5299元:锐龙AI 9 HX 370旗舰芯
快科技2月5日消息,天钡推出了新款迷你主机——天钡GT37,首发5299元。新款迷你主机采用硬朗的电竞外观,左右侧有斜切的通风开口
2025-02-05 17:12:00
国产科幻大片《流浪地球3》下月开机:网友喊话求加入我国6代战机
快科技2月5日消息,据国内媒体报道称,国产科幻大片《流浪地球3》将会在下月开机,预计2027年春节上映(此前官方已经宣布2027年大年初一上映)
2025-02-05 17:12:00