• 我的订阅
  • 头条热搜
北大林宙辰团队全新混合序列建模架构MixCon:性能远超Mamba
...领域中,序列建模是一项至关重要的任务。然而,现有的模型在捕捉长程依赖关系和高效建模序列方面仍面临诸多挑战。因此,北京大学林宙辰、徐鑫提出了一种全新混合序列建模架构 ——MixCon,它为解决这些难题带来了创新...……更多
一毛钱写两本红楼梦,智谱AI再降价,已服务30万企业用户
...用多种不同的智能体协同工作。清言可以调用思维导图、流程图、数据分析等多个不同智能体,同时接入微博、飞书、日历等平台工具。图源:智谱AI 智谱AI举了不少有趣的案例。一位9岁的小男孩,与智谱清言合作,写出了一...……更多
一年投入数十亿,手机厂商抢滩大模型 | 焦点分析
...——有行业人士对36氪测算,一次大模型云端计算的最低成本是一分二人民币,若3亿用户每天用十次,意味着手机厂商一年要凭空多出一百多亿的支出。而相比之下,端侧计算成本更可控,并且由于数据不用上云,安全隐私性更...……更多
Llama 4训练已开启!Meta科学家最新采访,揭秘Llama 3.1是如何炼成的
...中有多少合成数据?为什么不使用MoE架构?后训练与RLHF流程是如何进行的?模型评估是如何进行的?我们什么时候可以见到Llama 4?Meta是否会发展agent?恰逢Llama 3.1刚刚发布,Meta科学家就现身播客节目Latent Space,秉持着开源分享...……更多
OpenAI悲喜两重天:ChatGPT大火 亏损却翻倍了
...作出回应。但从CEO Sam Altman此前的发言来看,openAI的研发成本确实相当夸张,且商业化前景尚未明朗。据此推出,亏损放大的传闻并非空穴来风。在业内,大模型训练成本高是一个共识。一般来说,训练成本主要和参数量挂钩。...……更多
2025开年 黄仁勋扔出一串王炸
...000万亿次tokens和2000万小时视频的训练。“物理AI模型开发成本高,需要大量真实世界数据和测试,Cosmos为开发人员提供了一种简单的方法来生成大量基于物理的合成数据,以训练和评估模型。开发人员只需提供一个文本描述,Cos...……更多
一行代码训练成本再降30%,AI大模型混合精度训练再升级
...模型训练中提高训练速度、节省内存占用,最终降低训练成本。AI大模型开发系统Colossal-AI的混合精度训练再度升级,支持主流的BF16(O2) + FP8(O1)的新一代混合精度训练方案。仅需一行代码,即可对主流LLM模型能够获得平均30%的加...……更多
36氪首发|「Tiamat」完成近千万美元A轮融资,想将AI生成图像的可控性做到极致
...因此,在数据清洗和数据选择这一方面,大厂要去经历的流程和创业公司没有太大区别。当然也不排除大厂有更好的驱动力和更多擅长数据清洗的人。但从我们的技术视角来说,我们平时会开玩笑说,其实并不担心大厂突然做一...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
...具备较强的通用能力,可完成多场景任务,显著降低学习成本、提高学习效率。2020至2022年,迎来了模型之战。GPT-3(拥有1750亿参数)是这一战的起点,随后全球范围内掀起了一股大模型研究的热潮,谷歌、Meta等公司开始不断发...……更多
训练一次ChatGPT,“折寿”3000辆特斯拉
...nAI的总支出是5.44亿美元。国盛证券估算,GPT-3的单次训练成本就高达140万美元,对于一些更大的LLM(大型语言模型),训练成本介于200万美元至1200万美元之间。其中,“大模型训练成本中60%是电费,”华为AI首席科学家田奇在近...……更多
pytorchtorchao正式发布,提供了一系列优化工具集
...举例,在LLaMA370B模型的预训练中,torchao提供的float8训练流程可将模型计算速度提升1.5倍。开发者只需利用convert_to_float8_training函数,即可将模型训练转换为float8,从而轻松实现模型高效训练。在推理方面,torchao提供多种量化方...……更多
自研芯片三国杀,头部智驾新战场,蔚小理谁强?
...周期的行业,研发周期最少需要2 - 3年。除了高昂的研发成本外,后续还要投入巨额的流片费用,单次流片的成本至少需要几千万元,如果要设计一颗5nm的芯片,最终的研发成本可能高达20 - 30亿元。除了高额的投入之外,还要面...……更多
OpenCity大模型预测交通路况,零样本下表现出色,来自港大百度
...,开发适用于不同城市的时空模型将显著降低部署和维护成本。解决空间泛化挑战对于创建可以在不同城市环境中无缝部署,无需大量重新训练或微调的交通模型至关重要。第二个挑战是时间泛化与长期预测。当前的交通预测模...……更多
百川智能发布baichuan3稳定语言模型
...帮助患者获得更好的服务和体验,还能帮助社会降低医疗成本和风险,助力医疗资源实现普惠和平权。并且医疗问题专业性强、知识更新速度快、准确性要求高、个体差异大,能充体现大模型的各项能力,被百川智能称为“大模...……更多
...求索公司的DeepSeek-R1等,但此类尝试意味着企业可以较低成本研发出适合自身的AI应用,AI普惠性有望增强。同时,其所应用的“测试时扩展”技术或代表一条更可持续的AI研发路径。低成本玩转高级推理美国斯坦福大学和华盛顿...……更多
本周(4.8-4.14)AI界发生了什么?
...能提高了 170%,推理能力提高了 50%,效率提高了 40%,且成本更低,但英特尔并未与英伟达最新的 Blackwell 系列产品进行对比。谷歌发布Transformer新架构,解决大模型“内存”问题4月12日消息,谷歌发布下一代Transformer模型Infini-Tran...……更多
全球首个!中国电信完成千卡、千亿参数模型500公里联合训练试商用
...有效解决了长距离传输中网络拥塞丢包、链路故障、建网成本等问题,确保了训练过程的稳定性和高效性。在500公里的长距离传输下,网络传输吞吐率仍能保持在较高水平,为千卡千亿参数商用大模型的联合训练提供了坚实的网...……更多
商汤如何玩转大模型+大算力?详解“日日新SenseNova”大模型体系的关键招
...优化,结合自研模型及训练能力,用户可免除本地化部署流程,并基于开源模型自训练模型,高效地生成更多样的内容。技术交流会现场,徐立不仅演示了基于商汤自研AIGC模型的作图(MH team作品),也介绍了用户可导入开源模...……更多
meta、cmu联手推出6-dof视频表征方法
...体验。最近,由Meta和卡内基梅隆大学提出的6-DoF视频表征模型——HyperReel,可能预示着一个全新的VR「杀手级」应用即将诞生!所谓「六自由度视频」(6-DoF),简单来说就是一个超高清的4D体验式回放。其中,用户可以完全「置...……更多
英伟达带来最强AI芯片,但赶超苹果又远了一步?
...,是H100(4 petaflops)算力的5倍。性能提升的同时,B200在成本和能耗上,相比H100,最高可以降低25倍。叠加B200搭配的8颗HBM3e内存,最大可支持10万亿参数模型的训练。作为对比,OpenAI的GPT-3模型参数为1750亿,据黄仁勋透露,GPT-4...……更多
生成式AI时代的业务流程管理变革,BPM迎来大型流程模型
当生成式AI遇到业务流程管理,大语言模型正在变革BPM生成式AI时代的业务流程管理变革,BPM迎来大型流程模型从大语言模型到大流程模型,生成式AI带来的BPM范式转变基于价值链的生成式AI流程应用,探索LLM影响BPM的另一种方式...……更多
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
...型,但OpenAI也知道如何训练小模型」。小模型,优势在于成本低、速度快、更专业,通常只使用少量数据训练,为特定任务而设计。大模型变小,再扩大规模,可能是未来发展的趋势之一。 前两天,在GPT-4o mini发布时,Andrej Karp...……更多
科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力
...端进行部署。随着大模型参数规模的逐渐增大,对于计算成本和存储成本的消耗也随之增加。尤其是 GPT-4 或千亿以上参数级的超级大模型,训练成本相当高昂。因此,目前的研究方向之一便是:如何针对模型进行高效压缩,以...……更多
openai开始招聘安卓、苹果ios工程师
...1750亿个参数的GPT-3因其巨大的每秒浮点计算量,单次训练成本达到460万美元。如果使用英伟达A100芯片,单次训练的使用量应达到数百片,成本在3000万元人民币左右。细数一下,第一代GPT-1诞生于2018年6月,训练参数量为1.2亿个,...……更多
百度All in的大模型何时能赚钱?
...模型与CRM数据相结合,能适应实时变化的客户信息和公司流程,可在销售、服务、营销、商业等各个领域提供人工智能自动创建的内容。而AI Cloud作为其延续,支持代码生成和业务流程自动化等功能,客户可以将个性化训练的模...……更多
商汤生成式AI业务飙涨256%,成为中国大模型、智算服务市场占有率领头羊
...需要真正为客户创造价值。用得好,需要进入客户生产和流程中去。用得起,需要大幅降低训练、推理和部署成本。”展望未来,在以实用为目标的价值导向下,商汤势必将会深入更多垂直行业,进一步拓展应用场景,释放AI技...……更多
紫东.太初再进化,揭秘全模态大模型的想象力
...模态的统一表征和学习,更接近人类的学习方式。其次是成本。ChatGPT刚刚走红的时候,不少人在讨论OpenAI的训练成本,据悉GPT-3训练一次的硬件和电力成本高达1200万美元,由此出现了这样一种流行说法:每一个大模型都是一台...……更多
AMD的GPU跑AI模型终于Yes了?PK英伟达H100不带怕的
...,MI300X GPU 绝对能比肩 H100 GPU,而根据 The Information 对 GPU 成本及系统总成本的估计,说 MI300X GPU 能媲美 H100 和 H200 GPU 也不为过。但是,也需要说明这些测试存在局限:仅使用了一种模型,即来自 Meta 的 Llama 2……更多
骁龙8至尊版混合架构、成本揭秘:更贵是不可避免的!
...5.3GHz内存在短期内的采用率会相对低,因为它相对更新,成本也更高,到了明年可能会有所不同。AI方面,骁龙8至尊版大幅提升了NPU的性能和AI的运用,比如NPU可以在后台灵活调度大语言模型的推理。这正是Hexagon NPU架构设计的...……更多
还在人工炼丹?自动提示工程指南来了,还带从头实现
...篇长文,详细介绍了自动提示词工程的概念、原理和工作流程,并通过代码从头实现了这一方法。自动提示词工程是什么?自动提示词工程(APE)是指自动生成和优化 LLM 提示词的技术,目标是提升模型在特定任务上的性能。其...……更多
更多关于科技的资讯:
杨紫跳舞视频成各地文旅宣传神器:魔性舞蹈走红全网
3月5日消息,据媒体报道,近日演员杨紫在短视频平台上发布了一段舞蹈视频,因舞姿“魔性”、音乐动感而走红全网,这条视频点赞量已经突破300万
2025-03-05 00:11:00
大溜背神似奥迪A7!小鹏全新轿跑谍照曝光:代号E29
快科技3月4日消息,日前,网上曝光了小鹏代号E29的全新车型谍照。从图中可以看到,小鹏新车展现出修长的车身轮廓,前脸设计呈现出X型布局
2025-03-05 00:11:00
长安启源累计交付突破20万辆:2月交付7931台
快科技3月4日消息,长安启源宣布累计交付量已突破20万辆,2月份交付量达到7931辆。长安启源Q07作为全新平台的力作
2025-03-05 00:11:00
iPhone 16e不支持MagSafe充电 苹果解释原因
快科技3月5日消息,iPhone 16e不支持MagSafe充电,苹果工作人员回应称,iPhone 16e的目标群体大多使用有线充电
2025-03-05 00:41:00
399元!苹果官网上架iPhone 16硅胶保护壳新配色
快科技3月5日消息,昨晚,苹果发布了iPad新品,同时还为iPhone16系列手机推出了4款全新配色的硅胶保护壳,分别为淡蓝紫色
2025-03-05 07:11:00
已站稳中国市场!卢伟冰:小米汽车希望2027年正式出海
快科技3月5日消息,在MWC2025期间,小米集团合伙人、总裁卢伟冰透露,希望小米汽车在2027年能够官方正式出海。卢伟冰表示
2025-03-05 07:11:00
最新安卓手机好评榜出炉:华为Mate 70 Pro+稳居榜一
快科技3月5日消息,近日,安兔兔最新公布了2月安卓手机好评榜单,华为手机表现尤为突出,强势霸榜前二。在这份备受瞩目的榜单中
2025-03-05 07:11:00
华为发布全球数据存储创新中心:坐落于全球6个国家
快科技3月5日消息,MWC25巴塞罗那期间,华为发布全球数据存储创新中心,为全球客户和伙伴提供一个数据存储解决方案的技术平台
2025-03-05 07:11:00
国际机构纷纷看好中国经济
本文转自:人民日报海外版本报记者 李 婕近日,来自京津冀地区的超4000辆国产自主品牌汽车从天津港环球滚装码头启航,驶向南美等海外市场
2025-03-05 04:46:00
本文转自:人民日报海外版全国政协委员、中国工程院院士 陈晓红当前,人工智能(AI)技术的快速发展受到全世界的关注。从2025年1月举行的全球消费电子展来看
2025-03-05 04:49:00
人工智能需全链条布局 江西正攻关元宇宙核心算法
为切实倾听百姓声音,汇聚民智推动江西发展,2月20日—3月2日,“问计江西”平台发起“问计两会·百姓关心事代表委员答”建言征集活动
2025-03-05 04:51:00
近日,广州市政务服务和数据管理局在政务外网正式部署上DeepSeek-R1大模型,通过融合海量政务数据要素,拓宽政务服务应用场景
2025-03-05 05:56:00
新质曲阜|助力汽车电子产业集群扩能,曲阜这个项目有盼头
齐鲁晚报·齐鲁壹点 易雪 通讯员 岳雷霆 刘康近日,在位于曲阜经济开发区的曲阜天博汽车电器新建年产5000万套智能电声产品研发制造项目现场
2025-03-05 07:22:00
13岁留守女孩脊柱侧弯80度:变形严重
3月4日消息,据媒体报道,一名13岁留守女孩的脊柱弯曲,经医生诊断,女孩的脊柱已经侧弯到80度,变形严重。据了解,这名女孩平时由爷爷奶奶照顾
2025-03-04 20:41:00
纯白机身颜值惊艳!魅族神秘新机现身MWC:魅友猜测是魅族22
快科技3月4日消息,在2025世界移动通信大会(MWC)上,星纪魅族带来了三款机型,分别是魅族Note 22、魅族mblu 22和魅族mblu 22 Pro
2025-03-04 20:41:00