• 我的订阅
  • 头条热搜
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...er模型取得了比扩散模型更好的结果,只有900M参数,但在推理时间上比StableDiffusion1.4版本快3倍,比Imagen-3B和Parti-3B快10倍。下图是Muse与DALL・E2和Imagen的生成效果对比:文本-3D模型生成主要代表作有Dreamfusion、Magic3D……更多
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
...据具体询问的内容,模型只会激活不同的专家子模块进行推理,在吞吐量一定的情况下,可以更快地完成推理、给出回答。这让Grok-1拥有了更快的生成速度和更低的推理成本,简而言之就是更好的使用体验和性价比。根据xAI公布...……更多
阿里云通义千问主力模型价格直降97%,大模型商业化拐点已至
...大模型性能逐渐提升,AI应用创新正进入密集探索期,但推理成本过高依然是制约大模型规模化应用的关键因素。云厂商的降价策略,不仅是对当前市场的一次重大推动,更是对未来商业智能化转型的一次深远布局。阿里云智能...……更多
如何跑赢生成式AI竞赛?云计算大厂揭秘组合拳:自研大模型只是开胃菜
...胜在全面,有琳琅满目的大模型品类,还有加速从训练到推理的各种工具“套餐”,以及围绕平台、存储、网络、数据库的一系列升级……一切变动都指向一个目的,即让云客户更快更方便地用生成式AI产生价值。一、大模型货...……更多
华为联合WPS AI,见证昇腾大模型推理应用启航
...华为联合WPS AI等11 家生态伙伴及客户发布基于昇腾大模型推理解决方案的五大场景优秀实践,共同见证人工智能大模型在“文本生成、文生视图、辅助编程、终端应用、智能办公/客服”应用启航的历史时刻。昇腾大模型推理解...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
【新智元导读】TS-Reasoner是一个创新的多步推理框架,结合了大型语言模型的上下文学习和推理能力,通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估,有效提高了复杂时间序列任务的推理能力和准确性...……更多
收入占比40%、电话会议点名16次,英伟达:推理端的需求被低估了
...让人印象深刻的是,英伟达在财报电话会议的一个观点:推理端的爆发,可能很多人还是低估了。据英伟达电话会议披露,公司全年数据中心里已经有40%的收入来自推理业务,超出了绝大部分人预期。而在这次财报电话会议里,...……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
姚期智院士领衔,推出大模型新推理框架,CoT“王冠”戴不住了。提出思维图(DiagramofThought),让大模型思考更像人类。团队更是为这种推理过程提供了数学基础,通过拓扑斯理论(Topos Theory)正式化(formalize)DoT,确保其逻...……更多
清华开源混合精度推理系统MixQ:大模型近无损量化并提升推理吞吐
一键部署LLM混合精度推理,端到端吞吐比AWQ最大提升6倍!清华大学计算机系PACMAN实验室发布开源混合精度推理系统——MixQ。MixQ支持8比特和4比特混合精度推理,可实现近无损的量化部署并提升推理的吞吐。△图1 MixQ吞吐与已有...……更多
模型即服务,卓世科技MaaS平台 2.0 正式上线
...。本次新上线了包括:模型训练新基座,支持模型训练、推理、量化、评测等功能。 卓世科技MaaS平台是一款基于知识增强大模型的一站式行业模型训练开发平台。面向开发者和企业提供从基础算力服务、数据服务、模型训练服...……更多
腾讯Angel机器学习平台获世界互联网大会领先科技奖
...腾讯Angel 机器学习平台,突破了万亿级模型分布式训练和推理以及大规模应用部署等难题,率先实现大模型技术从底层硬件到关键软件技术的自主研发,在业务场景广泛应用,显著推动实体产业和数字经济发展,提升社会效率。...……更多
突破数据墙!27岁华裔MIT辍学创业8年,年化收入逼近10亿
...的合同工进行人工标注。他强调,来自专家的、包含复杂推理的数据是未来人工智能的必备条件。 传统的数据来源,比如从Reddit等社区的评论中抓取数据存在局限性。Scale AI构建了一些流程,模型先输出一些内容,例如撰写研...……更多
面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线
...在MMLU(多任务语言理解)、Knowledge(知识)、Reasoning(推理)、Comprehension(理解)等关键指标上均超越了Meta Llama 2的13B模型。这一个故事,在2024年2月1日的发布会上,也被AI模型层公司面壁智能的CEO李大海不断提起。对标Mistral..……更多
芯片集群「贵」出天际,10年内单个集群价值将达万亿美元
...求仍然很大。例如,GPT-3需要3x10^23flop的算力来训练,则推理需要3x10^11flop算力。FPGA和ASIC芯片是专为推理量身定制的,在运行人工智能模型方面,比使用GPU更高效。不过,在这股热潮中表现最好的还是英伟达。英伟达的主导地...……更多
专家模型不要专家并行!微软开源MoE新路径
...好,所以要在左上角: GRIN作为MoE架构,总参数量约42B,推理时激活的参数为6.6B,打同级别(7B)的非MoE模型是手拿把攥,甚至比14B的Phi-3还要略胜一筹。在上面的这份成绩单中,GRIN MoE表现优异,尤其是在编码和数学测试中。...……更多
pytorchtorchao正式发布,提供了一系列优化工具集
...将模型训练转换为float8,从而轻松实现模型高效训练。在推理方面,torchao提供多种量化方法,包括权重量化(Weight-OnlyQuantization)和动态激活量化(DynamicActivationQuantization),用户可以自有选择适合的量化策略,以获得最佳的模...……更多
戴尔科技:夯实AI时代“算力底座”,让每一分算力“物尽其用”
...供动力。这些AI大模型的创新性发展,无论是在训练还是推理阶段,都对算力提出了前所未有的需求。随着模型参数规模的显著增长,算力市场的供需关系面临日益严峻的挑战。特别是,训练和推理的算力需求正在以指数级的速...……更多
零一万物Yi-1.5来了,国产开源大模型排行榜再次刷新
... Yi-1.0 的持续预训练版本,使用 500B 个 token 来提高编码、推理和指令执行能力,并在 300 万个指令调优样本上进行了精细调整。刚一发布,就已经有开发者跃跃欲试:并收获了好评: 与前序模型相比,Yi-1.5 系列模型进一步提升...……更多
IBM开发新芯片为AI提速:消除片外内存,灵感来自大脑
...研究10月19日发表在《科学》杂志。北极点芯片采用神经推理结构,由简单计算单元组成的多层阵列通过编程来识别数据中的模式。底层接收数据,例如图像中的像素;每一个连续的层检测日益复杂的模式,并将信息传递给下一...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链(Chain-of-Thought)等技术正是由此产生的灵感。然而,可能很多人并没有意识到,很多对人类来说很简单的认知任务也往往伴随着非常复杂...……更多
国产大模型加速落地,争夺“中国版ChatGPT”心智定位
...技等也分别推出全新的大模型产品。李开复表示,大模型推理成本的下降会推动中国AI大模型进入”落地为王”的阶段,今年会迎来“大模型应用爆发元年”。他同时预测,明年下半年,随着大模型推理成本的大幅度下降,人们...……更多
NeurIPS 2024|水印与高效推理如何两全其美?最新理论:这做不到
... sampling)结合,在为大语言模型加入水印的同时,提升其推理效率,降低推理成本,因此适合用于大规模生产环境。这项研究发表在了 Nature 杂志上,给出了两种具体的结合方法,分别在水印检测效果和生成速度上达到了现有最...……更多
1行代码改进大模型训练,Llama训练速度升至1.47倍,华人团队出品
...是由四名华人学者共同打造的。第一作者Kaizhao Liang,是AI推理加速服务商SambaNova公司的一名高级ML工程师。在o1模型发布一周内,该公司就推出了一个类似o1模型思考过程的开源平替,主要作者正是Liang。其他三名作者是得州大学...……更多
小模型正在成为AI界的新宠
...算法,超越了同等大小和稍大一号的模型,在各种语言、推理、编码和数学基准测试中表现优异。苹果紧随其后,发布了 OpenELM,包含了 2.7 亿、4.5 亿、11 亿和 30 亿四个参数版本。与微软的 Phi-3 一样,OpenELM 也是一款专为终端设...……更多
腾讯推出新一代大模型「混元Turbo」,性能大幅提升,定价低50%
...元Turbo”。腾讯介绍,该模型采用MoE架构,比上一代产品推理效率提升100%,推理成本降低50%,解码速度提升20%。腾讯公司副总裁、云与智慧产业事业群COO兼腾讯云总裁邱跃鹏宣布,腾讯混元Turbo在腾讯云上线,输入和输出价格只...……更多
最强服务器CPU来了!AI性能直接翻倍
...器的重要性可谓是不言而喻,无论是对于大规模的训练、推理,亦或是RAG等任务,都对其提出了更高的要求。 也正如综合市场预测数据从侧面反应出来的那般: >AI服务器市场规模已经达到了211亿美元,预计2025年达到317.9亿...……更多
清华团队提出新型光计算架构,光训练速度提升1个数量级
...智能计算的“潜力股”,为后摩尔时代带来新的希望。 推理和训练是 AI 大模型核心能力的两个重要阶段,正是看到了这一点,该团队在推理和训练方面进行了同期的并行研究。今年 4 月,他们在 Science 报道了通用智能光计算芯...……更多
英特尔第五代至强可扩展处理器发布:AI推理性能提升42%!
...器,相比上代至强平均性能提升了21%,能效提升了36%,AI推理性能提升了42%,总拥有成本降低了77%!最高64核心,整体性能提升21%、AI推理性能提升42%、总拥有成本降低77%! 据介绍,第五代至强(Xeon)延续了上代的Intel 7制造工...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
...代模型在技术上可能解决目前ChatGPT中存在的事实性以及推理能力的缺陷,实现更精细的语义理解、多模态(文本、图像、语音、视频等)输入和输出,具备更强的个性化能力。”“人工智能的发展会更多瞄向通用人工智能,实...……更多
智能体首达Kaggle Grandmaster,华为结构化推理补齐思维链短板
...中的表现,研究者们提出了各种提示策略来提升大模型的推理和规划能力,比如思维链、思维树和思维图谱。这些进步与工具集成一起,推动着通用 AI 智能体的发展,让它们现在已经能够用 LLM 输出的决策策略来解决序列决策问...……更多
更多关于科技的资讯:
新技术多 新产品多 海外订单多 龙头企业杭汽轮展现“中国制造”力量与速度
1700多名工人全部到岗。“春节一过,汽轮机生产车间就全面复工,上线全年排产计划,生产订单稳中有升。”杭州汽轮动力集团股份有限公司副总经理邵建伟翻开厚厚一叠生产动态表
2025-02-14 07:55:00
近日,在太原海关所属晋阳海关报关大厅里,海关工作人员仔细核对市民潘女士携带宠物犬的申报信息后,对宠物犬扫描芯片并进行临床检查
2025-02-14 07:57:00
甄嬛传余莺儿扮演者被行拘 自爆无证驾驶逃逸:公开道歉我错了
快科技2月14日消息,近日,电视剧《甄嬛传》中余莺儿(余答应)的扮演者女演员崔漫莉在直播间自曝,其在浙江东阳市横店镇拍戏时曾酒后无证驾车并肇事逃逸
2025-02-14 08:21:00
M2版Mac mini比M4版还贵!苹果定价引发争议
快科技2月14日消息,在苹果美国官网,苹果开售官翻版Mac mini,因M4版本的价格比M2版本更便宜,其定价模式引发争议
2025-02-14 08:21:00
英伟达宣布RTX 5070显卡延期上市:从2月跳票至3月5日
快科技2月14日消息,在2025年CES展上,英伟达CEO黄仁勋正式发布万众期待的RTX 50系列显卡。首批共五款产品
2025-02-14 08:21:00
票房破100亿!韩国电视台种草《哪吒2》:好莱坞级特效 中国版漫威
快科技2月14日消息,日前,电影《哪吒之魔童闹海》票房(含预售)已达100亿元,成为我国影史首部百亿元票房影片。据媒体报道
2025-02-14 08:21:00
厦门网讯(厦门日报记者 林露虹)工信部近日公布“2024年工业领域数据要素应用场景典型实践案例”名单,共8个方向的73个案例入选
2025-02-14 08:41:00
谷歌Gemini宣布上线全局记忆功能:可回忆曾经所有对话
快科技2月14日消息,据报道,谷歌正式宣布其人工智能平台Gemini AI上线了一项备受期待的“全局记忆”功能。此创新功能赋予Gemini AI前所未有的能力
2025-02-14 08:51:00
2分9秒944最速量产车!小米SU7 Ultra刷新上海国际赛车场纪录 雷军:里程碑式跨越
快科技2月14日消息,今日,小米CEO雷军宣布,小米SU7 Ultra在上海国际赛车场跑出2分9秒944的成绩,成为上赛最速量产车
2025-02-14 08:51:00
亚马逊下订《指环王》第三季
续订并无悬念,但拖到现在才放行表明幕后并非一团和气。《指环王:力量之戒》第二季早在去年十月便播放完毕,结尾留有悬念:索伦在各条战线取得胜利
2025-02-14 08:51:00
英国强索苹果iCloud后门 iPhone用户瑟瑟发抖:美国发声
快科技2月14日消息,据国外媒体报道称,英国安全部门官员近来要求美国苹果公司创建所谓的“后门”,允许他们检索全球任何苹果用户上传到云端的所有内容
2025-02-14 09:21:00
硅谷一天上映27场 哪吒2上演DeepSeek时刻:强势冲击迪士尼大本营
势不可挡,哪吒驾临美国!硅谷影院一天上映27场本周开始,中国魔幻动画电影《哪吒2:魔童闹海》正式登陆北美市场(美国与加拿大)
2025-02-14 09:21:00
国家电网分析《哪吒2》引天雷威力:2800万度电!
2月14日消息,在电影《哪吒2》中,申正道施法引动天雷长达十余秒,这意味着什么呢? “国资小新”微博发文分析,现实中,雷电平均电流是3万安培
2025-02-14 09:21:00
性能、价格全方位碾压RTX 4060!AMD RX 7650 GRE首发评测
一、前言:提前迎接RTX 5060由于依旧使用和上代产品相同的台积电4N制程工艺(实际上是5nm),这一代RTX 50系相比上代的提升实在有限
2025-02-14 09:21:00
全球最薄折叠屏!OPPO Find N5入网:详细参数出炉
快科技2月14日消息,今天,工信部公布了OPPO Find N5(设备型号为PKH110)的证件照以及详细参数。据悉,OPPO Find N5外屏尺寸是6
2025-02-14 09:21:00