• 我的订阅
  • 头条热搜
阿里CEO吴泳铭:AI计算正在加速演进,成为计算体系的主导
...会变成智能机器人。5、未来几乎所有的软硬件都会具备推理能力,它们的计算内核将变成GPU AI算力为主、CPU传统计算为辅的计算模式。6、过去一年,阿里云投资新建了大量的AI算力,但还是远远不能满足客户的旺盛需求。7、人...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...比的G42和软银集团。2.能力达到奥数金牌级,DeepMind几何推理模型登上Nature,这个叫AlphaGeometry的模型在国际数学奥林匹克(IMO)的30道几何题中做出了25道,这一成就标志着AI在数学领域推理能力的史诗级升级。3.DeepMind首席科学家...……更多
一块GPU都没用,苹果自研大模型干翻GPT-4?
...参数。报告首次对AFM的模型架构、训练数据、训练过程、推理优化及评估结果进行了解读,并提到背后模型的训练采用的是累计10240颗谷歌TPU,而未提及英伟达GPU。根据论文描述,苹果自研大模型在指令遵循、文本总结方面测试...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
...其基础,看模型提出的声明是否有源文档作为依据- 数学推理:区分LLM生成数学解题方案的正确或错误- 编码:涵盖Python、JavaScript、Java、C++、Go和Rus等流行编程语言,训练FLAMe从备选答案中选出正确程序或修复程序- 安全性:为了...……更多
专注于推理的OpenAI“草莓”模型两周内发布?是人工智能下一重大突破
...“秋季发布”(9月至11月)要更早。上述报道称,专注于推理能力的人工智能“草莓”发布前后还有一些亟待解决的问题,但看似“仓促上马”似乎说明OpenAI感受到了大语言模型驱动产品领域的激烈竞争压力,希望通过近几个月...……更多
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
...据具体询问的内容,模型只会激活不同的专家子模块进行推理,在吞吐量一定的情况下,可以更快地完成推理、给出回答。这让Grok-1拥有了更快的生成速度和更低的推理成本,简而言之就是更好的使用体验和性价比。根据xAI公布...……更多
苹果公司公布“mm1”多模态大模型
...0亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。IT之家注意到,苹果研究团队相关论文主要是利用MM1模型做实验,通过控制各种变量,找出影响模型效果的关键因素。研究表明,图像分辨率和图像标记数量对...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...参数划分为多个组别而实现的计算的稀疏化,即每次执行推理任务时,根据对输入类型的判断,MoE模型会通过门控网络选择性地激活神经网络中最契合指令的专家参与计算。这种专业化、模块化的划分可以在提升预训练计算效率...……更多
...用更精准的“小模型”,在获得高质量回答的同时,节约推理资源、提升响应速度。有了上述的多种底层技术创新,基于CoE 架构的混合大模型在翻译、写作等 12 项指标的测试中取得了80.49分的综合成绩,超越了GPT-4o的69.22分;特...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...类型的信息:- 仅输入和输出文本,也就是少样本学习- 推理追踪:添加中间推理步骤,可参阅思维链(COT)提示- 计划和反思追踪:添加信息,教LLM计划和反思其解决问题的策略,可参阅ReACT 选择正确的适配方法要决定上述哪...……更多
大模型推理乘上RISC-V快车?国内AI芯片创企推大模型系列一体机
...并发、技术自主可控方面具有优势的新选择。AI大模型在推理侧的新机遇与RISC-V创新架构具有的可扩展性、可编程性、超大规模等优势特点不谋而合。技术和场景应用的双重优势下,希姆计算的大模型一体机能支撑企业将基座模...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链(Chain-of-Thought)等技术正是由此产生的灵感。然而,可能很多人并没有意识到,很多对人类来说很简单的认知任务也往往伴随着非常复杂...……更多
WOT全球技术创新大会2024北京站:探索AI 的无限可能
...一个视频创作平台,如何应对AI算力托管、AI模型治理、推理加速等方面的挑战?如果算力被“卡脖子”了,如何能让大模型平稳部署在信创设备上?对于小型团队来说,如果微调大模型还是门槛过高、流程过长的话,如何通过...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...大模型——跨越文本、 图像、 视频、 音频和代码的无缝推理。”谷歌官网上,这是介绍Gemini的第一句话。这是Gemini 1.0最重要的特点:一位更强大的“全科选手”。如果和OpenAI做对比,OpenAI的GPT-3.5一开始是纯文字的大语言模型...……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
...概念,提高了大语言模型(LLM,large language models)在复杂推理任务上的性能,例如算术推理、常识推理和符号推理等。图 | 金明宇(来源:金明宇)CoT 的原理是通过提供推理过程的示例,来教会模型处理推理,详细说明导致最...……更多
联想AI PC明年9月上市,黄仁勋苏姿丰同台宣布拓展AI合作
...大模型将使用存储在设备或家庭服务器上的个人数据进行推理。除非用户授权,否则用户的个人数据永远不会被共享或发送至公有云,从而确保了个人隐私和数据安全。 杨元庆表示,AI PC将在明年9月份左右正式上市销售,初期...……更多
NPU全球出货超1亿颗!芯原如何迎战大模型时代的边缘计算变革?
...C9X00AI是AI-GPU/AI-PC,Tensor Core GPU IP CCTC-MP则面向大语言模型推理、训练。芯原NPU IP研发副总裁查凯南谈道,NPU的发展近年来大概有三个方向:首先是DEEP AI,在很多嵌入式设备里面,要把AI跟其它的处理IP做比较紧耦合的绑定,可以...……更多
OpenAI又放大招,一文看懂Sora对AI领域的影响
...,Sora在训练时还借助了DALL·E3生成的高质量文本描述,在推理时借助了GPT对用户输入进行扩展,可谓“站在巨人肩膀上”更进一步。三、Sora对AI应用和算力需求带来哪些影响?对于应用而言,Sora生成的视频已经达到了大部分消费...……更多
amd推出10亿参数语言模型系列amdolmo
...ens进行预训练,让模型在处理自然语言任务时具有强大的推理能力。IT之家援引新闻稿,OLMo模型采用解码器(decoder-only)架构,并通过下一个标记预测(next-tokenprediction)进行训练,这种架构在生成文本和理解上下文方面表现出...……更多
以原创科技驱动发展 “迈向通用人工智能前沿科技成果展”将于1月28日举办
...,以原创的认知架构理论为顶层设计,由自研国产学习和推理框架(通用人工智能操作系统TongOS2.0和编程语言TongPL2.0)为底层支撑。她拥有类人价值观,能自主生成任务,具备物理和社会常识,可保障复杂任务高效执行,推理和...……更多
非Transformer架构站起来了!首个纯无注意力大模型,超越Llama 3.1
...长的上下文窗口。但是如果不相应地扩展计算资源,模型推理速度就会变慢,超过一定长度的文本就没法处理了。为了克服这些障碍,状态空间语言模型 (SSLM) 架构应运而生,该架构通过在处理单词时不断更新状态来工作,已成...……更多
终于拿到内测!豆包-PixelDance真是字节视频生成大杀器
...字,相当于一口气读完《三体》的前两部。文生图模型:推理效率和性能大幅提升火山引擎也将豆包文生图模型迭代到了 2.0 版本。其采用了更高效的 DiT 架构。模型的推理效率和性能都获得了显著提升。除了继承之前已有的高...……更多
推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型
...」。模型升级:Baichuan4-Turbo两张4090即可部署,Baichuan4-Air推理成本下降99%接下来,如何将Baichuan4-Turbo、Baichuan4-Air应用在实际场景中?从名字中不难看出,它们都是Baichuan 4系列基础模型的升级。对于企业来说,在不同场景阶段……更多
对话云天励飞董事长陈宁:2030年人类将实现AGI,推理芯片将是蓝海市场|钛媒体AGI
...拥有一个AI Agent。“如果说2024年是大模型落地应用之年,推理就会越来越重要。此前在训练芯片市场上,英伟达一骑绝尘,占有绝对的市场占有率,那么今天,推理芯片市场没有垄断性的巨头。这不仅是万亿级、万亿颗芯片的蓝...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
新智元报道编辑:乔杨【新智元导读】LLM的数学推理能力缺陷得到了很多研究的关注,但最近浙大、中科院等机构的学者们提出,先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种...……更多
架构优先、先易后难,华为的制造业生成式AI方法论
...业需要构建强有力的ICT基础设施,尤其是大模型的训练和推理,都对基础设施提出了更高的要求,要实现“存算云网能”的全方位协同。 在算力方面,华为的智能计算芯片和通用计算芯片,正在成为世界算力的第二选择。前者...……更多
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...凡的性能而获得了前所未有的关注。然而, LLM 的训练和推理成本高昂,人们一直在尝试通过各种优化方法来降低成本。本文来自上海算法创新研究院、北京大学等机构的研究者受人类大脑记忆层次结构的启发,他们通过为 LLM ...……更多
OpenAI o1太贵?那就自己做一个!纯提示方法让普通LLM进化出复杂推理能力
...爆火,利用纯提示方法让普通LLM摇身一变,成为具备复杂推理能力的OpenAI o1。九月份,OpenAI o1正式登场。作为新一代的老大哥,o1系列专注于复杂的推理任务,一经推出也是直接屠榜了大模型竞技场。在下面这些难度较大的数学...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...布了两篇新的研究论文,介绍了 3D 头像和高效语言模型推理的新技术,被认为可能带来更身临其境的视觉体验,并允许复杂的人工智能系统在 iPhone 和 iPad 等消费设备上运行。 AI 社区中的许多人后来才注意到 Ferret 的发布,他...……更多
前谷歌科学家Yi Tay「LLM演义」系列博客第一弹:BERT为何匿迹江湖?
...成为一名称职的LLM研究者和从业人员,利用归纳偏差进行推理的能力都是必不可少的。而了解不同模型架构之间基本的细微差别有助于未来的不断创新。Yi Tay分享了他的主要收获:encoder-decoder和decoder-only模型都是自回归模型,但...……更多
更多关于科技的资讯:
搭载5代EA888+华为智驾!上汽奥迪A5L官图更新:二季度上市
快科技2月25日消息,日前,上汽奥迪发布了一组全新A5L的官图,该车有望于2025年二季度上市。据悉,该车延续海外版A5 Sportback的轿跑式车身设计并进行了加长
2025-02-25 18:34:00
FSD突然降临中国!不同车型逐批推送 老车主苦等多年终梦圆
FSD入华,官宣了。盼星星,盼月亮,特斯拉中国车主等到了FSD,行业迎来了最强鲶鱼。全民智驾元年,冲刺L3的当口,对岸的独孤求败终于对上了国内的智驾群雄
2025-02-25 18:34:00
中端显卡大战临近!RTX 5070评测3月4日解禁:RX 9070仅晚一天
快科技2月25日消息,NVIDIA和AMD的最新一代中端显卡即将展开正面交锋。根据最新消息,NVIDIA的RTX 5070显卡评测将于3月4日解禁
2025-02-25 18:34:00
全面不鸟英伟达!曝小鹏自研图灵芯片5月上车
快科技2月25日消息,雷峰网援引知情人士消息,小鹏汽车自研芯片将在今年5月份实现首次上车。报道指出,今年5月底或6月初
2025-02-25 18:34:00
遭大量嘲讽贬低!EDG发布严正公告:立刻停止侵权行为
日前,EDG官方发布严正公告,表示已委托专业法律机构,对近期在各个网络平台上嘲讽贬低、言语攻击其俱乐部选手的主导侵权用户启动相关法律程序
2025-02-25 18:34:00
vivo注册V单商标:曝vivo X200 Ultra影像比肩专业相机
快科技2月25日消息,天眼查显示,vivo申请注册“V单”商标,目前商标状态是“等待实质审查”。博主数码闲聊站爆料,vivo X200 Ultra走了专业相机的思路
2025-02-25 19:04:00
OpenAI创始人又要引爆生育革命:两个爸爸如何生育一个孩子
就在上周日(2月23日),世界顶级人工智能研究公司OpenAI的创始人山姆·奥尔特曼(Sam Altman)在社交媒体上宣布
2025-02-25 19:04:00
追上华为理想和小鹏 小米全量推送端到端高阶智驾:车位开到车位
快科技2月25日消息,高阶智驾无疑是当前的核心竞争领域,第一梯队玩家华为、小鹏、理想等已经全量推送车位到车位的端到端高阶智驾
2025-02-25 19:04:00
山东空调品牌争霸赛启幕 格力、海尔、美的等品牌谁将脱颖而出?
齐鲁晚报·齐鲁壹点 张召旭 实习生 白杨春意盎然之际,山东空调市场战火再起,各大品牌纷纷亮剑,誓要在三四月份激烈的市场竞争中拔得头筹
2025-02-25 19:38:00
工业人机交互迈入韧性升级时代!益逻科技发布64系列触控显示器
随着工业4.0进程加速与商业智能化需求激增,全球制造业正面临严峻挑战:设备稳定性不足导致产线停机损失年均超百亿美元,传统触控设备在高温
2025-02-25 19:45:00
不推荐买iPhone 16e:看完拔草了
北京时间2月20日凌晨,苹果在万众期待下带来了新品—iPhone 16e,没错,就只有这一款手机,售价为4499元起,将于2月28日正式发售
2025-02-25 20:34:00
消费是拉动社会经济增长的引擎,也是推动高质量发展的重要保障。宁津农商银行聚焦“扩内需、促消费”政策指引,持续打好产品创新和服务优化“组合拳”
2025-02-25 20:52:00
2月25日从晋源区获悉,为进一步激发消费市场活力,近日,太原市总工会、晋源区总工会、晋源区商务局携手京东家电家居,在晋源区万水大市场共同举办工会会员家电普惠活动
2025-02-25 21:01:00
2025款ROG幻14/16 Air笔记本发布:锐龙AI 9 HX 370/Ultra 9-285H双龙会
快科技2月25日消息,2025款ROG幻14/16 Air笔记本今日正式发布,最高可配RTX 5080显卡。2025款ROG幻14 Air笔记本外观方面
2025-02-25 21:04:00
RTX 5090、双雷电5加持!ROG最强显卡扩展坞发布
快科技2月25日消息,今天,华硕正式发布了新一代显卡扩展坞ROG XG Mobile 2025,集成NVIDIA RTX 5090移动版显卡
2025-02-25 21:04:00