• 我的订阅
  • 头条热搜
ChatGPT一周年|炼制大模型芯片短缺数据有限,何以解忧?
...市值突破万亿美元,其领先市场的GPU(图形处理器)和高性能计算设施被全球科技企业争相抢购。“现在业内最好的(AI)芯片是英伟达的。”云知声智能科技股份有限公司董事长兼CTO梁家恩告诉澎湃科技,尽管也存在一些挑战...……更多
Token化一切,甚至网络!北大&谷歌&马普所提出TokenFormer
...练,只用十分之一的数据就可以达到从头训练策略相近的性能,让模型可以不断迭代,真正地活起来了。Language Modeling:如下表所示,研究团队比较了 Transformer-based 的模型和 TokenFormer 在语言建模上的能力。在相同规模、相同模...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...高效利用人类演示数据,机器人系统可以实现更高水平的性能和适应性,使其更能在动态环境中执行复杂任务。(3)复杂环境认知。复杂环境认知是指具身智能体在物理或虚拟环境中感知、理解和导航复杂现实世界环境的能力...……更多
开源证券:多模态模型再迎新突破,继续布局AI应用及算力
...种中型多模态模型,针对多种任务的扩展进行了优化,其性能水平与谷歌迄今为止最大的模型1.0Ultra类似。谷歌增加了1.5Pro的上下文窗口容量,该大模型现在可以在生产环境中运行多达100万个token。这意味着1.5Pro可以一次性处理...……更多
可量化灵巧度指数的灵巧手问世!中国团队用“量化体系”撕破“伪灵巧”困局
...握与掌内操作泛化能力等)三大指数,重新定义灵巧手的性能评估标准。在推进硬件技术突破期间,灵巧智能的研发团队意识到单纯追求\"高自由度\"并无意义,存在设计冗余、可靠性降低与能耗失衡的局限。而“灵巧度指数量...……更多
从春招市场看人工智能产业人才供需(经济新方位·从就业看产业)
...最多的行业是人工智能。“一方面,要对现有大模型进行性能调优及工程化落地,通过技术创新降成本;另一方面,需突破具身智能、多模态融合等技术瓶颈。这些技术需求,带动了算法工程师等岗位的招聘需求。”杨铭说,“...……更多
全球几十种大模型评测,如何甄别可信度?
...据集上表现得非常好,但在实际应用中却无法达到同样的性能。此外,由于提示词等各种客观因素,大模型评测确实面临很多现实的挑战,为了确保评测结果的公正性和可靠性,智源也采取了一系列措施来避免大模型在评测中刷...……更多
推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型
...础模型的升级。对于企业来说,在不同场景阶段,对模型性能和成本要求各不相同。 在复杂场景探索阶段,他们更加关注模型性能、部署成本。而在已验证过的大规模落地阶段,他们更侧重模型推理成本、响应速度。这次新发...……更多
NeurIPS | 消除多对多问题,清华大规模细粒度视频片段标注新范式
...这可能会干扰模型对精确时刻定位的能力,进而影响整体性能,未来研究应该关注如何有效分离视频级别和片段级别的学习,并合理引入细粒度信息。图 5:细粒度 VCMR、VR 实验结果图 6:细粒度 SVMR 实验结果为了说明该研究的细...……更多
千行百业加速拥抱大模型(AI前沿观察)
...础设施建设提速行动方案(2023—2025年)》提出,实施高性能算力提升工程,加快建设郑州、洛阳等全栈国产化智能计算中心,构建中原智能算力网。在“东数西算”战略背景下,西部智算中心建设迎来发展机遇期。11月30日,青...……更多
中兴通讯新一代智算整体解决方案揭幕,引发业界关注
...模模型训练设计的旗舰GPU服务器——R6900G5,以其卓越的性能和创新的设计,吸引了众多参展者的目光。#中兴通讯绿色算力主力军#R6900G5GPU服务器不仅具备高安全性和高能效等优势,还拥有强大的计算能力和对复杂模型的训练支...……更多
首个VR端3D角色扮演AI发布!南洋理工公开SOLAMI技术报告,端到端VLA模型驱动,唱跳都能陪你玩
...进行沉浸式互动。该系统利用先进的社交视觉-语言-行为模型,结合合成的数据集,提供更自然的交流体验,超越了传统的文本和语音交互。世界上第一个VR端 3D版的角色扮演AI就在刚刚诞生了!AI角色扮演类游戏(如C.AI、Talkie)...……更多
刚刚,三名谷歌Vision Transformer作者官宣加入OpenAI
...确性。 另外,他们也为 ViT 开发了一些改进版本,对其性能或效率等不同方面进行了优化,比如能适应不同图块大小的 FlexiViT,参阅论文《FlexiViT: One Model for All Patch Sizes》。他们也探索了另一些架构创新,比如他们在论文《MLP-M...……更多
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...在谷歌官网联名发文,宣布推出这一万众瞩目的多模态大模型。标题明晃晃写着“最大”、“最强”,主打的就是一个干爆GPT-4。具体来说,此次谷歌一共带来了Gemini的三个版本:Gemini Ultra:谷歌最大、最强模型,适用于高度复...……更多
本周硅谷发生了什么?| 高通第三代骁龙8;谷歌20亿美元追投Anthropic;联想拿出能跑大模型个人PC
...峰会推出了一系列产品,包括全新的骁龙X Elite Oryon CPU,性能超越苹果的M2 Max和英特尔的i9-13980HX。搭载骁龙X Elite的PC能够拥有130亿参数的大模型,即使在无网络环境下也能执行多种任务,如生成PPT和图像编辑。同时,高通还发布...……更多
2025腾讯全球数字生态大会:腾讯云互联网行业“云+AI”全栈产品,加速行业AI应用落地
...生活中获得更自然的情绪交流与心理支持。腾讯云提供高性能基础设施,支撑更快的大模型训练与推理,同时保障多端部署的稳定性与高效能,助力“测测”实现规模化服务。 金山办公助理总裁田然介绍了WPS在办公智能体上的...……更多
阿里多模态检索智能体,自带o1式思考过程!复杂问题逐步拆解
...在一系列基准数据集上的实验中,OmniSearch展现了显著的性能优势。特别是在处理需要多步推理、多模态知识和快速变化答案的问题时,OmniSearch相较于现有的mRAG方法表现更为优异。目前OmniSearch在魔搭社区还有demo可玩。动态检索...……更多
...构)以及MTP(多token预测)等多种技术手段,显著提升了模型性能和训练效率。这些技术不仅有望被各家企业借鉴,以加速智驾模型的训练速度并降低训练成本,还可能直接替代此前车企选择的VLM/VLA(视觉语言模型/视觉语言动作模型)...……更多
扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff
...上的复杂性。时间复杂性。空间复杂性。 实验模型整体性能比较团队比较了团队的模型与基线模型的整体推荐性能。top-20和不同top-N的验证结果列于下表:团队的RecDiff始终优于最先进的基线,展示了卓越的推荐准确性。T 检验...……更多
李彦宏:大模型场景下开源是最贵的,多模态是通往AGI的必经之路
...率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。会上,百度发布了文心大模型4.0的工具版,该工具版可以让开发者体验代码解释器功能,开发者不仅可以通过自然语言交互...……更多
百度智能云两大基础设施再升级!打造AI时代最开放的智能基础设施
...地亟需从底层算力到应用的全栈、系统级支撑——既需高性能硬件与集群优化,也需灵活的开发工具链与场景化解决方案。基于多年在大模型研发与产业落地的深厚积累,百度智能云构建了新一代系统级智能基础设施,为企业大...……更多
华为AI存储助力中国移动构建超大规模智算集群
...第 18 版)大模型领域普遍存在规模化定律,即大模型的性能深受模型参数量、数据集大小以及训练算力规模三要素的影响。生成式AI的运行主要基于深度学习原理,其发展离不开海量数据信息的投入。面对智算集群目前存在的可...……更多
谷歌 VS OpenAI:当搜索霸主和屠龙少年迈入同一条河流
...态基准测试中,对标GPT-4V,Gemini Ultra 也展现出了先进的性能。图源:谷歌新闻稿在chatGPT发布一周年之际,谷歌通过 Gemini 赶了个晚集,想要再度证明自己在AI时代「霸主候选人」的实力。而OpenAI 和谷歌,一个是经历了「宫斗」...……更多
vivo发布自研蓝心大模型及蓝河操作系统、OriginOS 4
...、响应时间、内存占用等方面也非常优秀,实现了安全与性能的双重并举。700亿模型是面向云端服务的主力模型,其综合能力,在C-Eval、CMMLU、SuperCLUE(10月)等榜单中均处于中文大模型的第一梯队。另外1300亿、1750亿模型也将在...……更多
山东数文集团两款大模型亮相全省“人工智能+”创新应用工作会议
...,并牵头构建全国首个主流文化语料库,推动 AI 模型的性能跃迁与文旅产业发展。下一步,山东数字文化集团将继续推进山东省文化数字化行动计划,全面探索文化和科技融合的有效机制,深入推进文化体制机制改革,引领山...……更多
开源社区分水岭:Meta大模型Llama 3发布,参数最高或达4000亿
...ta介绍,Llama 3已经在多种行业基准测试上展现了最先进的性能,提供了包括改进的推理能力在内的新功能,是目前市场上最好的开源大模型。在架构层面,Llama3选择了标准的仅解码(decoder-only)式Transformer架构,采用包含128K token...……更多
阶跃星辰李璟:多模态是AGI的必经之路,视觉模型可按语言模型路线实现大一统
...璟发表主题演讲《迎接视觉领域的GPT-4时刻》,分享了大模型技术和应用层面的思考。他表示,今年以来大模型厂商密集的模型发布,意味着追求智能的上限仍然是当下最重要的事情。“我们始终认为多模态对AGI的实现非常重要...……更多
智谱AI新大模型来袭:部署价格大降50%,免费商用,做应用能力逼近GPT3.5 | 最前线
...机和汽车上。CEO张鹏介绍,ChatGLM3主要在4四个方面进行了性能提升:接入了具有多模态理解能力的模型CogVLM,提升看图识语义能力。接入了代码增强模块 Code Interpreter,能根据用户需求生成代码并执行,自动完成数据分析、文件...……更多
本周(4.8-4.14)AI界发生了什么?
...飙升,大涨超4%,约 1120 亿美元。英特尔发布新AI芯片,性能超越英伟达H100当地时间4月9日,英特尔Vision大会上发布新一代 Gaudi 3 AI 芯片。新款 Gaudi 3 与英伟达 H100 相比训练性能提高了 170%,推理能力提高了 50%,效率提高了 40%,...……更多
加速落地 京东云大模型已支持数百个场景
...技术加速大模型应用大模型落地应用的关键,是在资源、性能、效果三者取得一个比较好的平衡点。京东云自研推理引擎,协同大小模型,为大模型产业落地提供最佳实践,如通过利用推测解码,用小模型辅助大模型进行推理,...……更多
更多关于科技的资讯:
从迷失到笃行:一位古贝春经销商的二十载商海沉浮与顿悟
鲁网11月27日讯(记者 赵洪斌)在鲁北商业版图上,王文俊的名字与古贝春酒业紧紧相连。然而,这段长达二十余年的合作关系
2025-11-28 08:45:00
近日,广东宇太能源与河北某工业玻璃龙头企业签约,合作利用空微子发电技术降低企业电耗。该项目由玻璃企业投资,宇太能源提供技术及设备支持
2025-11-28 08:57:00
罗振宇、张夕勇、杨慧林、罗军民四位大咖重磅推荐,杨钧博士《未来竞速》即将出版发行
百年汽车产业大变局的必读之作。近日,由国内汽车行业资深媒体人与研究观察者杨钧博士撰写的新书《竞速未来-全球新能源汽车的崛起与挑战》一书已由中国出版集团中译出版社正式出版发行
2025-11-28 09:27:00
近日,鹏华基金发布公告,旗下科创创业人工智能ETF鹏华 (认购代码:588413)于11月28日正式发行。作为首批双创人工智能ETF中的一员
2025-11-28 10:11:00
入选概率不及万分之二,阿里千问斩获顶级AI会议最佳论文
11月28日消息,人工智能领域顶级会议NeurIPS 2025公布了论文奖,阿里通义千问团队最新研究成果从全球2万多篇投稿论文中脱颖而出
2025-11-28 11:01:00
11月24日,位于启东市南阳镇的朗峰新材料启东有限公司生产车间内,自动化生产线高速运转,一条薄如蝉翼的银色金属带材从特制喷嘴中“飞”出
2025-11-28 11:05:00
济南轨道交通集团举办财务资本培训,实战专家孙春浩解析财务精英三级跃迁路径
近日,济南轨道交通集团全资子公司莱芜交通发展集团成功举办财务管理及融资业务培训。本次培训由集团财务管理部部长刘文芹主持
2025-11-28 11:09:00
锚定本土、驱动创新的金融实践!青岛银行荣膺CFV“最佳品牌竞争力城商行”奖项
11月21日,在上海举办的“2025第一财经金融价值年会”上,青岛银行凭借在科技金融、绿色金融、地方经济服务及创新能力方面的突出表现
2025-11-28 11:18:00
挂号缴费不用跑!微信医保移动支付在北京140家公立医院全面上线
近日,北京市参保市民就医迎来“智慧升级”——微信医保移动支付功能已在中国医学科学院、北京协和医院、北京大学人民医院等140家公立医院全面上线
2025-11-28 11:28:00
河北省煤田地质局物测队引入新装备提升探测能力
河北新闻网讯(吕若汐、齐彦红)11月18日,地球物理勘探设备供应商法国塞赛尔公司正式向河北省煤田地质局物测队交付了两套数字地震仪(激发系统)诺玛德65尼奥
2025-11-28 11:53:00
中新经纬11月28日电 北京市广电局网站消息,《北京市促进“人工智能+视听”产业高质量发展行动方案(2025-2029年)》(下称《行动方案》)近日发布
2025-11-28 11:57:00
均胜电子:定位“汽车+机器人Tier1”,双轮驱动进阶智能新时代
全球领先的智能汽车科技解决方案提供商均胜电子(600699.SH / 00699.HK)正以创新驱动和全球协同,在汽车电子
2025-11-28 12:15:00
严禁“带病运行”!河南就政务信息系统开发公开征求意见
大河网讯 为给非涉密政务信息系统的开发建设加上一把“安全锁”,规范全生命周期的安全管控工作,11月27日,省行政审批政务信息管理局起草了《非涉密政务信息系统开发安全管理指南(征求意见稿)》(以下简称《征求意见稿》)
2025-11-28 14:10:00
吉林机场集团门户网站二次升级 打造智慧出行服务新标杆
为持续优化用户体验、丰富服务维度,吉林省民航机场集团有限公司门户网站(https//www.jlairports.com)正式迎来二次重大升级
2025-11-28 14:41:00
商赢酱酒以文化赋能商务社交,重塑“场景思维”新体验
11月25日,一场以“商界链接创富圈层,共享‘商赢酱酒’杯中哲学,解锁中国式商务社交的‘心’语”为主题的交流会在济南成功举办
2025-11-28 14:55:00