• 我的订阅
  • 头条热搜
马斯克 xAI 推出 Grok-1.5 大语言模型
...宣布,正式推出 Grok-1.5 大语言模型。Grok-1.5 具有改进的推理能力和 128k 的上下文长度,其中最显著的改进之一是其在编码和数学相关任务中的表现。Grok-1.5 将在未来几天内在 平台上向早期测试人员和现有的 Grok 用户推出。在官...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...感知未来视觉感知的 “北极星” 是以具身为中心的视觉推理和社会智能。如下图所示,不同于仅仅识别图像中的物体,具有具身感知能力的智能体必须在物理世界中移动并与环境互动,这需要对三维空间和动态环境有更透彻的...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...,随着 OpenAI o1 模型的推出,关于大型语言模型是否拥有推理能力的讨论又多了起来。比如苹果在前段时间的一篇论文中指出,只要给模型一些干扰,最聪明的模型也会犯最简单的错误(参见《给小学数学题加句「废话」,OpenAI ...……更多
OpenAI没有放弃的机器人梦想
...人团队,理由是缺乏训练机器人使用人工智能进行移动和推理所需的数据,研发受到了阻碍。当时,在美国创业孵化器Y Combinator的论坛上,BuzzFeed数据科学家马克思·伍尔夫(Max Woolf)直言 :“一种可能准确但带有讽刺意味的观...……更多
英伟达地表最强,黄教主被称作AI界“霉霉”
...来支持高达10万亿参数的AI模型训练和大语言模型的实时推理。有望在数据处理、工程模拟、电子设计自动化、计算机辅助药物设计、量子计算和生成人工智能等领域实现新的突破。用黄仁勋的原话来说,它就是“当今世界上最...……更多
...地理科学发现。未来,研发团队将推进地图大模型及地理推理机研发,有望让地理科学语言大模型读懂地图;将打造地理科研协作大平台,以期让每个科学家和科研团队都可以拥有专属的地理大模型,能够与数百万科学家通过共...……更多
仅用4块GPU、不到3天训练出开源版GPT-4o,这是国内团队最新研究
...ication, CTC)来预测与语音响应相对应的离散单元序列。在推理过程中,当 LLM 自回归生成文本响应时,语音解码器同步生成相应的离散单元。为了更好地契合语音交互场景的特点,该研究通过重写现有的文本指令数据并进行语音...……更多
...作,充分调度和分享资源,携手攻关大模型设计、训练、推理、压缩、部署等关键技术,共同推动大模型技术迭代。二是拓展应用场景。大模型赋能的重要牵引力是场景需求,企业应充分结合大模型技术能力和市场需求,积极在...……更多
...,是由StarCloud(星云)算力平台和 StarStream(星诞)训练推理平台组成,分别实现混合异构算力调度管理和大模型研发全过程管理,简化了算力、数据和算法研发的复杂度,降低了算力资源损耗,提高了算法研发效率。OpenNova Seri...……更多
大模型的未来,快手在自己身上找答案
...通话、英语及多种方言,还以其卓越的性能表现和极低的推理时延脱颖而出,广泛应用于快手的多种场景。理解了外部世界之后,受到考验的就是「AI 关小芳」的表达能力。「AI 关小芳」已经不是木讷的问答机器。它在对话能力...……更多
李彦宏:大模型场景下开源是最贵的,多模态是通往AGI的必经之路
...练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。会上,百度发布了文心大模型4.0的工具版,该工具版可以让开发者体验代码解释器功能,开发者不仅可以通过自然语言...……更多
...,正是这些语言陷阱,锻炼了语言大模型对中文的解读和推理能力,让AI能像人一样进行交流。胡萝北说,没想到有一天弱智吧的段子会成为训练大模型的语料,“AI看似与普通人无关,但机器人其实是对人类的模仿,从某种程...……更多
人工智能已成风口:这款扫地机器人也要拥抱AI
...的研发之外,还需要强大的硬件算力来负责模型的训练和推理,这对于一般的企业来说并不是一件容易的事情,只有拥有强大研发实力的企业才能够从事大语言模型的研发与训练。而石头为了让P20Pro发挥最佳的水平,选择了自研...……更多
把大模型装进手机,总共分几步?
...三个基建大语言模型的参数量动辄百亿、千亿,其训练和推理过程,需要耗费大量计算资源,对于手机这样的移动智能终端来说,SoC芯片的算力是远远达不到数据中心万卡集群的规模的,怎么支撑大模型的端侧运算呢?就算勉强...……更多
比GPU性价比高百倍!Cerebras推出新AI推理服务,号称“全球最快”
...28日消息,AI芯片独角兽Cerebras Systems于8月27日宣布推出AI推理服务Cerebras Inference,号称“全球最快”。该服务已经在云端上线。据官网介绍,该推理服务在保证精度的同时,速度比英伟达的服务快20倍;其处理器内存带宽是英伟达...……更多
只用 13 天,OpenAI 做出了能听、能说、能自主决策的机器人大模型
...破,由 OpenAI 与 Figure 共同做出。OpenAI 提供负责提供视觉推理和语言理解,而 Figure 的神经网络提供快速、低水平、灵巧的机器人动作。机器人所做出的所有行为都是出于已经学习过,内化了的能力,而不是来自远程操作。研究...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...选择问答任务外,研究还扩展到评测各种大型语言模型的推理能力具体来说,对于给定的问题和选项,模型在输出选择答案的同时,还需要输出选择该答案的理由。下表展示了主流模型在 MMedBench 上对选择题答案的解释能力。主...……更多
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...能力,但只使用了一半的训练资源。之后,他们对模型的推理和编码能力进行了重大改进,最终开发出了 Grok-1,这是一款功能更为强大的 SOTA 语言模型,在 HumanEval 编码任务中达到了 63.2% 的成绩,在 MMLU 中达到了 73%。xAI 使用了...……更多
全球高校同台PK,齐鲁工业大学斩获一等奖!
...超算集群,运行优化国际通行基准测试HPL&HPCG、大模型推理优化、渗流数值模拟、火星大气模拟、新型材料结构计算等前沿科学与工程应用并参加答辩。RhinoLinX灵犀队其中,大模型推理优化赛题要求参赛队伍基于开源大语言模...……更多
谷歌再出大招,发布最新开源大模型Gemma,笔记本上即可运行
...其强大的生成能力。谷歌声称,Gemma模型18个语言理解、推理、数学等关键基准测试中,有11个测试分数超越了MetaLlama-2等更大参数的开源模型。GoogleDeepMind的首席执行官DemisHassabis表示,Gemma是在同类尺寸中性能最佳的模型。Gemma与...……更多
...,Maia将为生成式人工智能工作负载运行基于云的训练和推理,并且它拥有大量的晶体管。而Cobalt将会被用于执行复杂、高性能的操作。微软表示,他们并没有计划对外销售这两款产品,而是更倾向于仅供内部使用。值得一提的...……更多
全球首个大语言模型人格DIKWP测评揭晓——“婚姻殿堂下LLM的选择”实验成果发布
...的人格特质。例如,GPT-4o被归类为INTJ型人格,它在逻辑推理和综合判断方面表现出色;而通义千问则倾向于ESTJ型人格,以其直接明确的意图表达和条理性著称。此外,研究还包括了一个独特的交叉评估环节,模拟男性和女性...……更多
威科未来上榜量子位“2023人工智能年度创业公司TOP20”
...的OpenBuddy-LLaMA2-70B大语言模型,其强大的认知能力和逻辑推理能力,更是有望成为GPT-3.5最强开源平替。从最初的7B模型到70B模型,大语言模型的跨语言能力和认知能力不断地得到实践和优化改进,在这个过程中,威科未来联合Open...……更多
跨越算力鸿沟丨星凡科技2024AI算力集群产品发布会圆满成功
...单纯的计算资源提供者,他们需要向客户提供大模型训练推理等增值服务,以减少客户在模型开发过程中的成本负担,助力客户进行人工智能转型,从而实现双赢。”超新星分布式微算力中心——AICC建设运营高性价比选择本次...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
...代模型在技术上可能解决目前ChatGPT中存在的事实性以及推理能力的缺陷,实现更精细的语义理解、多模态(文本、图像、语音、视频等)输入和输出,具备更强的个性化能力。”“人工智能的发展会更多瞄向通用人工智能,实...……更多
昇思MindSpore 2.3全新发布
...级实现脚本、分布式策略,运行时的统一,Baichuan2-13B的推理部署只需1天。在大模型推理上,通过LLMServing实现推理吞吐提升2倍多;升级模型压缩工具金箍棒2.0实现千亿大模型压缩至十倍。 为降低开发门槛,昇思持续升级MindSpore...……更多
以图灵机为师:通过微调训练让大语言模型懂执行计算过程
...佳论文奖。大型语言模型 (LLM) 在各种自然语言处理和推理任务中表现出卓越的能力,某些应用场景甚至超越了人类的表现。然而,这类模型在最基础的算术问题的表现上却不尽如人意。当遇到算术问题时,LLM 通常依赖记住特...……更多
谷歌ai聊天机器人bard及geminipro更新计划曝光
...仅支持英文)仔细检查以发现其他语言的“幻觉”更好地推理、计划等。谷歌在去年12月宣布推出其新一代大语言模型Gemini,包括三种不同版本:GeminiUltra、GeminiPro和GeminiNano。GeminiUltra-用于处理高度复杂任务的最强、最大的模型...……更多
从云栖大会,看阿里的科技本色
...级人工智能平台 PAI,在算力方面为对 AI 大模型的训练和推理算力提供支持,此次阿里云还有一个重磅发布,发布了一站式大模型应用开发平台——阿里云百炼。阿里云百炼集成了国内外主流优质大模型,提供模型选型、微调训...……更多
英特尔推出新款AI芯片:推理性能比英伟达H100快50%
...加速器将为寻求大规模部署生成式AI的企业带来AI训练和推理方面的重大飞跃。英特尔Gaudi 3预计可大幅缩短70亿和130亿参数Llama2模型,以及1750亿参数GPT-3模型的训练时间。英特尔表示,Gaudi 3能够比英伟达上一代H100处理器训练特定...……更多
更多关于科技的资讯:
人工智能+AI 推动智能无人驾驶场景加速落地
01、什么是车联网和智能网联汽车车联网车联网是指以智能网联汽车为载体,通过蜂窝移动通信与直连通信网络,运用互联网、大数据
2025-09-25 22:31:00
云栖通道上演AI“实战秀”:守护珊瑚、助盲出行、千元机器人勾勒落地新图景
9月25日正午,杭州云栖大会现场2号馆小舞台,云栖通道如期开通。这是一个为广大AI产业从业者、创业者以及大模型开发者提供的专属交流平台
2025-09-25 20:58:00
CBD 新地标:Z3,未来办公引擎登场
北京,2025年9月24日——北京 CBD 核心区再添重磅力作!今日,备受瞩目的 Z3 超甲级写字楼项目正式揭开神秘面纱
2025-09-25 13:43:00
中国电信-海信日立联合实验室揭牌,共筑智慧家电产业新高地
9月19日,中国电信山东公司、天翼物联科技公司与青岛海信日立在青岛举行联合实验室揭牌仪式,标志着三方战略合作迈入全方位深度融合的新阶段
2025-09-25 13:43:00
2025云栖大会直击:云深处科技机器人矩阵亮相,多场景展示行业引领性!
9月24日至26日,全球云计算与 AI 领域年度旗舰盛会 ——2025 云栖大会在杭州云栖小镇盛大启幕。本届大会以“云智一体・碳硅共生”为核心主题
2025-09-25 13:44:00
为落实《个人征信电子授权安全技术指南》(JR/T 0299—2024)金融行业标准,规范金融机构在个人征信电子授权中的技术操作
2025-09-25 13:44:00
文玩新经济浪潮奔涌,2025全国文玩大会重塑行业生态与消费图景
秋意渐浓,北京迎来一场文玩行业盛会。9月24日至28日,以“国潮觉醒 文玩新生”为主题的2025全国文玩大会于潘家园市场(西区)盛大举行
2025-09-25 13:46:00
如今,微短剧已然从“内容新贵”成长为拉动数字经济的重要力量。因为“轻、快、密”的内容节奏,短剧得以迅速占领用户的碎片时间
2025-09-25 13:46:00
三榜齐登、实力认证!网易有道连续五年入选“北京民营企业百强”
日前,北京市工商联、通州区人民政府联合召开2025北京民营企业百强发布会。会上,网易有道凭借持续的创新能力和稳健的业绩表现
2025-09-25 10:06:00
济南爱尔眼科实施全国首批龙晶PR型有晶体眼人工晶状体植入术
近日,首批龙晶PR型有晶体眼人工晶状体植入手术在济南爱尔眼科医院完成,作为“尝鲜吃螃蟹”的人,患者脸上洋溢着发自内心满意的微笑
2025-09-25 11:20:00
观赛有了更佳的趣味性与沉浸感金科院数字科技赋能国际赛艇大赛南报网讯(通讯员陆慧记者姜静实习生黄佳琪)2025南京·大学生国际赛艇公开赛近日在外秦淮河畔举行
2025-09-25 07:38:00
提升“双盲”模式下的评标质效雄安新区面向评标专家智能问答系统正式上线河北日报讯(见习记者康晓博)只需轻点鼠标,远在外地的评标专家就能获得精准指引
2025-09-25 07:58:00
大模型算出爆款,红枣变致富“金枣”
大模型算出爆款,红枣变致富“金枣”——看沧县红枣及干坚果食品加工产业如何实现数字化转型9月18日,河北华聚食品有限公司的工人忙着打包红枣产品
2025-09-25 07:59:00
9月17日,兴业银行信用卡中心与美团企业版在上海签署战略合作协议,共同打造“金融+生活”开放生态。根据协议,双方将基于开放共享
2025-09-24 07:24:00
金洽会上51个重点产业项目签约,计划投资802.21亿元——一串串数字,见证企业对南京的高度认可□南京日报/紫金山新闻记者张甜甜9月23日
2025-09-24 08:11:00