• 我的订阅
  • 头条热搜
对标OpenAI o1!Kimi发布新一代推理模型:中考高考考研全第一
快科技11月18日消息,日前,国内人工智能公司月之暗面推出的Kimi国产大模型正式发布k0-math。k0-math是Kimi推出的首款推理能力强化模型,采用全新强化学习和思维链推理技术,通过模拟人脑的思考和反思过程,大幅提升解决数学...……更多
腾讯大模型混元Turbo:御气升昺云,梓桐金鼎开
9月5日,腾讯正式推出其新一代旗舰大模型——混元Turbo。相比前代模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升 100%,推理成本降低 50%,解码速度提升 20%,效果在多个基准测试上对标GPT-4o。最新第三方...……更多
腾讯推出新一代大模型“混元Turbo”,性能大幅提升,定价低50%
9月5日,腾讯宣布推出新一代大模型“混元Turbo”,相比前代模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升100%,推理成本降低50%,解码速度提升20%,效果在多个基准测试上对标GPT-4o,第三方测评居国内第...……更多
腾讯推出新一代大模型「混元Turbo」,性能大幅提升,定价低50%
鞭牛士 9月5日消息,腾讯宣布推出新一代大模型“混元Turbo”。腾讯介绍,该模型采用MoE架构,比上一代产品推理效率提升100%,推理成本降低50%,解码速度提升20%。腾讯公司副总裁、云与智慧产业事业群COO兼腾讯云总裁邱跃鹏...……更多
清华提出CharacterGLM;DeepMind联创发全新一代大模型;大模型版“5年高考3年模拟”来了丨AI新零售早报
...|微软&UCLA&UW联合出品》MathVista是一个多模态数学推理基准数据集,由微软、UCLA和UW联合开发,包含6141个数学问题,涵盖丰富的任务类型、推理能力和图像类型。特点:旨在提供一个全面、多样、复杂的视觉数学推理挑战...……更多
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...Gemini正式亮相的同时,谷歌还推出了专为大模型而设计的新一代TPU——Cloud TPU v5p。那么,你觉得这一波,谷歌能赶上OpenAI的脚步吗?参考链接:[1]https://blog.google/technology/ai/google-gemini-ai[2]https://storage……更多
近日,高通公司发布了新一代云AI推理加速卡——CloudAI100Ultra。这款产品专为生成式AI和大型语言模型而设计,提供相当于上一代产品四倍的性能。新款CloudAI100Ultra可部署的模型规模进一步扩大,单张150W的卡上可部署100B参数模...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
...让OpenAI三缄其口OpenAI o1的横空出世,开启了GPT系列之外的新一代模型。它代表着人工智能发展新范式的开端,在LLM领域首次实现了通用复杂推理能力。在代码生成方面,o1可以媲美IOI金牌水准。在物理、生物、化学等STEM学科问题...……更多
OpenAI o1太贵?那就自己做一个!纯提示方法让普通LLM进化出复杂推理能力
...复杂推理能力的OpenAI o1。九月份,OpenAI o1正式登场。作为新一代的老大哥,o1系列专注于复杂的推理任务,一经推出也是直接屠榜了大模型竞技场。在下面这些难度较大的数学、编码、科学等任务中,o1不仅比GPT-4o强上一大截,...……更多
对标o1,Kimi放出了最能打的国产模型
...历新一轮技术范式的变化,预训练 Scaling Law 放缓之后,推理时间计算成为了新的性能提升关键。两个月前,OpenAI o1 的诞生再次引领了大模型技术的突破。从后训练阶段入手,通过更多的强化学习、原生的思维链和更长的推理时...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...专门解决难题。这是一个重大突破,新模型可以实现复杂推理,一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。OpenAI 称,今天在 ChatGPT 和大模型 API 中新发布的是该系列中的第一款模型,而且还只是预览...……更多
刚刚,Llama 3.2 来了!支持图像推理,还有可在手机上运行的版本
...ma 模型来了一波大更新:不仅推出了支持图像推理任务的新一代 Llama 11B 和 90B 模型,还发布了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。不仅如此,Meta 还正式发布了 Llama Stack Distribution,其可将多个 API 提供商……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
新智元报道编辑:乔杨【新智元导读】LLM的数学推理能力缺陷得到了很多研究的关注,但最近浙大、中科院等机构的学者们提出,先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种...……更多
商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单
...73.56的高分,并在数理逻辑维度取得第一,体现其强大的推理能力。 SenseChat-Vision5.5基础能力突出,数理逻辑维度超越GPT-4o本次SuperCLUE-V涵盖了国内外最具代表性的11个开源/闭源多模态理解大模型,聚焦多维度能力评估,包括基...……更多
文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
【新智元导读】Playground Research推出了新一代文本到图像模型PGv3,具备240亿参数量,采用深度融合的大型语言模型,实现了在图形设计和遵循文本提示指令上甚至超越了人类设计师,同时支持精确的RGB颜色控制和多语言识别。自...……更多
科学家建立新评价基准,助力评估大模型数据分析能力
...题任务,要求模型在代码执行后对结果进行理解、归纳和推理,提供有价值的观点。尽管 Tapilot-Crossing 已经是规模较大、且较为全面的测试集,其构建成本也低于 100 美元,显示了利用虚拟多智能体容器生成复杂、高质量数据集...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...源医疗语言大模型的最新进展。该项目受到科创 2030—“新一代人工智能” 重大项目支持。在医疗领域中,大语言模型已经有了广泛的研究。然而,这些进展主要依赖于英语的基座模型,并受制于缺乏多语言医疗专业数据的限制...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
... 重新点燃了关于复杂 VLM 核心组成部分的研究,可能推动新一代规模更大的模型的发展。 更高分辨率的多模态学习最近,大型视觉语言模型在其更大的模型中使用预训练的图像编码器,其中一些使用监督分类进行预训练(如PaLI...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...码仓库 Trending Research 第一位。为了赋予机器人端到端的推理和操纵能力,本文创新性地将视觉编码器与高效的状态空间语言模型集成,构建了全新的 RoboMamba 多模态大模型,使其具备视觉常识任务和机器人相关任务的推理能力,...……更多
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
...,中国科学院国家天文台人工智能组基于通义千问开发了新一代天文大模型“星语3.0”,这是大模型首次应用于天文观测领域;陕煤建新煤矿等十余座矿山推出由通义支持的新型矿山重大风险识别处置系统,成为大模型在矿山场...……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
...的长依赖任务中的多信息检索、时间重排序、计算、理解推理能力表现均不乐观。比如像Claude3-200k,GPT4-32k、GPT4-8k、GPT3.5-turbo-6k、LlamaIndex这种商业模型,平均只有40%的准确率。而像开源模型表现就更不理想了…ChatGLM2-6B、LongLL……更多
开闭源模型「大乱斗」:看看哪个智能体最能窥见人类真实意图
...们的字面请求,更要能透视我们的隐式意图。 因此,让新一代的智能体落地并为大众所用,需要以人为中心,不仅仅关注于任务执行的精确度,更关注于如何与人类建立起一种更加自然、流畅而富有洞察力的沟通方式。为了弥...……更多
自动化、可复现,基于大语言模型群体智能的多维评估基准
...上万的大规模语言模型(LLM),这些模型的各项能力(如推理和生成)也越来越强。因此,在多样的应用场景中对其进行性能基准测试已成为了一项重大挑战。目前最受欢迎的基准测试是 Chatbot Arena,它通过收集用户对模型输出...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...不断提升,例如GPT-4o在大学水平上的多学科多模态理解和推理(MMMU)基准测试中取得了69.1%的准确率。不过,基准测试结果是否真的能反映模型对多样化主题的深入理解,仍然有争议,或者说模型是否只是利用了统计模式,而非...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
...l Large 2,该模型拥有 1230 亿个参数,在代码生成、数学、推理等方面与 OpenAI 和 Meta 的最新尖端模型不相上下。紧随 Llama 3.1 405B 之后,Mistral Large 2 的发布让开源大模型的赛道一下子热闹起来,而这一模型的特点是 ——「足够大...……更多
开源大模型杀疯了!Mistral新模型三分之一参数卷爆Llama 3.1
...设定了一个新的前沿”。Mistral Large 2尤其擅长代码和数学推理,上下文窗口128k,支持数十种自然语言以及80+编程语言。特别在MMLU上,其预训练版本更是达到了84.0%的准确率。消息一出,Mistral AI联创兼首席科学家第一时间转发,...……更多
专家模型不要专家并行!微软开源MoE新路径
...走寻常路」如果写个太长不看版,那就是两句话:1. 使用新一代SparseMixer来精确估计专家路由的梯度,解决传统方案中利用门控梯度代替路由梯度的问题。 2. 专家并行不要了,训练中改用数据、pipeline和张量并行,避免了传统方...……更多
位列第一梯队,腾讯混元再度领跑国内大模型
...维度的综合性测评基准,由十大基础任务组成,包括逻辑推理、代码、语言理解、长文本、角色扮演等。本次报告选取了国内外具有代表性的32个大模型4月份的版本,通过多维度综合性测评,真实准确地反映了国内外大模型在中...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
...语言模型 (LM) 在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的,因为它们的构建和部署成本过高。改善成本 - 性能的一种方法是使...……更多
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超闭源
...ion模型打造,超越传统思维链提示,实现自主“慢思考”推理。在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型。新模型具体如何推理,直接上实例,比如问题是:减去所有的小亮球和紫...……更多
更多关于科技的资讯:
钻漏洞谋求个人私利:吉林一雪场将15名大学生拉入黑名单
快科技1月15日消息,国内不少景点会针对大学生等群体推出相应的优惠政策,有些甚至是免门票,然而这样的规则也会被有心人利用谋取私利
2025-01-15 17:25:00
小米超级小爱升级计划公布:小米13/K60等也能用上 1月27日前推送
快科技1月15日消息,小米官方今天发文宣布,澎湃OS 2系统中的「超级小爱」功能已正式向用户开放。该功能新增了手势唤醒和智能理解屏幕内容等特性
2025-01-15 17:25:00
高性能内存对于游戏帧率如此重要!英睿达DDR5 Pro 6400MHz评测
一、前言:专为锐龙9000平台设计的游戏内存内存延迟对于游戏帧率的重要性已无需赘述。由于Intel新一代酷睿Ultra 200S在游戏性能上的拉胯表现
2025-01-15 17:25:00
理想汽车推出2025新春活动攻略!涵盖充电免服务费等福利
快科技1月15日消息,理想汽车为庆祝2025年新春,推出了五重福利活动。活动从1月16日开始,至2月4日结束,期间理想汽车全系车型在全国范围内的高速理想超充站充电时
2025-01-15 17:25:00
网友申请退机票收到近七千元代金券 携程称系航司政策规定
快科技1月15日消息,据媒体报道,近日,有网友反映称,他在2024年11月,通过携程购买了12月21日的往返国际机票,总价为8279元人民币
2025-01-15 17:25:00
连续36年第一!中国第一个14万亿大省诞生 广东新能源汽车、手机产能激增
快科技1月15日消息,2024年广东GDP预计站上14万亿大关,成为我国第一个14万亿大省,连续36年蝉联全国榜首(已经全面赶超“亚洲四小龙”)
2025-01-15 17:25:00
男子聚餐后次日身亡9同事被告 法院:同饮者已尽合理注意义务 无责!
1月15日消息,外出聚餐莫劝酒,一旦出事情很有可能摊上官司,类似的事情已经不止一次发生,想必关注新闻的朋友都已了解。据CCTV法治在线报道
2025-01-15 17:25:00
史无前例!世界最大核能基地首创“和气一号”能源站
快科技1月15日消息,据报道,位于江苏连云港的田湾核电站,是全球在运+在建总装机容量最大的核电基地 。随着7、8号机组投产
2025-01-15 17:55:00
三星Galaxy S25欧版存储仍为128GB起售!亚洲地区256GB起售
快科技1月15日消息,三星Galaxy S25系列手机即将发布,不同市场的存储配置差异引发关注。据海外科技博主透露的消息来看
2025-01-15 17:55:00
铃木汽车将在印度利用牛粪生产车用沼气燃料 此前曾宣称要建沼气厂
快科技1月15日消息,据媒体报道,日本铃木汽车公司目前正在印度全力利用牛粪生产汽车用沼气燃料。据了解,在2024年12 月 25 日
2025-01-15 17:55:00
男子开火车卧铺车厢带全家自驾游:一辆车住了十几个人
快科技1月15日消息,近日,博主@ 狼先生~(卷儿哥)开着火车卧铺带全家人自驾游的视频,引起网友关注热议。据博主介绍,加上父母他们一行十多人
2025-01-15 18:25:00
2025支付宝集福玩法公布:每人5次!集齐立马开奖 不用等除夕
快科技1月15日消息,今天,支付宝正式官宣了2025支付宝集福玩法。今年的集五福将在1月20日启动,玩法相比以往有明显变化
2025-01-15 18:25:00
诺基亚与三星达成重磅协议!三星电视将用上诺基亚视频技术
快科技1月15日消息,诺基亚与三星签署多年期专利许可协议,三星电视将采用诺基亚视频技术。根据协议,三星将向诺基亚支付专利费用
2025-01-15 18:25:00
你见过活沙币吗
如果你在海滩上赶海时,捡到下图中的“白色圆盘”,你觉得最有可能是什么?是贝壳还是石块,抑或是古老的植物花瓣化石?海滩边上的“死沙币”图源sanddollarshelling真相也许会让你大吃一惊因为你捡到的其实是一枚沙币
2025-01-15 18:25:00
RTX4060游戏本便宜了 翼龙15 Pro双补仅5670元
快科技1月15日消息,机械革命翼龙15 Pro正在天猫旗舰店参加百亿补贴+国家补贴双重补贴活动中,到手价格仅5670.4元
2025-01-15 18:25:00