• 我的订阅
  • 头条热搜
对标OpenAI o1!Kimi发布新一代推理模型:中考高考考研全第一
快科技11月18日消息,日前,国内人工智能公司月之暗面推出的Kimi国产大模型正式发布k0-math。k0-math是Kimi推出的首款推理能力强化模型,采用全新强化学习和思维链推理技术,通过模拟人脑的思考和反思过程,大幅提升解决数学...……更多
腾讯大模型混元Turbo:御气升昺云,梓桐金鼎开
9月5日,腾讯正式推出其新一代旗舰大模型——混元Turbo。相比前代模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升 100%,推理成本降低 50%,解码速度提升 20%,效果在多个基准测试上对标GPT-4o。最新第三方...……更多
腾讯推出新一代大模型“混元Turbo”,性能大幅提升,定价低50%
9月5日,腾讯宣布推出新一代大模型“混元Turbo”,相比前代模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升100%,推理成本降低50%,解码速度提升20%,效果在多个基准测试上对标GPT-4o,第三方测评居国内第...……更多
腾讯推出新一代大模型「混元Turbo」,性能大幅提升,定价低50%
鞭牛士 9月5日消息,腾讯宣布推出新一代大模型“混元Turbo”。腾讯介绍,该模型采用MoE架构,比上一代产品推理效率提升100%,推理成本降低50%,解码速度提升20%。腾讯公司副总裁、云与智慧产业事业群COO兼腾讯云总裁邱跃鹏...……更多
清华提出CharacterGLM;DeepMind联创发全新一代大模型;大模型版“5年高考3年模拟”来了丨AI新零售早报
...|微软&UCLA&UW联合出品》MathVista是一个多模态数学推理基准数据集,由微软、UCLA和UW联合开发,包含6141个数学问题,涵盖丰富的任务类型、推理能力和图像类型。特点:旨在提供一个全面、多样、复杂的视觉数学推理挑战...……更多
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...Gemini正式亮相的同时,谷歌还推出了专为大模型而设计的新一代TPU——Cloud TPU v5p。那么,你觉得这一波,谷歌能赶上OpenAI的脚步吗?参考链接:[1]https://blog.google/technology/ai/google-gemini-ai[2]https://storage……更多
近日,高通公司发布了新一代云AI推理加速卡——CloudAI100Ultra。这款产品专为生成式AI和大型语言模型而设计,提供相当于上一代产品四倍的性能。新款CloudAI100Ultra可部署的模型规模进一步扩大,单张150W的卡上可部署100B参数模...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
...让OpenAI三缄其口OpenAI o1的横空出世,开启了GPT系列之外的新一代模型。它代表着人工智能发展新范式的开端,在LLM领域首次实现了通用复杂推理能力。在代码生成方面,o1可以媲美IOI金牌水准。在物理、生物、化学等STEM学科问题...……更多
OpenAI o1太贵?那就自己做一个!纯提示方法让普通LLM进化出复杂推理能力
...复杂推理能力的OpenAI o1。九月份,OpenAI o1正式登场。作为新一代的老大哥,o1系列专注于复杂的推理任务,一经推出也是直接屠榜了大模型竞技场。在下面这些难度较大的数学、编码、科学等任务中,o1不仅比GPT-4o强上一大截,...……更多
对标o1,Kimi放出了最能打的国产模型
...历新一轮技术范式的变化,预训练 Scaling Law 放缓之后,推理时间计算成为了新的性能提升关键。两个月前,OpenAI o1 的诞生再次引领了大模型技术的突破。从后训练阶段入手,通过更多的强化学习、原生的思维链和更长的推理时...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...专门解决难题。这是一个重大突破,新模型可以实现复杂推理,一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。OpenAI 称,今天在 ChatGPT 和大模型 API 中新发布的是该系列中的第一款模型,而且还只是预览...……更多
刚刚,Llama 3.2 来了!支持图像推理,还有可在手机上运行的版本
...ma 模型来了一波大更新:不仅推出了支持图像推理任务的新一代 Llama 11B 和 90B 模型,还发布了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。不仅如此,Meta 还正式发布了 Llama Stack Distribution,其可将多个 API 提供商……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
新智元报道编辑:乔杨【新智元导读】LLM的数学推理能力缺陷得到了很多研究的关注,但最近浙大、中科院等机构的学者们提出,先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种...……更多
商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单
...73.56的高分,并在数理逻辑维度取得第一,体现其强大的推理能力。 SenseChat-Vision5.5基础能力突出,数理逻辑维度超越GPT-4o本次SuperCLUE-V涵盖了国内外最具代表性的11个开源/闭源多模态理解大模型,聚焦多维度能力评估,包括基...……更多
文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
【新智元导读】Playground Research推出了新一代文本到图像模型PGv3,具备240亿参数量,采用深度融合的大型语言模型,实现了在图形设计和遵循文本提示指令上甚至超越了人类设计师,同时支持精确的RGB颜色控制和多语言识别。自...……更多
科学家建立新评价基准,助力评估大模型数据分析能力
...题任务,要求模型在代码执行后对结果进行理解、归纳和推理,提供有价值的观点。尽管 Tapilot-Crossing 已经是规模较大、且较为全面的测试集,其构建成本也低于 100 美元,显示了利用虚拟多智能体容器生成复杂、高质量数据集...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...源医疗语言大模型的最新进展。该项目受到科创 2030—“新一代人工智能” 重大项目支持。在医疗领域中,大语言模型已经有了广泛的研究。然而,这些进展主要依赖于英语的基座模型,并受制于缺乏多语言医疗专业数据的限制...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
... 重新点燃了关于复杂 VLM 核心组成部分的研究,可能推动新一代规模更大的模型的发展。 更高分辨率的多模态学习最近,大型视觉语言模型在其更大的模型中使用预训练的图像编码器,其中一些使用监督分类进行预训练(如PaLI...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...码仓库 Trending Research 第一位。为了赋予机器人端到端的推理和操纵能力,本文创新性地将视觉编码器与高效的状态空间语言模型集成,构建了全新的 RoboMamba 多模态大模型,使其具备视觉常识任务和机器人相关任务的推理能力,...……更多
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
...,中国科学院国家天文台人工智能组基于通义千问开发了新一代天文大模型“星语3.0”,这是大模型首次应用于天文观测领域;陕煤建新煤矿等十余座矿山推出由通义支持的新型矿山重大风险识别处置系统,成为大模型在矿山场...……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
...的长依赖任务中的多信息检索、时间重排序、计算、理解推理能力表现均不乐观。比如像Claude3-200k,GPT4-32k、GPT4-8k、GPT3.5-turbo-6k、LlamaIndex这种商业模型,平均只有40%的准确率。而像开源模型表现就更不理想了…ChatGLM2-6B、LongLL……更多
开闭源模型「大乱斗」:看看哪个智能体最能窥见人类真实意图
...们的字面请求,更要能透视我们的隐式意图。 因此,让新一代的智能体落地并为大众所用,需要以人为中心,不仅仅关注于任务执行的精确度,更关注于如何与人类建立起一种更加自然、流畅而富有洞察力的沟通方式。为了弥...……更多
自动化、可复现,基于大语言模型群体智能的多维评估基准
...上万的大规模语言模型(LLM),这些模型的各项能力(如推理和生成)也越来越强。因此,在多样的应用场景中对其进行性能基准测试已成为了一项重大挑战。目前最受欢迎的基准测试是 Chatbot Arena,它通过收集用户对模型输出...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...不断提升,例如GPT-4o在大学水平上的多学科多模态理解和推理(MMMU)基准测试中取得了69.1%的准确率。不过,基准测试结果是否真的能反映模型对多样化主题的深入理解,仍然有争议,或者说模型是否只是利用了统计模式,而非...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
...l Large 2,该模型拥有 1230 亿个参数,在代码生成、数学、推理等方面与 OpenAI 和 Meta 的最新尖端模型不相上下。紧随 Llama 3.1 405B 之后,Mistral Large 2 的发布让开源大模型的赛道一下子热闹起来,而这一模型的特点是 ——「足够大...……更多
开源大模型杀疯了!Mistral新模型三分之一参数卷爆Llama 3.1
...设定了一个新的前沿”。Mistral Large 2尤其擅长代码和数学推理,上下文窗口128k,支持数十种自然语言以及80+编程语言。特别在MMLU上,其预训练版本更是达到了84.0%的准确率。消息一出,Mistral AI联创兼首席科学家第一时间转发,...……更多
专家模型不要专家并行!微软开源MoE新路径
...走寻常路」如果写个太长不看版,那就是两句话:1. 使用新一代SparseMixer来精确估计专家路由的梯度,解决传统方案中利用门控梯度代替路由梯度的问题。 2. 专家并行不要了,训练中改用数据、pipeline和张量并行,避免了传统方...……更多
位列第一梯队,腾讯混元再度领跑国内大模型
...维度的综合性测评基准,由十大基础任务组成,包括逻辑推理、代码、语言理解、长文本、角色扮演等。本次报告选取了国内外具有代表性的32个大模型4月份的版本,通过多维度综合性测评,真实准确地反映了国内外大模型在中...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
...语言模型 (LM) 在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的,因为它们的构建和部署成本过高。改善成本 - 性能的一种方法是使...……更多
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超闭源
...ion模型打造,超越传统思维链提示,实现自主“慢思考”推理。在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型。新模型具体如何推理,直接上实例,比如问题是:减去所有的小亮球和紫...……更多
更多关于科技的资讯:
冲泡即食、真材实料:海福盛冻干粥3.1元/杯大促
海福盛冻干粥5杯日常售价24.9元,今日下单可领6元优惠券,到手18.9元,包邮到家。购买链接:天猫(券后18.9元)下单赠送芙蓉鲜蔬汤一杯
2024-12-19 17:00:00
有效期3年:瑞慈全身体检套餐279元大促(立减800元)
天猫瑞慈体检旗舰店,成人全身体检套餐日常售价1079元,可领限量800元券,实付279元入手。全国66门店通用,有效期3年
2024-12-19 17:00:00
男子给已婚女同事发“么么哒”被辞退!法院判决:公司赔偿3万9
快科技12月19日消息,近日,据媒体报道,一则法院判决案例在网络流传,网文称安徽宣城一名“70后”男职工因给已婚女同事发“我想你”“么么哒”等聊天内容等原因遭到公司的辞退
2024-12-19 17:00:00
曝富士康已建立折叠屏iPhone测试线:厚度/重量尚未达到苹果标准
快科技12月19日消息,每年关于苹果的爆料,除了下一代iPhone之外,大家最熟悉的节目可能就是折叠屏iPhone了,年年都有传闻出现
2024-12-19 17:00:00
主人杀年猪 二哈偷吃猪肉被撑死:没有饱腹感、喂养需适量
12月19日消息,很多动物其实没有饱腹感,会一直进食,甚至有可能被撑死。近日在四川泸州,一户人家杀年猪,切好的肉放在桌子上
2024-12-19 17:00:00
中兴罕见涨停 股价创近一年来新高 夺A股成交冠军
快科技12月19日消息,作为A股硬科技领域的代表公司,中兴通讯今日盘中触及涨停板,股价创下近一年来的新高,总市值也重回1800亿元以上
2024-12-19 17:00:00
2024年,茅台悠蜜的美好遇见
营收连续5年蝉联第一。——在水果发酵酒领域,茅台悠蜜可谓是异军突起。12月18日,贵州茅台(集团)生态农业产业发展有限公司(以下简称“茅台生态农业公司”)2024年市场营销工作会议在贵阳市举行
2024-12-19 17:18:00
正安县中等职业学校:产教融合培育直播电商“新农人”
多彩贵州网讯 在当今数字化经济蓬勃发展的时代,直播电商作为一种新兴的商业模式,正以惊人的速度改变着人们的消费方式和市场格局
2024-12-19 17:19:00
远大医药获治疗干眼症的全球首创创新产品的独家开发及商业化权益
远大医药获得治疗干眼症的全球首创创新产品的独家开发及商业化权益OC-01和OC-02是两种高选择性的乙酰胆碱能受体激动剂
2024-12-19 17:21:00
@山东人:2024,你的钱都去哪了?参与调查赢奖品!
2024作为消费促进年,我国一系列促消费持续落地,有效释放了内需潜力,多数商品销售增势良好,升级类商品较快增长。根据国家统计局数据
2024-12-19 17:23:00
圣诞装蒂法3D模型分享:圣诞老人版“耶路撒泠”
随着圣诞节越来越近,“3D区”博主、模型渲染爱好者@DRAYQ今天在推特中分享了自己制作的圣诞装蒂法3D建模同人图。我们的“耶路撒冷”换上了圣诞老人短裙后像是要把衣服都要撑破了
2024-12-19 17:30:00
2026北京车展提前官宣:总面积超38万平米打破历史规模纪录
快科技12月19日消息,2026(第十九届)北京国际汽车展览会已正式定档。将于2026年4月24日至5月3日在北京中国国际展览中心(顺义馆)和首都国际会展中心(新国展二期)隆重举行
2024-12-19 17:30:00
余承东:很多车厂想和我们合作 抱歉 我手里没有那么多资源了
快科技12月19日消息,鸿蒙智行年度直播今日于海南三亚举办,余承东与四界老总相聚直播间,跟撒贝宁、尼格买提、陈伟鸿跨界对话
2024-12-19 17:30:00
鲜果酿造 口感纯正!云小耳黑莓果汁大促:48元券 6罐到手11.9元
云小耳黑莓果汁242ML*6罐日常售价为59.9元,下单领取48元优惠券,到手价为11.9元。购买链接:天猫(券后11
2024-12-19 17:30:00
商务部回应美方考虑禁售TP-Link路由器:别搞有罪推定
快科技12月19日消息,有报道称,美国商务部、国防部和司法部的调查人员以国安问题为由,已经对中国路由器品牌厂商TP-Link展开调查
2024-12-19 17:30:00