• 我的订阅
  • 头条热搜
超强AI来袭!OpenAI最新AI模型 “草莓”即将上线,推理能力惊艳
...但其实这个模型的能力可不容小觑,它能够通过多步骤的推理解决复杂的问题。根据《信息》网站的报道,“草莓” 模型将视为一种推理模型,这意味着它能够处理一些需要多步骤来完成的请求,比如解答难度较大的代数题,...……更多
微软发布旗下最小语言模型phi-2
...写电子邮件和故事,以及总结文本。在常识、语言理解和推理的基准测试中,该模型在某些领域能够跟上多达100亿个参数的模型。微软现在更新发布的Phi-2拥有27亿参数,规模虽然比此前版本翻番,但相比较其它主流语言模型,...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...三,其他都没有什么是不可替代的。Gemini 1.5 Pro是谷歌与巅峰对决的又一利器,或许AGI时代正加快到来。本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com正在改变与想要改变世界的人,...……更多
谷歌大模型推理范式,主要分为两个阶段
...新研究“自我发现”(Self-Discover),重新定义了大模型推理范式。与已成行业标准的思维链(CoT)相比,新方法不仅让模型在面对复杂任务时表现更佳,还把同等效果下的推理成本压缩至1/40。核心策略其实很简单:千人千面。...……更多
专注于推理的OpenAI“草莓”模型两周内发布?是人工智能下一重大突破
...“秋季发布”(9月至11月)要更早。上述报道称,专注于推理能力的人工智能“草莓”发布前后还有一些亟待解决的问题,但看似“仓促上马”似乎说明OpenAI感受到了大语言模型驱动产品领域的激烈竞争压力,希望通过近几个月...……更多
零一万物新模型 Yi-Lightning 发布:LMSYS 测试国产首超 GPT-4o
...4-05-13)。模型性能升级之余,零一万物宣称 Yi-Lightning 的推理速度也有提升,首包时间较上半年发布的 Yi-Large 减少一半,最高生成速度提速近四成。同时,Yi-Lightning 实现了推理成本的进一步下降。目前 Yi-Lightning 已上线 Yi 大模...……更多
CPU,正在被AI时代抛弃?
...以通过语音识别技术被录入到病例系统中,随后大模型AI推理技术辅助进行智能总结和诊断,医生们撰写病例的效率显著提高。AI推理的应用不仅节省了时间,也保护了患者隐私;在法院、律所等业务场景中,律师通过大模型对...……更多
奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了
...级智能的关键一步。它被指具有这些特性,比如在数学和推理能力方面有很大的提升,突破了人类数据的限制,可以自己生产巨量训练数据,有自主学习和自我改进的能力等等。在草莓项目正式被曝光的前几天,OpenAI科学家Noam B...……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
...的长依赖任务中的多信息检索、时间重排序、计算、理解推理能力表现均不乐观。比如像Claude3-200k,GPT4-32k、GPT4-8k、GPT3.5-turbo-6k、LlamaIndex这种商业模型,平均只有40%的准确率。而像开源模型表现就更不理想了…ChatGLM2-6B、LongLL……更多
给小学数学题加句废话,OpenAI o1就翻车了,苹果论文质疑AI推理
苹果新论文:AI 大模型可能不会推理。AI 大模型(LLM)真的像我们理解的那样能「思考」或「推理」吗?最近,苹果的一篇论文探讨了这个问题,并且给出了一个倾向于「否」的答案。相关帖子被很多人围观。这篇题为「GSM-Symb...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链(Chain-of-Thought)等技术正是由此产生的灵感。然而,可能很多人并没有意识到,很多对人类来说很简单的认知任务也往往伴随着非常复杂...……更多
AI 的“心智理论”难题:Meta ExploreToM 探索突破之路
...单的预定义场景,无法复制人类用来推断心理状态的复杂推理。ExploreToM 框架ExploreToM 通过生成多样化、可扩展的对抗性数据集,为提升 AI 的 ToM 能力奠定了坚实基础。该研究强调了当前模型的局限性,以及高质量训练数据对于...……更多
真香!智谱大模型,有了首个免费的API
...同时,GLM-4 支持了更长的上下文、更强的多模态、更快的推理速度,以及更多并发请求,大大降低了推理成本。在此基础上发展出的 GLM-4-Flash,则带来了一系列技术优势:数据预训练:引入大语言模型进入数据筛选流程,使用 10...……更多
首个o1复现开源RL框架OpenR来了,UCL、上交等高校联合团队发布
...湖大学工学院助理教授(研究)杨林易。o1 作为 OpenAI 在推理领域的最新模型,大幅度提升了 GPT-4o 在推理任务上的表现,甚至超过了平均人类水平。o1 背后的技术到底是什么?OpenAI 技术报告中所强调的强化学习和推断阶段的 Sca...……更多
比GPU性价比高百倍!Cerebras推出新AI推理服务,号称“全球最快”
...28日消息,AI芯片独角兽Cerebras Systems于8月27日宣布推出AI推理服务Cerebras Inference,号称“全球最快”。该服务已经在云端上线。据官网介绍,该推理服务在保证精度的同时,速度比英伟达的服务快20倍;其处理器内存带宽是英伟达...……更多
推理性能直逼o1,DeepSeek再次出手,重点:即将开源
...出手了,这次又是重磅炸弹。昨晚,DeepSeek 上线了全新的推理模型 DeepSeek-R1-Lite-Preview,直接冲击 OpenAI o1 保持了两个多月的大模型霸主地位。在美国数学竞赛(AMC)中难度等级最高的 AIME 以及全球顶级编程竞赛(codeforces)等权...……更多
补齐Transformer规划短板又不放弃快速思考,Dualformer双重优势
...些解答或慢点思考。OpenAI ο1 模型的发布掀起了人们对 AI 推理过程的关注,甚至让现在的 AI 行业开始放弃卷越来越大的模型,而是开始针对推理过程进行优化了。今天我们介绍的这项来自 Meta FAIR 田渊栋团队的研究也是如此,其...……更多
语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了
...到,人类大脑生成和解析语言的神经网络并不负责形式化推理,而且提出推理并不需要语言作为媒介。这篇论文声称「语言主要是用于交流的工具,而不是思考的工具,对于任何经过测试的思维形式都不是必需的」,引发了科技...……更多
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...们刚才所述,32个基准测试中拿下30个SOTA。其中,通用、推理、数学和编程等大方向的成绩如下表所示:△Gemini 在包括文本和编码在内的一系列基准测试中达到SOTA 在多模态方面,Gemini Ultra在新的MMMU基准测试中也获得了59.4%的SOT...……更多
消息称OpenAI计划两周内发布新AI模型“草莓” 专注于推理
...于之前的预期。根据之前的报道,“草莓”是一款专注于推理的AI产品,预计于今秋发布。但这两位测试过该模型的人士称,OpenAI计划在未来两周内发布“草莓”。当然,最终的日期也可能生变。需要指出的是,虽然“草莓”是C...……更多
o1突发内幕曝光?谷歌更早揭示原理 大模型光有软件不存在护城河
...果比较有限。因此该研究想要探明,在使用比较少的额外推理计算时,就能能让模型性能提升多少?他们设计了一组实验,使用PaLM2-S*在MATH数据集上测试。主要分析了两种方法:(1)迭代自我修订:让模型多次尝试回答一个问...……更多
国产大模型首发中文逻辑推理,「天工大模型4.0」o1版来了
...去,如此自信的原因可能在于最近人们让大模型学会了「推理」的方法。就在 9 月份,OpenAI 正式公开前所未有的复杂推理大模型 o1,这是一个重大突破,新模型既具有通用的能力,也可以解决比此前的科学、代码和数学模型能...……更多
LeCun 的世界模型初步实现!基于预训练视觉特征,零样本规划
...常有限…… 无法理解物理世界,没有持续性记忆,不能推理(只要推理的定义是合理的)、不能规划。」Yann LeCun 批评 LLM 的推文之一相反,他更注重所谓的世界模型(World Model),也就是根据世界数据拟合的一个动态模型。比...……更多
香港金融科技周|度小满CEO朱光:推理大模型将深入到金融核心业务
...注的话题。度小满CEO朱光在科技周主论坛上表示,“以o1推理大模型为代表的新一波生成式AI技术在金融领域的应用,将从外围场景深入到核心业务,直接影响金融行业的核心决策质量,在为客户的产品和服务体验上带来巨大突...……更多
浩鲸科技鲸智BI大模型发布,从算法炫技到价值落地
...于复杂数据关系的理解能力,还赋予了其基于先验知识的推理与推断能力。这一过程实现了知识数据与大模型的深度融合与相互促进,使得机器能够更加精准地把握人类语言的深层含义,并在实际应用中展现出更高的精准度与鲁...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
...业基准测试中达到了 SOTA,并提供了新的功能,如改进的推理能力。最强开源 LLM 来了Meta 官方博客写道,“得益于预训练和后训练的改进,我们的预训练和指令微调模型是目前 8B 和 70B 参数尺度下最好的模型。”他们表示,后期...……更多
安兔兔评测pc版正式发布,欢迎大家下载体验
...行效率进行评估,小到简单的数学运算,大到复杂的逻辑推理和大语言模型问答等多个方面,更加全面地展现CPU在不同AI应用中的表现。由于CPU属于计算机的核心部件,所以在AI处理中起着至关重要的作用。GPU测试部分,与CPU的...……更多
近日,高通公司发布了新一代云AI推理加速卡——CloudAI100Ultra。这款产品专为生成式AI和大型语言模型而设计,提供相当于上一代产品四倍的性能。新款CloudAI100Ultra可部署的模型规模进一步扩大,单张150W的卡上可部署100B参数模...……更多
NeurIPS 2024 | 数学推理场景下,首个分布外检测研究成果来了
本文将介绍数学推理场景下的首个分布外检测研究成果。该篇论文已被 NeurIPS 2024 接收,第一作者王一鸣是上海交通大学计算机系的二年级博士生,研究方向为语言模型生成、推理,以及可解释、可信大模型。该工作由上海交通...……更多
商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单
...73.56的高分,并在数理逻辑维度取得第一,体现其强大的推理能力。 SenseChat-Vision5.5基础能力突出,数理逻辑维度超越GPT-4o本次SuperCLUE-V涵盖了国内外最具代表性的11个开源/闭源多模态理解大模型,聚焦多维度能力评估,包括基...……更多
更多关于科技的资讯:
南京科远智慧科技集团股份有限公司——国产“智慧大脑”装进“世界级”火电机组【编者按】2025年伊始,南京企业“抢单”忙
2025-01-07 08:15:00
买了没几年的羽绒服不保暖了 原来很多人做错了这2点
这年头,能面不改色随手就买下一件新羽绒服的,都是狠人。毕竟,今年羽绒服的价格确实让人有些“高攀不起”。很多人只能从衣柜最深处掏出了尘封好几年的羽绒服……不过
2025-01-07 08:17:00
2024年度性能最强笔记本TOP10出炉:微星泰坦18 Ultra登顶
快科技1月7日消息,鲁大师公布了2024年度性能最强笔记本TOP10榜单,其中微星泰坦18 Ultra 2024荣获榜首
2025-01-07 08:17:00
历经十年,在多个领域实现“零的突破” 浙江商业航天将飞向何方
刚刚过去的2024年底,国内航天发射活动仍然密集:11月11日,浙江制造的试验26号A、B、C三颗卫星发射升空;12月5日
2025-01-07 08:38:00
京东游戏机国家补贴已上线:PS5、XSX等全覆盖
快科技1月7日消息,2025年政府补贴继续加码,目前京东、天猫等平台已经陆续开启。值得注意的是,目前京东平台还开启了游戏设备的补贴
2025-01-07 08:47:00
长城发布置换补贴兜底政策!涵盖哈弗、魏牌、欧拉等品牌
快科技1月7日消息,长城汽车旗下哈弗、魏牌、欧拉、坦克等品牌推出了补贴兜底政策,为消费者提供现金红包优惠、置换补贴、保险补贴等购车权益
2025-01-07 08:47:00
河南官宣继续补贴:将手机平板等纳入以旧换新范围
快科技1月7日消息,上周,国家发展改革委有关负责人表示,2025年将继续实施补贴政策。同时,新增手机等数码产品购新补贴
2025-01-07 08:47:00
厦门网讯(厦门日报记者 李晓平)近日,工业和信息化部装备工业一司发布了“关于卓越级智能工厂(第一批)项目的公示”,共计235家
2025-01-07 08:50:00
厦门网讯(厦门日报记者 林露虹)从AI“助教”给学生个性化出卷、改卷,到AI高效完成政务预审批工作,再到AI优化船舶调度方案……越来越多的厦门造AI智能体落地应用
2025-01-07 08:50:00
临沂:“商仓流”一体化形成直播产业链条
临沂市“商仓流”一体化,形成了直播基地、智慧云仓、智慧物流园相互配套的直播产业链条。
2025-01-07 08:54:00
牵手红娘:牵手App红娘服务成热门,全程指导备受青睐
在数字化时代,年轻人的生活方式和社交习惯正经历着前所未有的变革,线上交友已成为寻找另一半的重要途径之一。然而,面对海量的信息和复杂的人际关系
2025-01-07 09:15:00
近日,中国长城第一名中标“某国有大型商业银行2024年IT及网络设备集中采购”项目,标志着公司在金融行业网信建设领域取得又一突破性成果
2025-01-07 09:16:00
奔驰史上最快量产车!全新梅AMG GT 63 SEP上市:售228.55万元
快科技1月7日消息,全新梅赛德斯-AMG GT 63 S E PERFORMANCE跑车正式上市,售价228.55万元
2025-01-07 09:17:00
盲人愤怒将占用过道的电动车推倒引热议:网友点赞支持
1月7日消息,近日,湖南长沙一位视障人士在使用盲道时,发现盲道被电动车等障碍物占据,导致其行走受阻。在多次尝试绕行未果后
2025-01-07 09:17:00
英伟达近乎垄断又如何!英特尔:不会放弃和关闭旗下独立显卡业务
快科技1月7日消息,英特尔已经明确表示,不会关闭其独立显卡业务,即便英伟达在这个领域近乎垄断的存在。英特尔新CEO Michelle Johnston Holthaus在CES 2025主题演讲中向听众表示
2025-01-07 09:17:00