• 我的订阅
  • 头条热搜
给小学数学题加句废话,OpenAI o1就翻车了,苹果论文质疑AI推理
苹果新论文:AI 大模型可能不会推理。AI 大模型(LLM)真的像我们理解的那样能「思考」或「推理」吗?最近,苹果的一篇论文探讨了这个问题,并且给出了一个倾向于「否」的答案。相关帖子被很多人围观。这篇题为「GSM-Symb...……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
...的长依赖任务中的多信息检索、时间重排序、计算、理解推理能力表现均不乐观。比如像Claude3-200k,GPT4-32k、GPT4-8k、GPT3.5-turbo-6k、LlamaIndex这种商业模型,平均只有40%的准确率。而像开源模型表现就更不理想了…ChatGLM2-6B、LongLL……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...“天工2.0”MoE大模型,“天工3.0”在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升,其模型技术知识能力提升超过20%,数学/推理/代码/文创能力提升超过30%。同时,“天工...……更多
AI发展变慢了?几位AI头部创业者并不赞同
...月份发布的GPT-4o(多模态语言大模型),9月份发布的o1(推理大模型),质量都可圈可点。与去年相比,他认为,今年AI行业的特色是,之前只有OpenAI一家独大,现在已经变成了群雄并起、你追我赶的状态,各家公司都在提速。...……更多
补齐Transformer规划短板又不放弃快速思考,Dualformer双重优势
...些解答或慢点思考。OpenAI ο1 模型的发布掀起了人们对 AI 推理过程的关注,甚至让现在的 AI 行业开始放弃卷越来越大的模型,而是开始针对推理过程进行优化了。今天我们介绍的这项来自 Meta FAIR 田渊栋团队的研究也是如此,其...……更多
智启新元年:PC成为AI落地首选终端
...,真正走入大众生活,已经到时候了。距离AI普惠,还有多远?可以说,当下生成式AI的“涌现”,是多种软硬件技术发展成熟的共同结果。硬件方面,GPU技术高速发展、框架不断更新,已自比CPU更快运行3D图像的“显卡”角色脱...……更多
16家头部大模型公司上海神秘碰头,现场人挤人人人
...最为关键的三大层面,即:算力层:用于基础模型训练和推理的基础设施 模型层:使用基础模型加速生成式AI应用构建 应用层:开箱即用的生成式AI应用至于能力如何,我们直接来看下最为直观的效果。在生成式AI应用方面,...……更多
华东师范大学的老师,上课已经用上了大模型
...的算力,还要有灵活组合、弹性扩展的能力,既能兼顾AI推理等新型负载,又要进一步强化传统的通用计算平台及应用。第二,软硬兼修的优化适配。随着大模型在教育领域的应用兴起,高校对AI平台提出了更高的要求。一方面...……更多
构建数字经济新引擎:枫清科技 高雪峰解读AI技术的未来趋势
...地过程中也暴露出一系列问题,如大模型“幻觉”现象、推理能力不足、解释性差等。这些问题导致很多企业面临大模型“好玩不好用”的困境。如何真正推动大模型技术在企业场景中的深度应用,成为当前AI产业发展的重要课...……更多
AI表现直逼国际奥数优秀选手, 它要 “征服”数学了吗?
...同步揭晓。这项赛事的目的是推动发展大语言模型的数学推理能力,训练出更高数学水平的新AI模型。纯数学领域中的重大发现是推理和创造力的灵感结晶,往往意味着人类智慧极限的突破。迄今为止,解决或协助解决高等级数...……更多
跨越算力鸿沟丨星凡科技2024AI算力集群产品发布会圆满成功
...单纯的计算资源提供者,他们需要向客户提供大模型训练推理等增值服务,以减少客户在模型开发过程中的成本负担,助力客户进行人工智能转型,从而实现双赢。”超新星分布式微算力中心——AICC建设运营高性价比选择本次...……更多
大模型降价背后,国产大模型的竞争逻辑变了
...市场拱手让人。另一方面,随着大模型产业的快速发展,推理成本飞速下降,也成为终端降价的基础。据百度官方透露,相比一年前,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了1...……更多
...OpenAI神秘“草莓”和“猎户座”模型“泄漏”。“草莓”推理能力大爆发,可处理复杂数学问题;“猎户座”则是超越GPT-4的下一代大模型,使用“草莓”的高质量数据训练,从而减少模型产生的幻觉或错误。该公司很可能使用...……更多
国产大模型加速落地,争夺“中国版ChatGPT”心智定位
...技等也分别推出全新的大模型产品。李开复表示,大模型推理成本的下降会推动中国AI大模型进入”落地为王”的阶段,今年会迎来“大模型应用爆发元年”。他同时预测,明年下半年,随着大模型推理成本的大幅度下降,人们...……更多
化学:强化归类研究 明确命题追求
...生在“宏微结合”“变化平衡”等思想观念指引下的证据推理、模型认知、科学探究与符号表征等能力素养状况以及科学态度、社会责任等个性品质与价值观念发展水平。这样的命题追求是指导并统领命题的行动指南。毫无疑问...……更多
LLM群体智能崛起,数学性能暴增11.6%!谷歌DeepMind四大机构联手新作
...认知,数学最考验元认知,原本是指,人类对自己思维、推理过程的直观认识。那么,大模型也具备「元认知」的能力吗?研究人员对此,提出了一种假设,并设想是否可以通过知识引导,进一步提高LLM的能力。 其实,此前的...……更多
Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对
...科学家Denny Zhou拿出一篇ICLR 2024论文称:CoT可以让Transformer推理无极限。但随即他就遭到了田渊栋和LeCun等的质疑。最终,CoT会是通往AGI的正确路径吗?随着OpenAI o1的爆火,最近CoT也成了圈内热议的高频词。靠着CoT的强力加持,o1...……更多
...生猜想,再提出理论猜想,继而经过数理或通过猜想建立推理范式,对其推理体系中具有共性的问题进行实验检验,并可结合数理模型和实际观察进行检验,以矫正理论猜想。在多次检验的基础上形成更加完善并经地起实践检验...……更多
...的32项学术基准中,从自然图像、音频和视频理解到数学推理,“双子座”Ultra的性能有30项超过了当前先进水平。谷歌公司称,在图像识别领域的测试结果显示,“双子座”Ultra性能优于迄今最先进的人工智能模型,具有天然多...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...也能让模型在处理长期、分散和个性化的数据时逐步提升推理和学习能力。用 LTM 数据提升模型能力,使其能够自我进化在传统 LLM 中,更新模型通常需要调整所有参数,而如果目的是处理个体数据,那这种操作明显不切实际。...……更多
商汤生成式AI业务飙涨256%,成为中国大模型、智算服务市场占有率领头羊
...劲需求、“日日新SenseNova”大模型能力的飞跃式提升以及推理成本的快速下降,带动模型调用量增长迅速。报告期内,“绝影”智能汽车业务的表现也极为亮眼。其业务收入达1.7亿元,同比增长100%。上半年新增交付70.5万辆车,...……更多
华为harmonyosnext重塑全新“星盾”安全架构
...应用设计;PanguP系列,百亿级参数,为低时延、低成本的推理场景提供支持;PanguU系列,千亿级参数,适用于处理复杂任务,成为企业通用大模型的坚实基础;PanguS系列,万亿级参数,作为超级大模型,能够处理跨领域多任务,...……更多
菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM
... 3.5依旧答错了。LeCun在此嘲讽大模型一番,大模型竟可以推理...?问题在于,LLM没有常识,不理解现实世界,也不会规划和推理。LLM行不行,就看提示了一位网友分析总结了,以上LLM失败的原因。他表示,LLM本身就是个「哑巴」...……更多
RAG真能提升LLM推理能力?人大最新研究:数据有噪声,RAG性能不升反降
...智元导读】RAG通过纳入外部文档可以辅助LLM进行更复杂的推理,降低问题求解所需的推理深度,但由于文档噪声的存在,其提升效果可能会受限。中国人民大学的研究表明,尽管RAG可以提升LLM的推理能力,但这种提升作用并不是...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...,准确率高达100%。图片来源:GPT-4o四、手写指令和逻辑推理最后,记者上了点难度,用手写的逻辑推理题来测试了GPT-4o的识图和逻辑推理能力。GPT-4o的回答堪称完美,不仅准确识别了手写体文字并遵照指示,且答题逻辑完全合...……更多
倒计时10天!百度世界2023五大亮点全剧透
...以来,文心一言在一个月内即完成四次升级,让大模型的推理成本降低至原来的十分之一;文心大模型升级至3.5版本后,训练速度提升到原来的3倍,推理速度达到原本的30多倍。它是否还能更进一步,追超GPT-4,在生活生产中扮...……更多
对标GPT-4o!商汤发布两大国内首个大模型 入局价格战
...短两个月,综合性能较“日日新5.0”平均提升30%,在数学推理、英文能力和指令跟随等能力明显增强,交互效果和多项核心指标实现对标GPT-4o。据了解,“日日新5.5”模型训练是基于超10TB tokens高质量数据,包括大量合成的思维...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...不断提升,例如GPT-4o在大学水平上的多学科多模态理解和推理(MMMU)基准测试中取得了69.1%的准确率。不过,基准测试结果是否真的能反映模型对多样化主题的深入理解,仍然有争议,或者说模型是否只是利用了统计模式,而非...……更多
中国首个音乐SOTA模型「天工音乐大模型」今日公测
...全球最大的开源MoE大模型。「天工3.0」在语义理解、逻辑推理、通用性、泛化性、不确定性知识、学习能力等领域拥有突破性的性能提升,数学/推理/代码/文创能力提升超过30%。 (天工3.0模型参数超越Grok-1,成全球最大开源MoE...……更多
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
...据具体询问的内容,模型只会激活不同的专家子模块进行推理,在吞吐量一定的情况下,可以更快地完成推理、给出回答。这让Grok-1拥有了更快的生成速度和更低的推理成本,简而言之就是更好的使用体验和性价比。根据xAI公布...……更多
更多关于科技的资讯:
铭瑄加入英特尔 AIC 阵营,预告拥有额外金手指“电竞之心”显卡
IT之家 12 月 2 日消息,铭瑄官方 X 平台账户北京时间 11 月 30 日宣布将加入英特尔独立显卡 AIC 阵营
2024-12-02 18:21:00
iOS 隐藏神技,3分钟内改善网络信号
iPhone 信号差的唯一优化方法,效果虽有,可惜不能一直维持,重启就会失效。如果你的iPhone信号差,打王者404
2024-12-02 18:22:00
荣耀300 Ultra核心参数曝光:80W无线快充 仅8.2mm厚
【CNMO科技消息】根据官方公布的消息,荣耀300系列将于12月2日正式发布。和此前不同的是,荣耀300系列将带来一款“超大杯”机型
2024-12-02 18:24:00
iPhone 17「设计图」曝光,买吗?
对于苹果用户来说,每年最期待的无疑是新 iPhone 的发布。前段时间,外界进一步曝光了关于 iPhone 17 系列在设计上的一些细节
2024-12-02 18:24:00
华为打响“价格战”,从2799元跌至1868元,512GB+5000万+66W闪充
这段时间手机行业热度最高的机型,毫无疑问就是华为Mate70系列旗舰了,不过可惜这个华为新旗舰虽然惊艳,但价格比较高,很多普通消费者舍不得买
2024-12-02 18:25:00
曝华为Pura80测试多焦段潜望镜,从RYYB到红枫原色,等等友商吧!
虽然这些年华为被制裁,但华为的创新从来就没有停滞过,友商看不懂更跟不上。近日根据博主“数码闲聊站”爆料,华为一款新旗舰手机正在测试多焦段潜望镜镜头
2024-12-02 18:25:00
REDMI今年最后一款新机!REDMI Turbo 4全球首发天玑8400
快科技12月2日消息,王腾发微博暗示,REDMI12月份还有一款手机要发布,这是REDMI今年最后一款新品。在评论区,有网友给出了答案
2024-12-02 18:25:00
高天试验设备|挑选高低温冲击试验箱要看哪几个方面?
高低温冲击试验箱又名冷热冲击试验箱,为样品提供冷热交替冲击的环境模拟检测,是检测品质重要的仪器。那么大家知道挑选高低温冲击试验箱要看哪几个方面吗?下面高天试验设备小编就来为大家介绍下
2024-12-02 17:02:00
以“数”为笔 以“智”着墨 绘就和美乡村新画卷
本文转自:人民网-安徽频道“建设农业强国,利器在科技”。在乡村振兴的宏伟蓝图中,中国电信安徽公司勇挑重担,充分彰显其作为服务型
2024-12-02 17:10:00
本文转自:人民网-广西频道近日,由桂林中检数据科技服务有限公司、广西师范大学、广西高校创新创业教育研究中心和广西师范大学中国—东盟数字科技研究院联合主办的“八桂之约·院士专家冬令营”桂林数字经济高质量发展峰会在桂林成功举办
2024-12-02 17:14:00
中国十七冶“智建云商”上线
本文转自:人民网-安徽频道12月2日,由中国十七冶牵头,携手马鞍山市智能建造产业联合会开发的“智建云商”电子商务平台上线仪式成功举行
2024-12-02 17:24:00
本文转自:人民网人民网北京12月2日电 (记者赵竹青)记者从中国电子学会获悉,第二十六届全国可靠性物理年会11月29日至12月1日在浙江温州举办
2024-12-02 18:05:00
微软自去年5月推出Copilot+PC以来,一直大力推广该产品。近日,微软在社交媒体X上发布了一条5秒的短视频,声称Copilot+PC是“有史以来最快
2024-12-02 14:07:00
今日智界新S7正式在全国范围内开启大规模交付。于深圳举办的首批交车仪式中,华为常务董事、终端BG董事长、智能汽车解决方案BU董事长余承东现身
2024-12-02 14:10:00
河南宠业汇:以专业为帆,与2000+门店共赢前行
宠物时代新物语,做一家有态度的新媒体!文|许汐全文共计|3823字如果说个体的力量犹如涓涓细流,那么当四五个志同道合的人汇聚一堂时
2024-12-02 14:10:00