• 我的订阅
  • 头条热搜
9.11和9.9哪个大?实测12个大模型8个都答错,ChatGPT也翻车了
一道小学生难度的数学题难倒了一众海内外AI大模型。9.11和9.9哪个更大?就此问题,第一财经记者测试了12个大模型,其中阿里通义千问、百度文心一言、Minimax和腾讯元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、...……更多
大模型“翻车”小学题?
...和13.8谁大?9家大模型,3家已翻车7月16日下午,南都记者实测阿里通义千问、百度文心一言、智谱清言、腾讯元宝、科大讯飞星火、字节跳动豆包、学而思九章大模型、面壁智能Luca、月之暗面Kimi等9家国产大模型。当南都记者输...……更多
开源大模型杀疯了!Mistral新模型三分之一参数卷爆Llama 3.1
...型的具体表现,量子位第一时间通过官方对话平台进行了实测。先来看最近比较流行的小数比大小问题,我们发现,Mistral Large 2能否答对很大程度上和提问方式有关。如果直接问8.9和8.11哪个大,很有可能获得一个错误答案,交...……更多
本文转自:劳动报商汤科技发布日日新5.0大模型五大产品全新亮相 局部能力赶超GPT-4本报讯(劳动报记者 陈宁)日前,在上海商汤临港AIDC举行的“2024年商汤技术交流日”活动现场,商汤发布行业首个“云、端、边”全栈大模...……更多
OpenAI发布最新技术研究,AI“黑盒”不再是难题!
...随着ChatGPT在法律、金融、营销等领域的广泛使用,确保模型的安全、准确输出同时被很好理解变得非常重要。但由于神经网络的复杂和多变性,我们根本无法验证其生成内容的准确性,这也就会出现输出“黑盒”的情况。为了...……更多
9.11比9.9大?多个大模型翻车!业内人士:就是偏科,文科强理科弱
....9哪个大”的问题一一测试了ChatGPT以及目前国内的主流大模型,包括阿里、百度等5家大厂模型,月之暗面等6家AI独角兽的模型。阿里通义千问、百度文心一言、Minimax和腾讯元宝4家大模型答对,其他8家则答错。首先是目前全球...……更多
ChatGPT o1满血版上线!实测中它竟然败给了国产AI?
...请来了两位国产AI友情参赛(kimi和文心一言)。o1满血版实测体验并非「无敌」o1模型的强项在于数学等方面的高级推理,那么就先从擅长的地方开始,一道并不算困难的数学计算题:假设一个公司生产某种商品,生产成本与产...……更多
临沂方城小学参加“和美课堂”第二十届全国小学数学名师教学观摩研讨会
...要激活学生已有的生活经验,引领学生完整经历抽象数学模型的过程,在运用模型中培养学生的数学应用意识。罗鸣亮老师分享了指向核心素养的教学方式变革,储冬生老师分享了小学数学问题驱动式教学思考与探索,让此次活...……更多
国产大模型首发中文逻辑推理,「天工大模型4.0」o1版来了
...然,Skywork o1 的成色如何,我们还是得看实战效果。一手实测这次 Skywork o1 彻底拿捏住了推理机器之心提前拿到了测试资格,对 Skywork o1 系列模型,尤其是 Lite 和 Preview 版本的推理能力进行了全方位的考察。下图为 Skywork o1 Lite ...……更多
圆周率计算:中国古代数学发展史上的明珠
...一”到歆率,不难看出当时人们对圆周率的计算还停留在实测中,缺少理论方面的计算。这一局面直到东汉时期数学家张衡的出现才被打破。张衡从圆与它的外切正方形关系入手计算圆周率。在《算罔论》和《灵宪》中都记载着...……更多
“最聪明人工智能”Grok 3竟答不出9.11和9.9哪个大?马斯克:会快速改进
... Grok 3 在数学、科学与编程的基准测试中超越了所有主流模型,并计划将其应用于 SpaceX 的火星任务计算,甚至预测未来三年内将实现诺贝尔奖级别的突破。发布会后,一些媒体测试了最新的Beta版Grok 3,并提出了那个经典的用来...……更多
奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了
...更显得“有理有据”了。新模型现身竞技场,网友第一波实测最早在昨天下午,有网友发现lmsys竞技场上多了个匿名新模型anonymous-chatbot。之前很多包括OpenAI在内很多科技公司都会发布前会进行一波测试。再加上它自称是GPT-4模型...……更多
...《角的认识》之前,让学生用牙签、小棒等材料制作角的模型,通过动手操作来体验角的特征。增加趣味性,符合儿童认知。设计作业时,教师应从学生的年龄特征出发,设计新颖有趣的数学作业,激发学生的学习兴趣。比如学...……更多
推理性能直逼o1,DeepSeek再次出手,重点:即将开源
...波,不知道大家如何顶住。耐心等待的时间里,我们先来实测一下。一手实测体验与 OpenAI o1 相同的是,根据问题的复杂程度,它也需要「思考」数十秒后再回答。虽然有些过程中的思路在人类看来可能毫无意义,甚至是错误的...……更多
寻 “车轮” 之秘密,探 “数学” 之真谛 济微中学六年级项目化学习实践纪实
...齿轮)跟着链条转动,后车轮跟着后齿轮转动。3.估算与实测对比:我估计车轮滚动一周前进( )米,我是这样想的:(基于生活经验的直观判断)。实地测量车轮直径,计算周长:周长 = π× 直径 = ( )米(精确值)。学...……更多
...境呈现知识的探究过程,帮助学生突破学习难点,构建数学模型。而教学情境呈现的探究过程,我们可以借助信息技术的处理以及教学具的辅助,如小视频讲解、音频动画、故事图表、图形直观呈现等,让学生在老师创设的情境助力中,...……更多
理想同学APP实测:真能帮奶爸辅导作业了
理想汽车的AI公司升维转型之旅,已经开始了。李想不仅做了一次长时间高密度的对外输出,而且更新了理想的发展图谱——最核心的就是要成为全球领先的人工智能公司。自动驾驶要搞,大模型要搞,具身智能机器人要搞,甚...……更多
真香!智谱大模型,有了首个免费的API
...高达 72.14 token/s,约等于每秒 115 个字符。GLM-4-Flash 模型实测GLM-4-Flash 模型已经在大量测试中展现了能力。 从模型界面来看,GLM-4-Flash 支持多轮对话、自定义系统指令构建(比如设定模型身份、任务目标)以及网页搜索、知识库...……更多
零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源
...模型上下文规模下一次跃升储备了充足“电力”。AIInfra实测实现40%训练成本下降李开复曾经表示,“做过大模型Infra的人比做算法的人才更稀缺”。超强的Infra能力是大模型研发的核心护城河之一。AIInfra(AIInfrastructure人工智能基...……更多
备战2024高考·名师指导丨今年海南高考物理如何复习备考?海中名师为您指点迷津
...,尤其不要做怪题,还是要巩固好基础知识,掌握好常见模型常规的分析方法。”他说。首先,有目的的回归课本。“回归课本是为了完善个人的知识体系。”符永龙表示,考生平时往往是在错题更正时、有知识遗忘时或者总结...……更多
顶流大模型应用!天工AI不炫技,实测真正的生产力工具
近日,OpenAI宣布,为了维护服务质量和安全性,7月9日起将采取额外措施来限制来自当前不支持的国家和地区的API流量,其中就包括中国。这意味着国内大量“套壳”大模型将无法使用,而自研大模型凸显价值。这无疑给国内的...……更多
菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM
...」经典过河难题?最近,菲尔兹奖得主Timothy Gowers分享了实测GPT-4o的过程,模型在最简单的题目上竟然做错了,甚至网友们发现,就连Claude 3.5也无法幸免。在经典的「狼-山羊-卷心菜」过河问题上,如今所有的LLM都失败了!几天...……更多
谷歌版o1突发即屠榜!思考速度比所有模型快5倍,能解摩斯代码
...。 目前在谷歌AI Studio就可以免费使用。谷歌版o1第一波实测从众多网友实测中,主要分为两大“派系”,一种是纯文本型,另一种是视觉类谜题。最明显感知的就是一个快字。它还可以解决像抛硬币这样的概率问题:如果我一...……更多
ChatGPT 的 AI 搜索正式上线!即将免费可用,实测后我们发现了这些细节
...条理性四舍五入可以充当导购了。 当然,以上只是简单实测,不妨期待我们后续一手详细的评测。根据 Similarweb 的数据, ChatGPT 在 2024 年 9 月达到创纪录的 31 亿次访问量,同比增长 112%,成为全球访问量第 11 大的网站。值得注...……更多
斯坦福AI视频生成工具免费开放!30秒时长,马斯克看了效果会沉默
...前这个名为Hedra的工具可以免费试用。在给大家带来一手实测前,再来看一波新鲜整活儿~让面值10德国马克上的“数学王子”高斯自我介绍:让石像说话、眨眼、摆动头部:生成虚拟土豆人角色:让僵尸管家变换表情:好了,鉴...……更多
讲出来才是真的懂!希望学萌娃变讲师 绽放台上三分钟
...辰一上来就聚焦题目类型,将题目抽象出了带余除法数学模型,然后再讲解该模型如何解决实际应用问题,“这套讲述完成了从具体到抽象再回到具体的过程,很有数学味儿!”张雁封老师丝毫不吝啬对小朋友的夸赞,并在后续...……更多
字节扣子搭建大模型擂台:匿名PK效果,用户当裁判,跑分时代结束
...如何操作?是否能够hold住脑洞大开的问题? 我们这就来实测一波。匿名PK,够直接,够刺激我们现在打开扣子的官网(coze.cn),点击左侧的导航栏“探索”列表中“模型广场”,便可开始体验了整体来看,对战的模式一共分为...……更多
...:贵港日报覃塘区三里镇大周小学 杨木清新课标指出,数学学科的核心素养包括:数据分析、数学运算、逻辑推理、直观想象、数学建模和数学抽象。小学阶段,学生的数学基础知识、思维方法、运算能力、问题解决能力是有...……更多
OpenAI 超强 o1 智商超 120 遥遥领先于其他模型:1 小时写出 NASA 博士 1 年代码,最新编程赛超越 99.8% 选手
...OpenAI 博士级别的智能,真的实现了!一位 UCI 物理学博士实测 o1,发现自己用时 1 年完成的博士论文代码,竟被 AI 在 1 个小时之内实现了。o1 模型已经强到,能够直出博士论文代码了!来自加州大学欧文分校(UCI)的物理学博...……更多
首发!优刻得云平台上新DeepSeek-V3-0324模型
...平均得分领跑,领先Claude3.7/GPT-4o,仅次于DeepSeek-R1。 »实测表现 X博主「@KuittinenPetri」表示,更新后的DeepSeek-V3-0324可以轻松免费地创建漂亮的HTML5、CSS和前端。 提示词如下,大家也可以自行尝试:为AI公司「Ne……更多
更多关于社会的资讯:
厦门网讯(厦门日报记者 应洁 通讯员 刘金昆)今年是陈嘉庚先生创办艺术教育100周年。昨日,集美大学举办“‘音’为有你 向‘美’而行”纪念陈嘉庚先生创办艺术教育100周年大会
2025-11-23 08:11:00
家乡到黄河源头再到浩瀚的入海口 他带着80多岁母亲沿黄河逛了个遍
万里黄河自榆林入陕,在合阳汇聚成黄河流域最大的温泉湖泊湿地——洽川湿地。对合阳人来说,“母亲河”不仅是黄河的象征,它更是一条流淌在心中的情感纽带
2025-11-23 08:35:00
八旬老人养鹅扰民遭投诉,宿松城管上网热心助卖
大皖新闻讯 11月21日,宿松经开区城管执法队队长陈为东在个人社交账号发布消息称,“刘大爷的鹅已售罄啦”。短短三天内,他帮八旬老人刘大爷卖出了58只曾因噪声扰民的大鹅
2025-11-23 10:41:00
吉林已开板!雪友纷纷落地长春龙嘉机场,雪场直通车太香了
11月22日,吉林省2025-2026新雪季开板暨第31届吉林雾凇冰雪节开幕式在松花湖度假区举行。中国吉林网、吉刻新闻记者当天来到长春龙嘉机场
2025-11-23 10:59:00
11月22日下午,福州8路公交车上一名老人突然晕倒,司机吴学兴紧急停车,暖心救助。
2025-11-23 11:48:00
近日,中行桥东支行收到客户送来的手写感谢信。大堂经理王守立在厅堂巡检时,发现客户遗落在智能柜台机具下的300元现金,他第一时间向支行行长汇报
2025-11-23 13:36:00
装修预付有担忧?青岛圣都推出“装修资金存管服务”
鲁网11月23日讯装修还没开始,就要先付一大笔钱;中途质量出问题也不能叫停,否则预付款难以追回;已经付完大额预付款,却发现供应商跑路……这些屡见不鲜的装修经历
2025-11-23 14:08:00
四川一道路窨井盖缺损缺失 当地仅竖牌提醒?社区回应:市政部门正更换井盖
大皖新闻讯近日,有网民发视频反映,四川省仁寿县一条宽阔的人行道上,部分窨井井盖存在缺损、缺失情况,当地社区仅在附近立了一块牌子提醒
2025-11-23 14:10:00
11月21日晚,第十五届全国运动会闭幕式在广东深圳市举行。604名湖北体育健儿承载荆楚人民重托,奋力拼搏,汗洒赛场,创造25金22银17铜的亮眼战绩
2025-11-23 14:21:00
23天女婴疑似呛奶窒息死亡,宝妈哭诉:“孩子太小,一火化就没了,连骨灰都没有留下”
大皖新闻讯 近日,杭州一名出生仅23天的女婴疑似因呛奶不幸离世的消息,引发网民关注。女婴父亲奉先生公开发文指控月嫂李某静存在严重失职
2025-11-23 14:46:00
免费开放!“国宝”亮相福州!
好消息!就在今天,“国宝”级画展亮相福州!展览免费开放。到福州画院,赏丹青国宝。23日,由福州市委宣传部、浙江大学、福州市文化和旅游局共同主办的“盛世修典——‘中国历代绘画大系’成果展·福州特展”开幕式在福州画院举行
2025-11-23 16:06:00
河北艺术职业学院新校区紧邻石雄城际线!高铁噪音引热议
近期石家庄市又一所大学新校区迁入正定新区。近年来,石家庄市正定新区吸引了多所学校和大学校区迁入或规划建设,逐步形成教育集聚区
2025-11-23 16:32:00
警方通报:行拘5日!女子编造在三亚潜水被拔氧气管
11月22日,三亚市公安局旅游警务支队发布警情通报:近日,李某(女,34岁)在网络发布“其在三亚海边拍照被欺诈、潜水被拔氧气管
2025-11-23 16:34:00
石家庄市14周岁女孩免费接种HPV疫苗项目年度目标完成
记者11月21日从市卫生健康委获悉,2025年石家庄市10件民生实事之一——为全市14周岁女孩免费接种HPV疫苗项目,已完成年度目标
2025-11-23 16:57:00
二十多年坚守 他甘为“城市美容师”
大皖新闻讯 今年47岁的徐开锋是宣城市国特环境科技有限公司垃圾处理技术员,20多年来先后从事河道清洁、路面保洁、垃圾填埋场推土机驾驶员等四个环卫工作岗位
2025-11-23 17:05:00