• 我的订阅
  • 头条热搜
9.11和9.9哪个大?实测12个大模型8个都答错,ChatGPT也翻车了
一道小学生难度的数学题难倒了一众海内外AI大模型。9.11和9.9哪个更大?就此问题,第一财经记者测试了12个大模型,其中阿里通义千问、百度文心一言、Minimax和腾讯元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、...……更多
大模型“翻车”小学题?
...和13.8谁大?9家大模型,3家已翻车7月16日下午,南都记者实测阿里通义千问、百度文心一言、智谱清言、腾讯元宝、科大讯飞星火、字节跳动豆包、学而思九章大模型、面壁智能Luca、月之暗面Kimi等9家国产大模型。当南都记者输...……更多
开源大模型杀疯了!Mistral新模型三分之一参数卷爆Llama 3.1
...型的具体表现,量子位第一时间通过官方对话平台进行了实测。先来看最近比较流行的小数比大小问题,我们发现,Mistral Large 2能否答对很大程度上和提问方式有关。如果直接问8.9和8.11哪个大,很有可能获得一个错误答案,交...……更多
本文转自:劳动报商汤科技发布日日新5.0大模型五大产品全新亮相 局部能力赶超GPT-4本报讯(劳动报记者 陈宁)日前,在上海商汤临港AIDC举行的“2024年商汤技术交流日”活动现场,商汤发布行业首个“云、端、边”全栈大模...……更多
OpenAI发布最新技术研究,AI“黑盒”不再是难题!
...随着ChatGPT在法律、金融、营销等领域的广泛使用,确保模型的安全、准确输出同时被很好理解变得非常重要。但由于神经网络的复杂和多变性,我们根本无法验证其生成内容的准确性,这也就会出现输出“黑盒”的情况。为了...……更多
9.11比9.9大?多个大模型翻车!业内人士:就是偏科,文科强理科弱
....9哪个大”的问题一一测试了ChatGPT以及目前国内的主流大模型,包括阿里、百度等5家大厂模型,月之暗面等6家AI独角兽的模型。阿里通义千问、百度文心一言、Minimax和腾讯元宝4家大模型答对,其他8家则答错。首先是目前全球...……更多
临沂方城小学参加“和美课堂”第二十届全国小学数学名师教学观摩研讨会
...要激活学生已有的生活经验,引领学生完整经历抽象数学模型的过程,在运用模型中培养学生的数学应用意识。罗鸣亮老师分享了指向核心素养的教学方式变革,储冬生老师分享了小学数学问题驱动式教学思考与探索,让此次活...……更多
圆周率计算:中国古代数学发展史上的明珠
...一”到歆率,不难看出当时人们对圆周率的计算还停留在实测中,缺少理论方面的计算。这一局面直到东汉时期数学家张衡的出现才被打破。张衡从圆与它的外切正方形关系入手计算圆周率。在《算罔论》和《灵宪》中都记载着...……更多
奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了
...更显得“有理有据”了。新模型现身竞技场,网友第一波实测最早在昨天下午,有网友发现lmsys竞技场上多了个匿名新模型anonymous-chatbot。之前很多包括OpenAI在内很多科技公司都会发布前会进行一波测试。再加上它自称是GPT-4模型...……更多
...境呈现知识的探究过程,帮助学生突破学习难点,构建数学模型。而教学情境呈现的探究过程,我们可以借助信息技术的处理以及教学具的辅助,如小视频讲解、音频动画、故事图表、图形直观呈现等,让学生在老师创设的情境助力中,...……更多
真香!智谱大模型,有了首个免费的API
...高达 72.14 token/s,约等于每秒 115 个字符。GLM-4-Flash 模型实测GLM-4-Flash 模型已经在大量测试中展现了能力。 从模型界面来看,GLM-4-Flash 支持多轮对话、自定义系统指令构建(比如设定模型身份、任务目标)以及网页搜索、知识库...……更多
零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源
...模型上下文规模下一次跃升储备了充足“电力”。AIInfra实测实现40%训练成本下降李开复曾经表示,“做过大模型Infra的人比做算法的人才更稀缺”。超强的Infra能力是大模型研发的核心护城河之一。AIInfra(AIInfrastructure人工智能基...……更多
备战2024高考·名师指导丨今年海南高考物理如何复习备考?海中名师为您指点迷津
...,尤其不要做怪题,还是要巩固好基础知识,掌握好常见模型常规的分析方法。”他说。首先,有目的的回归课本。“回归课本是为了完善个人的知识体系。”符永龙表示,考生平时往往是在错题更正时、有知识遗忘时或者总结...……更多
顶流大模型应用!天工AI不炫技,实测真正的生产力工具
近日,OpenAI宣布,为了维护服务质量和安全性,7月9日起将采取额外措施来限制来自当前不支持的国家和地区的API流量,其中就包括中国。这意味着国内大量“套壳”大模型将无法使用,而自研大模型凸显价值。这无疑给国内的...……更多
菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM
...」经典过河难题?最近,菲尔兹奖得主Timothy Gowers分享了实测GPT-4o的过程,模型在最简单的题目上竟然做错了,甚至网友们发现,就连Claude 3.5也无法幸免。在经典的「狼-山羊-卷心菜」过河问题上,如今所有的LLM都失败了!几天...……更多
斯坦福AI视频生成工具免费开放!30秒时长,马斯克看了效果会沉默
...前这个名为Hedra的工具可以免费试用。在给大家带来一手实测前,再来看一波新鲜整活儿~让面值10德国马克上的“数学王子”高斯自我介绍:让石像说话、眨眼、摆动头部:生成虚拟土豆人角色:让僵尸管家变换表情:好了,鉴...……更多
字节扣子搭建大模型擂台:匿名PK效果,用户当裁判,跑分时代结束
...如何操作?是否能够hold住脑洞大开的问题? 我们这就来实测一波。匿名PK,够直接,够刺激我们现在打开扣子的官网(coze.cn),点击左侧的导航栏“探索”列表中“模型广场”,便可开始体验了整体来看,对战的模式一共分为...……更多
讲出来才是真的懂!希望学萌娃变讲师 绽放台上三分钟
...辰一上来就聚焦题目类型,将题目抽象出了带余除法数学模型,然后再讲解该模型如何解决实际应用问题,“这套讲述完成了从具体到抽象再回到具体的过程,很有数学味儿!”张雁封老师丝毫不吝啬对小朋友的夸赞,并在后续...……更多
...:贵港日报覃塘区三里镇大周小学 杨木清新课标指出,数学学科的核心素养包括:数据分析、数学运算、逻辑推理、直观想象、数学建模和数学抽象。小学阶段,学生的数学基础知识、思维方法、运算能力、问题解决能力是有...……更多
OpenAI 超强 o1 智商超 120 遥遥领先于其他模型:1 小时写出 NASA 博士 1 年代码,最新编程赛超越 99.8% 选手
...OpenAI 博士级别的智能,真的实现了!一位 UCI 物理学博士实测 o1,发现自己用时 1 年完成的博士论文代码,竟被 AI 在 1 个小时之内实现了。o1 模型已经强到,能够直出博士论文代码了!来自加州大学欧文分校(UCI)的物理学博...……更多
实测 GPT-o1:学会了思考 也学会了偷懒
我可能是全网第一个花钱向 GPT-o1 提问,人在深圳靠一条网线横跨太平洋到美国硅谷让 OpenAI 最强大模型 GPT-o1 模型思考 38 秒之后、宕机了半小时选择拒绝回答问题并收了我2.5块(一瓶肥宅快乐水)的韭菜...... (因为这个模型只...……更多
腾讯混元大模型批量上新:10秒生成AI图像,超过180个腾讯业务接入 | 最前线
...千亿级主模型,中文效果整体超过GPT3.5,而7B/13B中小模型实测效果整体优于国内外开源模型,如LLaMA2等。 康战辉尤其指出了压缩比这一参数——同等效果下,混元仅需较少的tokens,训练效率更高。如今,基于,基于探真技术,...……更多
偷X数据 用特斯拉显卡 马斯克把AI炼成啥样了?
有个怪事儿,前段时间,大模型竞技场上,一位代码为 sus-column-r 的匿名模型横空出世。没人知道它师出何门,但在过去的一个月里,它却称得上是过关斩将。。。累计一万多人的投票,硬生生让它挤进了排行榜前列。到现在,...……更多
做好中考数学冲刺复习
...率的计算和应用。四是应用题,包括:解实际问题的数学模型;运用数学知识解决实际问题。2.基础题目训练。在冲刺复习阶段,同学们要通过大量基础题目训练,巩固基础知识,提高解题能力。建议同学们重点练习易错题和常...……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...业大学工作期间,他曾和同事在一项研究中成功提高了大模型解决复杂数学问题的能力。通过此,他们不仅提高了算法推理速度,还提高了算法搜索中间结果的质量。所新推出的数据集 TriMaster100,也更加符合算法在复杂数学问...……更多
不用部署,实现大模型切换自由!Token、算力免费薅!
...疼的问题了~不用下载!实现模型试用自由!开源大模型实测频道持续上新,在线随便用、花样试~ 不用部署!实现模型 API 切换自由!看上哪个模型立刻换,MaaS API一键启动 ~ 不用充值!实现DEMO开发token自由!免费算力「立等可...……更多
苹果AI震撼上线iPhone,进化版Siri却没有ChatGPT!47页技术报告揭秘自研模型
...批拿到iOS18.1测试用户,已经在欢呼雀跃,一波又一波的实测分享铺屏全网。最新推出的预览版,包含了许多惊喜(速览版):全新Siri:唤醒时会在屏幕边缘亮起柔光;与用户交流,可在文本语音之间随意切换;说话者磕磕绊绊...……更多
...9哪个更大?一道小学生都会的数学题,却难倒了一众AI大模型。昨天,“大模型测不出9.11和9.9哪个大”还登上了微博热搜。这个难倒大多数AI大模型的数学题,其实来自于最近热播的《歌手》。7月13日,在最新一期《歌手》公布...……更多
...加快研究成果转化,培养“数学+”复合型人才 两大应用模型同日发布 本报讯 (记者 姜澎)上海张江再增一家新型研发机构。上海张江数学研究院日前正式成立,上海张江数学院同济大学分院和上海大学分院也同时成立。...……更多
...本文转自:科技日报人工智能提供学习知识新途径大语言模型对著名数学问题有“新见解”【总编辑圈点】科技日报北京12月14日电 (记者张梦然)“深度思维”团队利用大语言模型(LLM)对一个著名的数学问题提出了“新见解...……更多
更多关于社会的资讯:
大皖新闻讯 9月29日,池州市住房公积金管理委员会发布《关于优化住房公积金使用政策的通知》称,为进一步发挥住房公积金制度保障作用
2025-09-30 12:48:00
大河网讯 为了让群众足不出户就能了解到医保政策,河南省医疗保障服务中心与大河网联合打造了“河南省医保中心直播间”,并推出“小保答粉丝问”系列短视频
2025-09-30 13:43:00
“连北大都在举办公务员模拟考试”,985名校正推着学生上岸
作者:香菇 李彤一模、二模,高考结束整整6年后,李津没想到,这些词又回归自己的生活。9月13日,周六早上8点40分,他抵达北京大学光华管理学院的大阶梯教室
2025-09-24 08:40:00
探索IP全球化新路径 网络文学出海洽谈会在杭州举行
9月27日,网络文学出海洽谈会暨IP直通车专项活动在浙江省杭州市滨江区举行。本次活动作为2025中国国际网络文学周的重要组成部分
2025-09-30 13:09:00
淄博鲁才高级中学举办“迎国庆·展风采”师生篮球比赛
9月28日,淄博鲁才高中举办“迎国庆·展风采”师生篮球联赛,这场跨越讲台与球场的较量,不仅点燃了全校师生的运动热情,更展现了拼搏向上的精神风貌
2025-09-30 12:47:00
尾号66666666手机号即将200万起拍,已吸引1万多人次围观
大皖新闻讯 9月30日,大皖新闻记者从阿里资产平台看到,郑州高新技术产业开发区人民法院将于10月16日拍卖号码为“1**66666666”的移动手机号一个
2025-09-30 12:46:00
数据迁徙中的“药”者担当:HIS系统升级背后的药剂科力量
鲁网9月30日讯近日,平度市第三人民医院药剂科接到医院HIS系统升级的指令,一场关乎药品数据精准流转的“攻坚战”,在药剂科的药库
2025-09-30 10:41:00
保函业务具有突发性,往往要求在合同指定时间内必须出具保函,对办理速度要求高。在传统模式下,小微企业办理保函业务常常面临着效率与管理成本等多重挑战
2025-09-30 10:45:00
花甲老人命悬一线 邢医二院多学科联合救治化险为夷
河北新闻网讯(杨永丽)近日,邢台医学院第二附属医院上演了一场惊心动魄的“生命接力赛”。消化内科、介入血管外科、内镜室、输血科
2025-09-30 10:16:00
山东移动烟台分公司保障国际核电工业及装备博览会通信无忧
金秋九月,渤海之滨,2025山东清洁能源产业博览会暨第十八届烟台国际核电工业及装备博览会在烟台八角湾国际会展中心启幕。据悉
2025-09-30 09:59:00
在北京国际设计周,看到来自马德里的《光之线条》
中国青年报客户端讯(中青报·中青网记者 蒋肖斌)9月29日,作为2025北京国际设计周的重点项目之一,马德里主宾城市展《光之线条(The Line Dreams)》在北京启皓艺术馆开幕
2025-09-30 10:04:00
辅具租赁服务纳入烟台市长期护理保险保障范围
2025年1月1日起,烟台市长期护理保险将辅具租赁服务纳入长期护理保险保障范围,选择巡查护理的失能人员,可自愿选择辅具租赁服务
2025-09-30 09:59:00
9月27日,《大家读科普》新书发布会在省科技馆多功能报告厅举行,吸引300余名科普爱好者、学生代表等参加。该书由省科技馆与山西教育出版社等联合策划出版
2025-09-30 07:16:00
南报网讯(记者张安琪通讯员黄长满)国庆中秋假期将至,快来为孩子打造一场趣味与意义兼具的成长之旅吧。10月3日至5日,世界文学之都·南京童书嘉年华将在南京科技馆举办
2025-09-30 07:41:00
钟山风景区发布假期服务提示全域接驳和行李寄存,助游客“轻装上阵”□南京日报/紫金山新闻记者 李子俊迎中秋,庆国庆。9月29日
2025-09-30 07:41:00