• 我的订阅
  • 头条热搜
首个AI高考全卷评测结果发布:数学全都不及格
...布首个AI高考全卷评测结果,月初开源的阿里通义千问大模型Qwen2-72B排名第一,在语数外三科420分的满分中获得303分,OpenAI的GPT-4o和上海人工智能实验室的书生·浦语2.0文曲星(InternLM2-20B-WQX)排名二三位。本次评测采用全国新课...……更多
AI大模型也高考?成绩单出来了,星火综合第一
...湘晨报、量子位等多家权威媒体对近10款国产人工智能大模型进行了高考作文、数学、物理三个科目的评测,并公布了成绩。我们来一起回顾一下: 首先进行的是高考作文的评测。在搜狐科技的评测中,三位资深语文教师作为...……更多
学而思携九章大模型、学而思学习机亮相世界人工智能大会
...赋能和带来的行业机遇已经成为共识,教育也已经成为大模型技术产品级落地的代表性行业。“教育与人才”位列本届大会行业论坛的十大重点议题,学而思、网易有道、猿力科技等教育企业纷纷携旗下人工智能产品亮相,成为...……更多
国产大模型加速落地,争夺“中国版ChatGPT”心智定位
...主要角色介绍、情节分析、影响等角度列出概述大纲。在实测过程中,一篇169页的全英文财报,万知小程序可在3秒内对内容重点进行提炼,对财报中的财务数据进行解读,并按照财报叙述逻辑总结重点。除此之外,万知还可以...……更多
大幅减缓幻觉 百融云创大模型精度测评结果出炉
近日,百融云创大模型参加一场“考试”,并取得了行业领先的成绩,多项指标优于ChatGPT3.5。随着各类大模型的相继问世,如何去评估大模型的性能变得越来越重要。百融云创参加的这场“考试”名叫检索增强生成基准测评,...……更多
清华大学教授李宗鹏:大模型消除不了幻觉,大语言模型注定没有希望
...宗鹏接受凤凰网财经的采访)作者|王迪百度李彦宏称大模型基本消除了幻觉,AI从一本正经胡说八道变得可被信赖。清华大学李宗鹏在接受凤凰网财经采访时则指出,大模型永远不会彻底摆脱幻觉和出错的问题,这是数学上已经...……更多
阿里Qwen3登顶全球最强开源模型,用8款模型夺回中国AI话语权
出品 | 搜狐科技作者 | 梁昌均编辑 | 杨锦一口气开源8款模型,阿里通义又上新!4月29日一大早,阿里开源发布Qwen3,包括两款MoE(混合专家架构)模型,其中具备2350亿参数规模的Qwen3-235B-A22B,在对比测试中成为目前最强大的开...……更多
LLM群体智能崛起,数学性能暴增11.6%!谷歌DeepMind四大机构联手新作
...是指,人类对自己思维、推理过程的直观认识。那么,大模型也具备「元认知」的能力吗?研究人员对此,提出了一种假设,并设想是否可以通过知识引导,进一步提高LLM的能力。 其实,此前的研究已经表明,大模型表现出一...……更多
成本不到150元!26分钟训出个推理模型 媲美o1和R1
成本不到150元,训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型?!这不是洋葱新闻,而是AI教母李飞飞、斯坦福大学、华盛顿大学、艾伦人工智能实验室等携手推出的最新杰作:s1。在数学和编程能力的评测集上,s1的表现比肩Dee...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了SOTA(最新技术)水平。多模态大模型能够处理和理解多种不同类型的数据输入,例如文本、图...……更多
学而思推出数学答疑原生AI工具九章随时问,“AI将重新定义教育行业”
6月11日,好未来官方公众号宣布,学而思九章大模型推出最新AI数学搜索答疑工具“九章随时问”,即日起免费开放使用。这款产品打破了以生成式AI技术为基础,通过启发引导的方式帮助学生解决数学难题,旨在培养学生的解...……更多
...网高考不仅仅是检测国内莘莘学子的一项重要考试,在大模型“百家争鸣”的今天,也是对国内AI大模型的一次考验。如果让大模型和国内学子同台竞技,做同一套高考真题试卷,结果会是怎样?大模型考上文科本科,豆包获国...……更多
人工智能数学基础:解锁智能世界的十大密钥
...积分,我们可以计算函数的梯度、极值等性质,从而优化模型的参数。而优化理论则提供了求解最优化问题的方法和工具。掌握这些知识将有助于我们设计和训练高效的机器学习模型。第五步:学习信息论与编码信息论是研究信...……更多
...日报在生活中,我们仔细观察,就会发现许许多多有趣的数学问题。今天,我就发现了一个大问题:一个很小的数可以变成一个非常大的数。下面就给大家举几个例子:比如说:水。要是每一个人节约一滴水,就一个中国来说将...……更多
本文转自:新华每日电讯如果把上海80%的大模型企业聚集到一起,会发生怎样的化学反应?记者近日来到上海专门为大模型企业打造的孵化和加速载体——“模速空间”,这里入驻了近70家大模型相关企业,正在用创新生态助力...……更多
杨仝团队发布FairyR1模型:5%参数量数学和代码能力超越满血DeepSeek
北京大学杨仝教授团队近期发布了其在高效大型语言模型研究方向的一项新成果——FairyR1-32B模型。该模型基于DeepSeek-R1-Distill-Qwen-32B基座,通过结合微调与模型合并技术构建。研究探索了在参数量大幅减少的情况下,模型在特...……更多
数学因不严格的论证而得到丰富,很多命题建立在尚未证明的猜想上
...后面的著名论证作一个粗糙的描述。在统计物理中有一个模型,称为n 向量模型,它与临界现象的概率模型中的伊辛(Ising)模型和Potts模型有密切的关系。在Z^d的每一点上都给定一个R^n单位向量。这就给出了一个单位向量的随机...……更多
微软推出14b参数“最先进”小型语言模型
...13日消息,微软今天宣布推出14B参数“最先进”小型语言模型(SLM)Phi-4,除了传统的语言处理外,它还擅长数学等领域的复杂推理。Phi-4是Phi系列小型语言模型的最新成员,官方表示其展示了微软继续探索SLM边界的可能性。官方...……更多
联通元景大模型亮相2024年中国品牌日 打造产业智能化新范式
...参与中国品牌日活动,并在联通展馆精彩亮相联通元景大模型,充分展示大模型的核心能力及对各行业的颠覆性影响。能说、擅听、会看的联通元景大模型联通展台前热闹非凡,参观者络绎不绝。联通一位工作人员以实操+讲解的方...……更多
《红楼梦》里有大量东北方言?实测AI大模型“长文阅读”
...注?普通人可以用长文本做什么?效果如何?记者进行了实测。好比“内存”长文本其实并不稀奇200万字是什么概念?一本《红楼梦》大约70多万字,《沙丘》系列六部曲加一起也不过115万字。当大模型具有200万文字的长文本技...……更多
Llama版o1来了,来自上海AI Lab,强化学习代码已开源,
复刻OpenAI o1推理大模型,开源界传来最新进展:LLaMA版o1项目刚刚发布,来自上海AI Lab团队。简介中明确:使用了蒙特卡洛树搜索,Self-Play强化学习,PPO,以及AlphaGo Zero的双重策略范式(先验策略+价值评估)。在2024年6月,o1发...……更多
教师风采展丨齐鲁教育名家魏瑞霞:永远把根扎在小学数学课堂
...书育人的动人故事。治学严谨的魏瑞霞,深耕“小学数学模型思维教育”研究与实践30余年,探索出一条为“问题解决”而教,为小学生数学能力和数学素养的发展而研的教育之路。魏瑞霞带领团队依托山东省规划重点课题“小...……更多
DDD小传:领域驱动设计为什么这么火?
...你懂面向对象的设计方法;假如你能为业务概念构建领域模型,那么你就懂了面向对象的分析方法。面向对象的分析、设计、编码三种方法融会贯通,成为一个有机的整体,这个叫面向对象的方法学。我们发现,很多小伙伴都能...……更多
RTX 4090可跑、完全开源,最快视频生成模型问世,实测一言难尽
开源 AI 视频社区又一个重量级选手下场。这个周末,押注开源人工智能视频的初创公司 Lightricks,有了重大动作。该公司推出了最快的视频生成模型 LTX-Video,它是首个可以实时生成高质量视频的 DiT 视频生成模型。在一块 Nvidia ...……更多
LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学
...动创建大量、多样化的合成数据。经过合成数据微调后的模型Orca-3,在多项基准上刷新了SOTA。全世界高质量数据几乎枯竭。AI科学家们为了解决这一难题,可谓是绞尽脑汁。目前来看,合成数据或许就是大模型的未来,也成为业...……更多
猿辅导竟然是一家AI公司?大模型全家桶曝光
...北京”公布人工智能备案新进展,其中猿辅导旗下看云大模型(以下简称“猿辅导看云大模型”)正式通过大模型备案。对比同批次公布进展的小米、快手、腾讯、爱奇艺、高德等企业来说,猿辅导的身影着实有些令人意外。毕...……更多
实测苹果M3 Ultra运行DeepSeek R1满血版:速度超过8卡A100!
快科技3月12日消息,近日,B站UP主“虽然但是张黑黑”分享了一段视频,展示了满血版苹果M3 Ultra运行6710亿参数的DeepSeek R1模型的测试结果,其速度甚至超过了8张A100显卡,而成本却低得多。运行6710亿参数的DeepSeek R1模型通常需...……更多
...文转自:人民网-安徽频道4月20日,科大讯飞深度推理大模型——讯飞星火X1迎来全新升级。作为当前业界唯一基于全国产算力训练的深度推理大模型,升级后的星火X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答等...……更多
以研促教 创新发展
...中老师蒋香玲展示了数学建模课例《匀速圆周运动的数学模型》,以精心设计的问题为导引,借助信息技术,探索研究得出匀速圆周运动的数学模型。柳高老师叶瀚文展示数学建模课例《海水潮汐与港口水深问题》,引导学生利...……更多
...软件编程,朱文婷擅长论文写作与排版,张耀华熟悉数学模型、具备较好的数学基础,3位同学各有所长,相互配合,越战越勇。暑假期间,指导老师刘桂东根据三人的特长,建议他们发挥优势,主攻数据处理类题目,利用暑期...……更多
更多关于科技的资讯:
蚂蚁集团大动作!“阿福”APP来了:新增健康陪伴功能 问答能力升级
12月15日消息,蚂蚁集团宣布旗下AI健康应用AQ品牌升级为“蚂蚁阿福”,并发布APP新版本,升级健康问答、健康陪伴、健康服务三大功能
2025-12-17 10:18:00
项目卡壳90%是资源管理“掉链子” ?易趋教你四步破局
“张总,研发部李工被临时抽去支持紧急项目,咱们的核心模块开发得延期了”,“设备组反馈,原定下周到位的测试服务器,现在还在另一个项目组占用着”
2025-12-17 11:10:00
远见协同:解码米连科技稳健发展的深层动能
在互联网行业潮起潮落、监管环境持续完善的背景下,一家企业如何锚定航向,实现可持续的稳健增长?这不仅考验着创始团队的初心
2025-12-17 11:10:00
赋能印度农业现代化丨潍柴雷沃亮相第33届印度浦那国际农业展
鲁网12月17日讯日前,第33届印度浦那国际农业展KISAN在浦那国际展览中心举办。作为印度西部规模最大、最具影响力的农业展会
2025-12-17 11:18:00
面对“哪些中国企业全球化做的不错?”这一问题,联想集团无疑是具有代表性的答案之一。作为出海时间早、全球化程度深的中国企业
2025-12-17 11:52:00
京东产发与日日顺达成全球战略合作 共建超级供应链新生态
近日,京东产发与日日顺供应链正式达成全球战略合作,建立共创共赢的生态战略合作关系。 双方在物流基础设施、仓配网络、供应链管理等良好的合作基础上
2025-12-17 10:11:00
【宅男财经|专家面对面】当前许多年轻人热衷于“谷子”、棉花娃娃等小众二次元文化产品。针对年轻人为何更偏爱此类小众消费,中国广告协会会长
2025-12-17 10:12:00
“我喜欢我”:vivo S50系列携“告白”美学与长焦Live,开启自我表达新旅程
2025年12月15日,vivo正式发布全新 vivo S50系列,包括 vivo S50 与 vivo S50 Pro mini 两款新品
2025-12-17 10:18:00
聚焦企业福祉与跨境管理 百年人寿协办德国商会专题论坛共话创新解决方案
2025年12月5日,一场聚焦于在华企业福利创新与人力资源挑战的高端论坛于北京成功举行。本次活动由中国德国商会与安顾方胜联合主办
2025-12-17 10:18:00
为积极响应全民消费热潮,充分发挥金融服务实体经济的重要作用,江苏银行围绕 “双十二” 消费节点,精心部署多项线上促消费举措
2025-12-17 10:18:00
王志顺最近,社交平台被一批“装修博主”刷屏了——清一色的夫妻站在新家门口微笑合影,有的怀里还抱着婴儿,配文都是“装修已定”“聊聊感受”
2025-12-17 10:40:00
新闻纵深|“十四五 ”微记忆③:“丝网二代”的智造突围
阅读提示数智浪潮,奔涌而至。过去五年,人工智能等前沿科技,以不可逆转之势重塑千行百业。在安平,年轻的“丝网二代”逯千里
2025-12-17 08:09:00
国潮服饰消费热度 仍在上升
近期,在多地举行的时装周秀场上,马面裙等国潮服饰一经亮相就成为全场焦点;森马等传统服装品牌于近期宣布将推出国潮系列产品
2025-12-17 07:18:00
12月11日,我国自主研发的高空长航时多用途重型“九天苍穹”无人航空通用平台在陕西圆满完成首飞任务。这款性能位居全球前列的大型通用无人机横空出世
2025-12-17 07:35:00
记者走基层|手机没电没网 也能“硬核”付款
12月9日,雄安新区商务服务中心雄礼记商店内,市民孟令双(左)在手机关机的情况下,通过“碰一碰”完成购物付款。河北日报见习记者 康晓博摄“嘀”一声
2025-12-17 08:03:00