• 我的订阅
  • 头条热搜
最强数学大模型易主!阿里千问新模型成绩超GPT-4o
最强数学大模型,现在易主!阿里千问大模型团队发布的Qwen2-Math,不仅超越了Llama 3.1-405B,也战胜了GPT-4o、Claude 3.5等一系列闭源模型。而且还会解决竞赛级试题,在GPT-4只能做对一道的AIME 24中,Qwen2-Math答对的题目数量达到了两...……更多
9.11比9.9大?多个大模型翻车!业内人士:就是偏科,文科强理科弱
....9哪个大”的问题一一测试了ChatGPT以及目前国内的主流大模型,包括阿里、百度等5家大厂模型,月之暗面等6家AI独角兽的模型。阿里通义千问、百度文心一言、Minimax和腾讯元宝4家大模型答对,其他8家则答错。首先是目前全球...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
...包括编程、AI阅读、音视频转录、AI角色生成等八大产品模型。当时,阿里云就已经预告,接下来还要再发更大规模的开源模型。12月1日,三款新模型如约而至——包括Qwen-72B、Qwen-1.8B和Qwen-Audio大模型,通义千问大模型也升级到...……更多
AI大模型也高考?成绩单出来了,星火综合第一
...湘晨报、量子位等多家权威媒体对近10款国产人工智能大模型进行了高考作文、数学、物理三个科目的评测,并公布了成绩。我们来一起回顾一下: 首先进行的是高考作文的评测。在搜狐科技的评测中,三位资深语文教师作为...……更多
首个AI高考全卷评测结果发布:数学全都不及格
...布首个AI高考全卷评测结果,月初开源的阿里通义千问大模型Qwen2-72B排名第一,在语数外三科420分的满分中获得303分,OpenAI的GPT-4o和上海人工智能实验室的书生·浦语2.0文曲星(InternLM2-20B-WQX)排名二三位。本次评测采用全国新课...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了SOTA(最新技术)水平。多模态大模型能够处理和理解多种不同类型的数据输入,例如文本、图...……更多
哪里不会扫哪里!全球最强数学大模型在线玩,阿里多模态模型加持
现在,最强数学大模型,人人都可上手玩了!一觉醒来,阿里千问大模型团队发布了Qwen2-Math的Demo,抱抱脸在线可玩。惊喜的是,如果嫌输入数学公式比较麻烦,可以把想问的题截图or扫描,上传即可解题。整得挺方便。试玩界...……更多
阿里Qwen3登顶全球最强开源模型,用8款模型夺回中国AI话语权
出品 | 搜狐科技作者 | 梁昌均编辑 | 杨锦一口气开源8款模型,阿里通义又上新!4月29日一大早,阿里开源发布Qwen3,包括两款MoE(混合专家架构)模型,其中具备2350亿参数规模的Qwen3-235B-A22B,在对比测试中成为目前最强大的开...……更多
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...复成立的AI公司“零一万物”发布了首款开源中英双语大模型“Yi”。与此同时,36氪获悉,零一万物已完成新一轮融资,由阿里云领投。目前,零一万物估值已超10亿美元,跻身独角兽行列。此前,“Yi”于11月2日已经在Hugging Fac...……更多
2024阿里巴巴全球数学竞赛开考 563支AI队伍与人类挑战同一份考卷
...院所与企业的563支队伍使用AI作答。他们各显神通,使用模型调优、AI Agent、提示词工程等多种方式,推动AI构建更强大的数学能力。据阿里巴巴全球数学竞赛组委会介绍,从2024年起,阿里巴巴全球数学竞赛决定向AI开放,鼓励探...……更多
成本不到150元!26分钟训出个推理模型 媲美o1和R1
成本不到150元,训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型?!这不是洋葱新闻,而是AI教母李飞飞、斯坦福大学、华盛顿大学、艾伦人工智能实验室等携手推出的最新杰作:s1。在数学和编程能力的评测集上,s1的表现比肩Dee...……更多
...报记者 赵广立2024年全国高考的“硝烟”刚刚散去,“大模型考生”就被抓回来重新“做题”了。市面上涌现出的大模型产品让人眼花缭乱,围绕“大模型技术哪家强”的讨论不绝于耳,各色名目的大模型评测应运而生。作为国...……更多
大模型“翻车”小学题?
...——这样一道简单的“小升初”数学题难倒一众网友和大模型。上周五(7月12日)综艺《歌手2024》投票率出炉,孙楠以13.8%的投票率位居第三,Chanté Moore以13.11%的投票率排在第四。一位网友留言质疑“13.8%比13.11%高?”迅速引起热...……更多
上海人工智能实验室公布首个ai高考全卷评测结果
...一结束,该实验室旗下司南评测体系OpenCompass选取6个开源模型及GPT-4o进行高考“语数外”全卷能力测试。评测采用全国新课标I卷,参与评测的所有开源模型开源时间均早于高考,确保评测“闭卷”性。同时,成绩由具有高考评...……更多
零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源
...带队创办的AI2.0公司零一万物正式开源发布首款预训练大模型Yi-34B,模型开放商用申请,已在阿里云魔搭社区ModelScope首发。魔搭第一时间推出了模型部署相关教程,供开发者参考并快速上手。零一万物此次开源的Yi系列模型包含3...……更多
476 万、模型构建与定制大单:阿里云(中)
...司科学技术研究总院分公司发布《 天然气管网商务路径模型构建与定制求解》招标公告。 项目规模项目概况及总体要求:本项目来源于集团公司科研课题“天然气管网商务路径分析模型研究”(关于下达2024年集团公司第七批...……更多
首个AI高考全卷评测结果发布:最高分303,数学全不及格
...设计的高难度综合性测试,目前普遍被研究者用于考察大模型的智能水平。在前不久高考结束后,上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。6月19日, OpenCompass发布了首个...……更多
9.11和9.9哪个大?实测12个大模型8个都答错,ChatGPT也翻车了
一道小学生难度的数学题难倒了一众海内外AI大模型。9.11和9.9哪个更大?就此问题,第一财经记者测试了12个大模型,其中阿里通义千问、百度文心一言、Minimax和腾讯元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、...……更多
阿里最新开源推理模型发布:性能比肩DeepSeek-R1
阿里通义发布最新开源推理模型,称其性能比肩DeepSeek-R1。3月6日凌晨,阿里巴巴正式发布最新的开源推理模型通义千问QwQ-32B。据介绍,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩De...……更多
阿里云CTO周靖人:全面投入升级AI大基建
...准,全面升级从服务器到计算、存储、网络、数据处理、模型训练和推理平台的技术架构体系,让数据中心成为一台超级计算机,为每个AI和应用提供高性能、高效的算力服务。大会现场,通义大模型迎来了年度重磅发布,基础...……更多
通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o
9月19日云栖大会,阿里云CTO周靖人宣布,通义旗舰模型Qwen-Max全方位升级,性能接近GPT-4o。通义官网和通义APP的后台模型均已切换为Qwen-Max,继续免费为所有用户提供服务。用户也可通过阿里云百炼平台调用Qwen-Max的API。 相比上...……更多
用AI来做全国高考试卷,真的有人试了!结果:成绩偏科很严重
最近两年,ChatGPT的火热催生了一大批AI大模型,让大家对于生成式AI的能力,可谓是又惊讶又担心,引发大家的担忧,担心自己的工作、技能会被AI取代!而高考这样的知识性的测验,就很适合AI大模型去做测试,如果用AI来代替...……更多
阿里QwQ-32B API接口服务上线国家超算互联网:零门槛部署 免费100万Tokens
...官微获悉,本周,超算互联网平台上线阿里巴巴开源推理模型QwQ-32B API接口服务,现在用户可获得免费的100万Tokens。据了解,基于国产深算智能加速卡以及全国一体化算力网,平台支持海量用户便捷调用QwQ-32B、DeepSeek-R1等国产开...……更多
学而思正自研数学大模型MathGPT,由CTO田密负责
...5日消息,搜狐科技了解到,学而思正在进行自研数学大模型的研发,命名为MathGPT,面向全球数学爱好者和科研机构,以数学领域的解题和讲题算法为核心,目前已经取得阶段性成果,并将于年内推出基于该自研大模型的产品级...……更多
通义千问发布半年,大模型已不是阿里云唯一主角 | 焦点分析
...力”的内涵已经进化到了“AI算力”。阿里云并没有让大模型成为2023年云栖大会的主角,不过,大模型却又无处不在。做AI时代的“电动机” 今年4月正式亮相的通义千问,是阿里云自研的底层通用大模型。半年过去,如今阿里...……更多
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...挺有趣:生成式AI让世界有了一个统一的语言——Token。AI模型可以通过对物理世界数据的Token化,理解真实世界的方方面面。理解之后,AI就可以模仿人类去执行物理世界的任务,这将带来新的产业革命。 接下来,我们试图就这...……更多
阿里云通义开源最强过程奖励PRM模型 7B尺寸比GPT-4o更能发现推理错误
...日消息,今日,阿里云通义开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM,72B及7B尺寸模型性能均大幅超越同类开源过程奖励模型。据了解,在识别推理错误步骤能力上,Qwen2.5-Math-PRM以7B的小尺寸超越了GPT-4o。同时,通义团队还...……更多
大数据分析方法在期末考试成绩分析中的运用
...为0.367,表示物理成绩可解释数学成绩的36.7%,说明回归模型具有较高的准确性和显著的回归效果,模型拟合度较高。接下来,我们使用Anova检验评估一元线性回归方程的有效性,结果如下表: 根据Anova检验结果,回归方程是有...……更多
IDC发布央国企大模型报告:科大讯飞市场份额第一!超百度阿里
...消息,IDC今天发布了一份报告显示,2024年中国央国企大模型市场解决方案市场规模达31.8亿元人民币。其中,科大讯飞以其算力和模型一体化的优势,占据市场第一的位置,超过百度、浪潮云、智谱、阿里云等厂商。今年1月,据...……更多
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
继旗下xAI公司宣布正式开源大模型Grok-1后,特斯拉CEO马斯克再次在大模型市场扔下一颗重磅炸弹。当地时间8月11日晚,马斯克在X平台上透露人工智能模型Grok-2测试版将在不久后发布。事实上,马斯克在7月份就在X平台上确认,Gr...……更多
更多关于科技的资讯:
移动互联时代,不同类型的App层出不穷,满足了消费者多种多样的网络服务需求。但是在提供便利的同时,也带来了个人信息泄露的巨大风险
2025-06-29 18:29:00
种草太假,年轻人做起了“歹物分享”
“歹物分享”以一种反叛的姿态冲击了表面祥和的带货市场。它反对的不是被判为“歹毒”的商品本身,而是那种由平台、品牌、kol共同构建的叙事陷阱
2025-06-29 14:00:00
当你在电影院边吃爆米花边看大片时,手里所捧的爆米花,大概率产自临安。6月26日,北京抱抱堂科技有限公司总部及影院智能管理系统等产品产业化项目(以下简称抱抱堂总部)在临安正式拿地
2025-06-29 08:24:00
天气渐热,许多车主会给车身贴上降温的车膜,然而市面上的降温车膜均价在1万元以上,并不便宜。毕业于香港科技大学的付云飞带来了“冰蓝鲨纳米材料”
2025-06-29 08:24:00
三轨交会,“流量金矿”重塑城东商业版图
南京首座大融城开业,与相邻花园城共迎“1+1>2”聚客效应三轨交会,“流量金矿”重塑城东商业版图昨天上午,南京健康大融城正式开门迎客
2025-06-29 09:27:00
大众网记者 孙淑娟 通讯员 王彭真 东营报道广饶县审计局创新审计组织模式,与南京审计大学数据分析团队深度协同,开发应用“数据智审平台”
2025-06-29 09:42:00
聚焦陕西民营经济高质量发展|“钛”有可为:每4个医用钛材植入体中就有1个“鑫诺造”
钛,密度小、强度高、生物亲和性好,在医疗行业中应用广泛,成为许多医用产品的首选材料。宝鸡鑫诺特材股份有限公司成立于2004年
2025-06-29 16:29:00
当心!共享充电宝或许正在窃取你的手机资料!
在商场、餐厅等公共场所,共享充电宝为大家提供了很大的便利,但这些看似平常的充电设备,却也可能暗藏玄机,成为窃取手机消息的工具
2025-06-29 10:48:00
南报网讯(记者何钢实习生汪云舒通讯员宁建轩)不用爬进空中驾驶室,只需在地面手持遥控器,就能控制几十米高的塔机轻松将建材吊至指定位置
2025-06-29 09:28:00
喜良观经济|充电宝的事闹大了!
6月以来,一场史上最大规模充电宝召回事件正在发生。作为风暴中心眼,罗马仕、安克创新等知名品牌“公开认栽”,召回超120万台充电宝
2025-06-29 07:23:00
杭州举办人工智能专场招聘会
新华社讯 6月28日,求职者在招聘会现场的AI智能面试专区操作自助式智能求职机。当日,2025年杭州市人工智能专场招聘会在杭州市人才市场举行
2025-06-29 07:54:00
近日,在义乌昀帆电子商务有限公司门口,记者见到了风尘仆仆的马志泉。想约到这名刚从外省返回的年轻创业老板并不容易,过去很长一段时间里
2025-06-29 07:54:00
名创优品做梦都想捧出一个“LABUBU”
原标题:名创优品,做梦也想有个LABUBU上个月,短暂停留北京的阿玳在返回台北时,行李箱里塞满了名创优品IP联名产品。 此行除了和朋友去音乐节一项主要行程外
2025-06-29 00:21:00
相机电池能带上飞机吗?不在召回批次的充电宝可以带吗?6月26日,民航局发布紧急通知,自6月28日起禁止旅客携带没有3C标识
2025-06-28 08:20:00
厦门网讯(厦门日报记者 林露虹)6月26日,胡润研究院发布《2025全球独角兽榜》,列出全球“成立于2000年之后、价值10亿美元以上的非上市公司”
2025-06-28 08:46:00