• 我的订阅
  • 头条热搜
最强数学大模型易主!阿里千问新模型成绩超GPT-4o
最强数学大模型,现在易主!阿里千问大模型团队发布的Qwen2-Math,不仅超越了Llama 3.1-405B,也战胜了GPT-4o、Claude 3.5等一系列闭源模型。而且还会解决竞赛级试题,在GPT-4只能做对一道的AIME 24中,Qwen2-Math答对的题目数量达到了两...……更多
9.11比9.9大?多个大模型翻车!业内人士:就是偏科,文科强理科弱
....9哪个大”的问题一一测试了ChatGPT以及目前国内的主流大模型,包括阿里、百度等5家大厂模型,月之暗面等6家AI独角兽的模型。阿里通义千问、百度文心一言、Minimax和腾讯元宝4家大模型答对,其他8家则答错。首先是目前全球...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
...包括编程、AI阅读、音视频转录、AI角色生成等八大产品模型。当时,阿里云就已经预告,接下来还要再发更大规模的开源模型。12月1日,三款新模型如约而至——包括Qwen-72B、Qwen-1.8B和Qwen-Audio大模型,通义千问大模型也升级到...……更多
AI大模型也高考?成绩单出来了,星火综合第一
...湘晨报、量子位等多家权威媒体对近10款国产人工智能大模型进行了高考作文、数学、物理三个科目的评测,并公布了成绩。我们来一起回顾一下: 首先进行的是高考作文的评测。在搜狐科技的评测中,三位资深语文教师作为...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了SOTA(最新技术)水平。多模态大模型能够处理和理解多种不同类型的数据输入,例如文本、图...……更多
首个AI高考全卷评测结果发布:数学全都不及格
...布首个AI高考全卷评测结果,月初开源的阿里通义千问大模型Qwen2-72B排名第一,在语数外三科420分的满分中获得303分,OpenAI的GPT-4o和上海人工智能实验室的书生·浦语2.0文曲星(InternLM2-20B-WQX)排名二三位。本次评测采用全国新课...……更多
哪里不会扫哪里!全球最强数学大模型在线玩,阿里多模态模型加持
现在,最强数学大模型,人人都可上手玩了!一觉醒来,阿里千问大模型团队发布了Qwen2-Math的Demo,抱抱脸在线可玩。惊喜的是,如果嫌输入数学公式比较麻烦,可以把想问的题截图or扫描,上传即可解题。整得挺方便。试玩界...……更多
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...复成立的AI公司“零一万物”发布了首款开源中英双语大模型“Yi”。与此同时,36氪获悉,零一万物已完成新一轮融资,由阿里云领投。目前,零一万物估值已超10亿美元,跻身独角兽行列。此前,“Yi”于11月2日已经在Hugging Fac...……更多
2024阿里巴巴全球数学竞赛开考 563支AI队伍与人类挑战同一份考卷
...院所与企业的563支队伍使用AI作答。他们各显神通,使用模型调优、AI Agent、提示词工程等多种方式,推动AI构建更强大的数学能力。据阿里巴巴全球数学竞赛组委会介绍,从2024年起,阿里巴巴全球数学竞赛决定向AI开放,鼓励探...……更多
成本不到150元!26分钟训出个推理模型 媲美o1和R1
成本不到150元,训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型?!这不是洋葱新闻,而是AI教母李飞飞、斯坦福大学、华盛顿大学、艾伦人工智能实验室等携手推出的最新杰作:s1。在数学和编程能力的评测集上,s1的表现比肩Dee...……更多
大模型“翻车”小学题?
...——这样一道简单的“小升初”数学题难倒一众网友和大模型。上周五(7月12日)综艺《歌手2024》投票率出炉,孙楠以13.8%的投票率位居第三,Chanté Moore以13.11%的投票率排在第四。一位网友留言质疑“13.8%比13.11%高?”迅速引起热...……更多
...报记者 赵广立2024年全国高考的“硝烟”刚刚散去,“大模型考生”就被抓回来重新“做题”了。市面上涌现出的大模型产品让人眼花缭乱,围绕“大模型技术哪家强”的讨论不绝于耳,各色名目的大模型评测应运而生。作为国...……更多
上海人工智能实验室公布首个ai高考全卷评测结果
...一结束,该实验室旗下司南评测体系OpenCompass选取6个开源模型及GPT-4o进行高考“语数外”全卷能力测试。评测采用全国新课标I卷,参与评测的所有开源模型开源时间均早于高考,确保评测“闭卷”性。同时,成绩由具有高考评...……更多
零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源
...带队创办的AI2.0公司零一万物正式开源发布首款预训练大模型Yi-34B,模型开放商用申请,已在阿里云魔搭社区ModelScope首发。魔搭第一时间推出了模型部署相关教程,供开发者参考并快速上手。零一万物此次开源的Yi系列模型包含3...……更多
首个AI高考全卷评测结果发布:最高分303,数学全不及格
...设计的高难度综合性测试,目前普遍被研究者用于考察大模型的智能水平。在前不久高考结束后,上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。6月19日, OpenCompass发布了首个...……更多
9.11和9.9哪个大?实测12个大模型8个都答错,ChatGPT也翻车了
一道小学生难度的数学题难倒了一众海内外AI大模型。9.11和9.9哪个更大?就此问题,第一财经记者测试了12个大模型,其中阿里通义千问、百度文心一言、Minimax和腾讯元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、...……更多
阿里云CTO周靖人:全面投入升级AI大基建
...准,全面升级从服务器到计算、存储、网络、数据处理、模型训练和推理平台的技术架构体系,让数据中心成为一台超级计算机,为每个AI和应用提供高性能、高效的算力服务。大会现场,通义大模型迎来了年度重磅发布,基础...……更多
通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o
9月19日云栖大会,阿里云CTO周靖人宣布,通义旗舰模型Qwen-Max全方位升级,性能接近GPT-4o。通义官网和通义APP的后台模型均已切换为Qwen-Max,继续免费为所有用户提供服务。用户也可通过阿里云百炼平台调用Qwen-Max的API。 相比上...……更多
用AI来做全国高考试卷,真的有人试了!结果:成绩偏科很严重
最近两年,ChatGPT的火热催生了一大批AI大模型,让大家对于生成式AI的能力,可谓是又惊讶又担心,引发大家的担忧,担心自己的工作、技能会被AI取代!而高考这样的知识性的测验,就很适合AI大模型去做测试,如果用AI来代替...……更多
学而思正自研数学大模型MathGPT,由CTO田密负责
...5日消息,搜狐科技了解到,学而思正在进行自研数学大模型的研发,命名为MathGPT,面向全球数学爱好者和科研机构,以数学领域的解题和讲题算法为核心,目前已经取得阶段性成果,并将于年内推出基于该自研大模型的产品级...……更多
通义千问发布半年,大模型已不是阿里云唯一主角 | 焦点分析
...力”的内涵已经进化到了“AI算力”。阿里云并没有让大模型成为2023年云栖大会的主角,不过,大模型却又无处不在。做AI时代的“电动机” 今年4月正式亮相的通义千问,是阿里云自研的底层通用大模型。半年过去,如今阿里...……更多
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...挺有趣:生成式AI让世界有了一个统一的语言——Token。AI模型可以通过对物理世界数据的Token化,理解真实世界的方方面面。理解之后,AI就可以模仿人类去执行物理世界的任务,这将带来新的产业革命。 接下来,我们试图就这...……更多
阿里云通义开源最强过程奖励PRM模型 7B尺寸比GPT-4o更能发现推理错误
...日消息,今日,阿里云通义开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM,72B及7B尺寸模型性能均大幅超越同类开源过程奖励模型。据了解,在识别推理错误步骤能力上,Qwen2.5-Math-PRM以7B的小尺寸超越了GPT-4o。同时,通义团队还...……更多
大数据分析方法在期末考试成绩分析中的运用
...为0.367,表示物理成绩可解释数学成绩的36.7%,说明回归模型具有较高的准确性和显著的回归效果,模型拟合度较高。接下来,我们使用Anova检验评估一元线性回归方程的有效性,结果如下表: 根据Anova检验结果,回归方程是有...……更多
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
继旗下xAI公司宣布正式开源大模型Grok-1后,特斯拉CEO马斯克再次在大模型市场扔下一颗重磅炸弹。当地时间8月11日晚,马斯克在X平台上透露人工智能模型Grok-2测试版将在不久后发布。事实上,马斯克在7月份就在X平台上确认,Gr...……更多
王小川归来 跑步入局大模型创业
...tGPT以迅雷不及掩耳之势火遍全球,国内也火速兴起了AI大模型的创业风潮。4月10日,淡出公众视线近两年的王小川,带着他的新公司“百川智能”亮相,正式宣布进入AI模型创业赛道。王小川被人熟知的,是他理科学霸和搜狗创...……更多
李飞飞团队“50美元”复现DeepSeek R1?真相是…
s1模型的训练并非从零开始,而是基于阿里云通义千问(Qwen)模型进行监督微调。s1模型的神奇“低成本”,是建立在已具备强大能力的开源基础模型之上,可谓依然是开源的胜利。作者 | 黄心怡今日一则关于人工智能领域的新...……更多
蔡崇信最新对话拆解:谈阿里AI路径、吴泳铭的管理、间接回应\\\
...,希望阿里在2027年3月底之前,实现两位数增长。 训练AI模型就像教育孩子,阿里将采取多元战略实现风险对冲蔡崇信在此次对谈中讲述了自己对AI的看法及阿里的AI投入。 “今天的人工智能非常专注于大语言模型。这些模型试...……更多
从云栖大会,看阿里的科技本色
...火热的背景下,此次云栖大会上,阿里巴巴宣布了自研大模型的最新进展——千亿级参数规模的通义千问 2.0 正式发布。阿里巴巴宣布,通义千问 2.0 在 10 个权威测评中全面超越 GPT-3.5 和 Llama2。阿里还是国内唯一将自研大模型开...……更多
大模型时代的阿里云,将云计算进行到底
文|葛覃大模型与云计算,正在成为新时代的淘金者和卖铲人。自ChatGPT刷屏之后的数月时间,微软Azure与OpenAI的示范效应传导至全球,基本所有能做大模型的厂商都尝试“淘金”,其中,云厂商是一股重要力量,云计算天然适...……更多
更多关于科技的资讯:
比亚迪:祝小米SU7 Ultra成功发布 中国汽车在一起一路向前
快科技2月26日消息,明晚小米就要发布SU7 Ultra了,而比亚迪也是送来了祝福。就在刚刚,比亚迪汽车转发小米汽车微博
2025-02-26 13:05:00
桔子宝亮相纽伦堡玩具展 展示多款设计新作
近日,国际知名玩偶设计师桔子宝(原名陈丽娟)携其原创设计的“提拉米兔”“Angela安吉拉娃娃”“吉宝娃娃”等代表作亮相“世界三大玩具展”之一的纽伦堡玩具展
2025-02-26 14:01:00
ColorOS正式接入满血版DeepSeek-R1:支持联网搜索、覆盖40+机型
快科技2月26日消息,今日,ColorOS官方宣布,ColorOS正式接入满血版DeepSeek-R1,包括OPPO Find N5在内的40+款OPPO/一加机型可率先体验
2025-02-26 14:05:00
阿里云PolarDB登顶全球数据库性能及性价比排行榜
2月26日,在2025阿里云PolarDB开发者大会上,阿里云宣布PolarDB登顶全球数据库性能及性价比排行榜。根据国际数据库事务处理性能委员会(TPC
2025-02-26 14:09:00
《广州正益2024:项目总结与展望》
回顾2024年,广州市正益信息技术有限公司在数字化领域取得了一系列丰硕的成果,多个重点项目的推进和实施,不仅为公司带来了经济效益
2025-02-26 14:14:00
2000亿美元押注AI基地 Meta拟打造新型数据中心
当地时间2月25日,央视记者获悉,美国社交媒体平台“脸书”和“照片墙”的母公司“元”公司(Meta)正在讨论为其人工智能(AI)项目建造一个新的数据中心园区
2025-02-26 14:16:00
Steam卖家有哪些坑要避开
Steam是全球最大的数字游戏平台之一,拥有庞大的用户群体和强大的市场潜力,但Steam的市场竞争激烈、规则复杂,一些新卖家在开店过程中可能会遇到许多陷阱
2025-02-26 14:27:00
鲁网2月26日讯(记者 徐英淦)让消费者更放心,预付消费不担忧;让商家更得利,用款不用愁;用创新监管破解预付消费领域卷款跑路
2025-02-26 14:40:00
鲁网2月26日讯在现代消费模式中,预付式消费以其先付费、后消费的独特形式,在餐饮、健身、购物、美容美发、教育培训等多个领域发挥着重要作用
2025-02-26 14:40:00
重磅出击! 泰坦军团携手玉麒麟,推出3款联名系列电竞显示器
泰坦军团作为电竞显示器领域的领军者,一直致力于为玩家提供卓越的视觉体验。为了深入玩家需求,泰坦军团选择在今年年初与CS电竞圈极具影响力的玉麒麟展开合作
2025-02-26 14:45:00
多因素身份验证MFA解决密码攻击的最佳安全实践
随着信息技术的不断进步,网络威胁也随之不断升级和演化。某知名企业遭严重网络攻击,黑客窃取员工单一登录凭证,入侵核心数据库
2025-02-26 14:45:00
不得不依赖美企 日本“数字赤字”超430亿美元创新高
日本政府最新数据显示,2024年日本“数字贸易赤字”达到6.46万亿日元(约合432亿美元),创历史新高,反映出美国大型技术企业所提供服务在日本市场占据主导地位
2025-02-26 14:46:00
具身智能如何再进化?庞江淼:“虚实贯通”将成推动机器人自主演进的可行路径
上海人工智能实验室青年科学家负责人庞江淼出品|搜狐科技作者|任婧瑄编辑|杨锦2月21日-23日,2025 GDC 全球开发者先锋大会在上海举办
2025-02-26 14:49:00
民生金租成功引入DeepSeek大模型
据民生金租官网介绍,2025年2月13日,其已成功引入DeepSeek大模型技术,成为首批引入使用DeepSeek大模型的金融租赁公司
2025-02-26 15:01:00
造物数科谈PCB打样知识:PCB的装配工艺与共享设计新途径
PCB(印制电路板)作为电子设备中的关键组件,其装配工艺直接影响产品的性能、质量和可靠性。随着科技的飞速发展,PCB的装配工艺也在不断演进
2025-02-26 15:05:00