• 我的订阅
  • 头条热搜
最强数学大模型易主!阿里千问新模型成绩超GPT-4o
最强数学大模型,现在易主!阿里千问大模型团队发布的Qwen2-Math,不仅超越了Llama 3.1-405B,也战胜了GPT-4o、Claude 3.5等一系列闭源模型。而且还会解决竞赛级试题,在GPT-4只能做对一道的AIME 24中,Qwen2-Math答对的题目数量达到了两...……更多
9.11比9.9大?多个大模型翻车!业内人士:就是偏科,文科强理科弱
....9哪个大”的问题一一测试了ChatGPT以及目前国内的主流大模型,包括阿里、百度等5家大厂模型,月之暗面等6家AI独角兽的模型。阿里通义千问、百度文心一言、Minimax和腾讯元宝4家大模型答对,其他8家则答错。首先是目前全球...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
...包括编程、AI阅读、音视频转录、AI角色生成等八大产品模型。当时,阿里云就已经预告,接下来还要再发更大规模的开源模型。12月1日,三款新模型如约而至——包括Qwen-72B、Qwen-1.8B和Qwen-Audio大模型,通义千问大模型也升级到...……更多
AI大模型也高考?成绩单出来了,星火综合第一
...湘晨报、量子位等多家权威媒体对近10款国产人工智能大模型进行了高考作文、数学、物理三个科目的评测,并公布了成绩。我们来一起回顾一下: 首先进行的是高考作文的评测。在搜狐科技的评测中,三位资深语文教师作为...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了SOTA(最新技术)水平。多模态大模型能够处理和理解多种不同类型的数据输入,例如文本、图...……更多
首个AI高考全卷评测结果发布:数学全都不及格
...布首个AI高考全卷评测结果,月初开源的阿里通义千问大模型Qwen2-72B排名第一,在语数外三科420分的满分中获得303分,OpenAI的GPT-4o和上海人工智能实验室的书生·浦语2.0文曲星(InternLM2-20B-WQX)排名二三位。本次评测采用全国新课...……更多
哪里不会扫哪里!全球最强数学大模型在线玩,阿里多模态模型加持
现在,最强数学大模型,人人都可上手玩了!一觉醒来,阿里千问大模型团队发布了Qwen2-Math的Demo,抱抱脸在线可玩。惊喜的是,如果嫌输入数学公式比较麻烦,可以把想问的题截图or扫描,上传即可解题。整得挺方便。试玩界...……更多
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...复成立的AI公司“零一万物”发布了首款开源中英双语大模型“Yi”。与此同时,36氪获悉,零一万物已完成新一轮融资,由阿里云领投。目前,零一万物估值已超10亿美元,跻身独角兽行列。此前,“Yi”于11月2日已经在Hugging Fac...……更多
2024阿里巴巴全球数学竞赛开考 563支AI队伍与人类挑战同一份考卷
...院所与企业的563支队伍使用AI作答。他们各显神通,使用模型调优、AI Agent、提示词工程等多种方式,推动AI构建更强大的数学能力。据阿里巴巴全球数学竞赛组委会介绍,从2024年起,阿里巴巴全球数学竞赛决定向AI开放,鼓励探...……更多
大模型“翻车”小学题?
...——这样一道简单的“小升初”数学题难倒一众网友和大模型。上周五(7月12日)综艺《歌手2024》投票率出炉,孙楠以13.8%的投票率位居第三,Chanté Moore以13.11%的投票率排在第四。一位网友留言质疑“13.8%比13.11%高?”迅速引起热...……更多
...报记者 赵广立2024年全国高考的“硝烟”刚刚散去,“大模型考生”就被抓回来重新“做题”了。市面上涌现出的大模型产品让人眼花缭乱,围绕“大模型技术哪家强”的讨论不绝于耳,各色名目的大模型评测应运而生。作为国...……更多
上海人工智能实验室公布首个ai高考全卷评测结果
...一结束,该实验室旗下司南评测体系OpenCompass选取6个开源模型及GPT-4o进行高考“语数外”全卷能力测试。评测采用全国新课标I卷,参与评测的所有开源模型开源时间均早于高考,确保评测“闭卷”性。同时,成绩由具有高考评...……更多
零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源
...带队创办的AI2.0公司零一万物正式开源发布首款预训练大模型Yi-34B,模型开放商用申请,已在阿里云魔搭社区ModelScope首发。魔搭第一时间推出了模型部署相关教程,供开发者参考并快速上手。零一万物此次开源的Yi系列模型包含3...……更多
首个AI高考全卷评测结果发布:最高分303,数学全不及格
...设计的高难度综合性测试,目前普遍被研究者用于考察大模型的智能水平。在前不久高考结束后,上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。6月19日, OpenCompass发布了首个...……更多
9.11和9.9哪个大?实测12个大模型8个都答错,ChatGPT也翻车了
一道小学生难度的数学题难倒了一众海内外AI大模型。9.11和9.9哪个更大?就此问题,第一财经记者测试了12个大模型,其中阿里通义千问、百度文心一言、Minimax和腾讯元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、...……更多
阿里云CTO周靖人:全面投入升级AI大基建
...准,全面升级从服务器到计算、存储、网络、数据处理、模型训练和推理平台的技术架构体系,让数据中心成为一台超级计算机,为每个AI和应用提供高性能、高效的算力服务。大会现场,通义大模型迎来了年度重磅发布,基础...……更多
通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o
9月19日云栖大会,阿里云CTO周靖人宣布,通义旗舰模型Qwen-Max全方位升级,性能接近GPT-4o。通义官网和通义APP的后台模型均已切换为Qwen-Max,继续免费为所有用户提供服务。用户也可通过阿里云百炼平台调用Qwen-Max的API。 相比上...……更多
用AI来做全国高考试卷,真的有人试了!结果:成绩偏科很严重
最近两年,ChatGPT的火热催生了一大批AI大模型,让大家对于生成式AI的能力,可谓是又惊讶又担心,引发大家的担忧,担心自己的工作、技能会被AI取代!而高考这样的知识性的测验,就很适合AI大模型去做测试,如果用AI来代替...……更多
通义千问发布半年,大模型已不是阿里云唯一主角 | 焦点分析
...力”的内涵已经进化到了“AI算力”。阿里云并没有让大模型成为2023年云栖大会的主角,不过,大模型却又无处不在。做AI时代的“电动机” 今年4月正式亮相的通义千问,是阿里云自研的底层通用大模型。半年过去,如今阿里...……更多
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...挺有趣:生成式AI让世界有了一个统一的语言——Token。AI模型可以通过对物理世界数据的Token化,理解真实世界的方方面面。理解之后,AI就可以模仿人类去执行物理世界的任务,这将带来新的产业革命。 接下来,我们试图就这...……更多
大数据分析方法在期末考试成绩分析中的运用
...为0.367,表示物理成绩可解释数学成绩的36.7%,说明回归模型具有较高的准确性和显著的回归效果,模型拟合度较高。接下来,我们使用Anova检验评估一元线性回归方程的有效性,结果如下表: 根据Anova检验结果,回归方程是有...……更多
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
继旗下xAI公司宣布正式开源大模型Grok-1后,特斯拉CEO马斯克再次在大模型市场扔下一颗重磅炸弹。当地时间8月11日晚,马斯克在X平台上透露人工智能模型Grok-2测试版将在不久后发布。事实上,马斯克在7月份就在X平台上确认,Gr...……更多
蔡崇信最新对话拆解:谈阿里AI路径、吴泳铭的管理、间接回应\\\
...,希望阿里在2027年3月底之前,实现两位数增长。 训练AI模型就像教育孩子,阿里将采取多元战略实现风险对冲蔡崇信在此次对谈中讲述了自己对AI的看法及阿里的AI投入。 “今天的人工智能非常专注于大语言模型。这些模型试...……更多
从云栖大会,看阿里的科技本色
...火热的背景下,此次云栖大会上,阿里巴巴宣布了自研大模型的最新进展——千亿级参数规模的通义千问 2.0 正式发布。阿里巴巴宣布,通义千问 2.0 在 10 个权威测评中全面超越 GPT-3.5 和 Llama2。阿里还是国内唯一将自研大模型开...……更多
大模型时代的阿里云,将云计算进行到底
文|葛覃大模型与云计算,正在成为新时代的淘金者和卖铲人。自ChatGPT刷屏之后的数月时间,微软Azure与OpenAI的示范效应传导至全球,基本所有能做大模型的厂商都尝试“淘金”,其中,云厂商是一股重要力量,云计算天然适...……更多
阿里巴巴CEO吴泳铭:AI或改变物理世界!先进模型投入门槛将提升至上百亿美金
...产生革命性的影响。 在吴泳铭看来,技术方面,去年大模型还只能帮助程序员写简单的代码,但今年,大模型已经具备了文本、语音、视觉的多模态能力,能够开始完成复杂指令。早期受到诸多吐槽的“不会解数学题”问题也...……更多
零一万物登陆阿里云百炼平台,将支持一站式模型定制及应用开发
...4日,零一万物已与阿里云达成紧密合作,Yi-Large等系列大模型登陆阿里云百炼平台,这是零一万物首次通过云厂商提供API服务,结合阿里云完备的工具链和丰富的云上算力资源,将更好地满足企业级需求。此次,零一万物Yi系列...……更多
对标o1,Kimi放出了最能打的国产模型
...性能提升关键。两个月前,OpenAI o1 的诞生再次引领了大模型技术的突破。从后训练阶段入手,通过更多的强化学习、原生的思维链和更长的推理时间,o1 将大模型的能力又往前推了一步。这段时间,国内大模型初创公司月之暗...……更多
阿里巴巴发布夸克大模型,令app变身“ai助手”
...日消息,阿里巴巴智能信息事业群发布今日发布了夸克大模型,该模型优先落地在通识问答、专业搜索等信息服务领域,将应用于夸克旗下一系列App中,令App变身为“AI助手”。▲图源夸克据悉,夸克大模型号称“全栈自研、千...……更多
NeurIPS 2024 | 数学推理场景下,首个分布外检测研究成果来了
...上海交通大学计算机系的二年级博士生,研究方向为语言模型生成、推理,以及可解释、可信大模型。该工作由上海交通大学和阿里巴巴通义实验室共同完成。论文题目:Embedding Trajectory for Out-of-Distribution Detection in Mathematical R……更多
更多关于科技的资讯:
先别买游戏本!RTX 50系显卡好像还不错
最近关于RTX50系显卡的消息越来越多,特别是移动版的跑分数据出现在网络上,对于现在要不要买游戏本这个问题,有很重要的作用
2025-01-03 20:15:00
雷军亲自出面 海底捞正式入驻小米科技园 全体员工88折
快科技1月3日消息,小米公司宣布,海底捞首家北京企业火锅店昨日在小米科技园落地开业!官方表示,把海底捞引入小米科技园,小米花了近三年时间
2025-01-03 20:15:00
499元超低价神机!Redmi 14C图赏
快科技1月3日消息,小米日前推出了爆款百元级——Redmi 14C,起售价仅499元,这价格真的无懈可击了。其前作Redmi 12C
2025-01-03 20:45:00
银川地震:烧鸡店阿姨折返回去关火
1月3日消息,据媒体报道,近日宁夏银川永宁县发生4.8级地震,一餐饮店后厨阿姨在地震瞬间跑出去后,又返回关火,事后店主安排现金红包奖励这位工作负责
2025-01-03 20:45:00
广东一SUV不减速撞翻货车 瞬间撞成碎片后续:司机已死亡 2人受伤
1月3日消息,据国内媒体报道称,广东河源桂山路口就发生了一起严重的事故,一辆闯红灯通过路口的SUV车速不减,直接怼上了正常行驶大货车的后部
2025-01-03 21:15:00
iQOO Z9 Turbo长续航版开卖:骁龙8s Gen3+6400mAh 1899元起
快科技1月3日消息,iQOO Z9 Turbo长续航版正式开卖,起售价是1899元。对比Z9 Turbo,长续航版本的电池增大至6400mAh
2025-01-03 21:45:00
合资性价比首选!2025款一汽-大众ID.4 CROZZ上市:一口价14.99万元起
快科技1月3日消息,一汽-大众ID.4 CROZZ的2025款已正式上市,价格区间为14.99-18.59万元。据悉,新款车型在设计
2025-01-03 21:45:00
只做豪华大型车!领克SPA Evo全新架构发布:首搭领克900
快科技1月3日消息,领克汽车销售有限公司副总经理穆军表示,领克900 EM-P将在相当长的一段时间内作为领克品牌的旗舰级产品
2025-01-03 21:45:00
2025年第一场流星雨来了 肉眼就能观测
快科技1月3日消息,2025年的第一场流星雨——象限仪座流星雨将于1月3日迎来极大,大家可在3日夜晚至4日黎明进行观测
2025-01-03 22:15:00
涛的饭店火了 老板发声:谢谢大家关注
1月3日消息,据媒体报道,河北一名网友发布视频,有一家位于河北临漳某处十字路口的饭店名叫“涛的饭店”,因其独特的名字走红网络
2025-01-03 23:15:00
英特尔锐炫B580挑战4K最高画质《燕云十六声》:流畅运行无压力
英特尔锐炫580上市以来销量喜人,虽然首发价定在了2000元以上,但是实际优惠价基本在1800-1900元附近,这个价格拿下一款2K分辨率流畅运行3A游戏
2025-01-03 23:15:00
昔日家用电子游戏机王者 雅达利将于CES 2025发布全新游戏掌机
今夕是何年,曾经的家用电子游戏机王者雅达利(Atari)就这么水灵灵地加入了即将到来的CES 2025,并将带来全新游戏掌机产品——Gamestation Go
2025-01-04 00:15:00
年轻人开始流行换房过年:更省钱
1月4日消息,据媒体报道,春节期间,哈尔滨热门景点旁的酒店一晚标价上千元,为了省钱,南方的网友盯上了景点旁边的房子,“换房过年”因此诞生
2025-01-04 00:15:00
Roxtec电缆和管道密封技术赋能济南地下管廊 为城市生命线安全 “护航”
随着城市化的快速发展,地下综合管廊已成为城市运转不可或缺的“隐形动脉”,承担着输送能源与信息的重要任务。济南市工业北路沿线工厂众多
2025-01-03 19:52:00
华为鸿蒙next5.0来袭,新增应用锁功能
每次提到手机系统的时候,原生鸿蒙就被提及,原因是其证明了中国人独立自主、自力更生的强大精神力量,这也是华为品牌影响力能够得到很大幅度提升的关键
2025-01-03 19:58:00