• 我的订阅
  • 头条热搜
...海人工智能实验室联合魔搭社区推出中国大语言模型评测竞技场Compass Arena,首度集齐国内主流大模型全阵容,阿里通义千问、百度文心一言、腾讯混元、字节跳动豆包、书生·浦语等20款国产大模型出战,角逐中国大模型“最强...……更多
国产大模型竞技场首超GPT-4o!零一万物GLM共同跻身Top10
...式对外发布新旗舰模型——Yi-Lightning(闪电)。在大模型竞技场(Chatbot Arena)上,Yi-Lightning性能直冲总榜单并列第6,数学分榜并列第3,代码等其它分榜也名列前茅。总成绩几乎与马斯克最新xAI大模型Grok-2-08-13持平,超越GPT-4o-20...……更多
帝都、魔都双双押宝 年底了AI圈居然还有高手
...024-11-19而阶跃的 “ 第二步 ”Step-1V 走的也不错。拿?模型竞技场 Chatbot Arena 的数据来看,这个竞技场网站里网友们可以试用所有的大模型,然后给它们打分,今年 11 ?的榜单里 Step-1V 的总分已经达到了 Gemini1.5 的水平。除了这些...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
【新智元导读】以开源极客之姿杀入江湖的Mistral AI,在9月份甩出了自家的首款多模态大模型Pixtral 12B,如今,报告之期已至,技术细节全公开。作为欧洲的OpenAI,Mistral最近压力不小。端侧小模型端不出来,对比评测的结果又遭...……更多
GPT-4o mini登顶大模型竞技场,奥特曼:两个月内微调免费
...刚,GPT-4o mini版迎来“高光时刻”——登顶了lmsys大模型竞技场,和满血版并列第一,还把Claude 3.5甩在了身后。不同于一般的数据集测评,大模型竞技场是用户自己出题、用脚投票的结果,无法通过“刷题”来走捷径,因此更为...……更多
起猛了,GPT-4o被谷歌新模型击败,ChatGPT官号:大家深吸一口气
...2000人匿名投票,Gemini 1.5 Pro(0801)代表谷歌首次夺得lmsys竞技场第一。(中文任务也第一)而且这次还是双冠王,除了总榜(唯一分数上1300),在视觉排行榜上也是第一。Gemini团队的关键人物Simon Tokumine发文庆祝称:(这一新模...……更多
AI界新晋王者被曝抄袭、作弊、做假,脸都丢光了
(id:SouthReviews)原标题 | 他们抄袭,作弊,做假,却宣称超越作者 | 南风窗记者 朱秋雨编辑 | 向由排版 | 菲菲AI大模型大战在2023年爆发后,AI创业者不免感到有些心灰意冷——不管自己的团队如何加班加点,好让产品迭代面世...……更多
...,360 通过 CoE 技术架构,构建了大模型竞技平台——模型竞技场(bot.360.com),目前已经入驻360AI浏览器,成为国内大模型领域的基础设施。在多模型协作模式下,用户可以从 16 家国内主流大模型厂商的 54 款大模型中任意选择 3 款...……更多
国产模型指令跟随全球第一!来自LeCun亲推的最难作弊LLM新榜单
...而且它登上的这个排行榜LiveBench,虽然现在还没有大模型竞技场(LMSYS Chatboat Arena)那么广为人知,但资格杠杠的——图灵奖得主、Meta首席AI科学家杨立昆(Yann LeCun),联合纽约大学等在今年6月推出。号称是“全球首个无法作...……更多
智源评测体系发布 国内外“百模”评估结果出炉
5月17日,智源研究院举办大模型评测发布会,正式推出智源评测体系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测,分别从主观、客观两个维度考察了语言模型的简单理...……更多
开源版OpenAI再出「神作」,小模型吊打Llama 3!Ministral系列问世,边缘AI革命开启
...及前辈模型Mistral 7B。而且Ministral 3B和Ministral 8B在大模型竞技场中的测试,均拿下了媲美Gemma 2、Llama 3.1开源模型的成绩。 世界上最好的边缘模型Ministral 3B和Ministral 8B都支持高达128k上下文(目前在vLLM上为32……更多
重磅!TeleAI 完成首个全国产化万卡万参大模型训练
...功完成国内首个基于全国产化万卡集群训练的万亿参数大模型(万卡万参),并正式对外开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型——星辰语义大模型 TeleChat2-115B。这是由中国电信集团 CTO、首...……更多
...果、微软,苹果推出Apple Intelligence AI系统等等。而在AI大模型方面,最主要事件则是OpenAI推出多模态大模型ChatGPT-4o,这一版本具有实时处理和生成文本、音频以及图像等多种模态的能力,被誉为技术上一个巨大突破。事实上,中...……更多
AI大模型也高考?成绩单出来了,星火综合第一
...湘晨报、量子位等多家权威媒体对近10款国产人工智能大模型进行了高考作文、数学、物理三个科目的评测,并公布了成绩。我们来一起回顾一下: 首先进行的是高考作文的评测。在搜狐科技的评测中,三位资深语文教师作为...……更多
字节扣子模型广场,给AI大模型搭了一座擂台
...移动App工场。在小雷看来,字节扣子创造性推出的“模型竞技场”其实也是受到A/B测试方法论的启发,让开发者可以更高效地开发Bot,同时帮助所有大模型更快进化,字节扣子正在邀请更多大模型对其开放 API,加入到其评测范...……更多
...巡展”首站落地成都。巡展首站活动中透露了字节豆包大模型的最新进展——截至今年7月,豆包大模型日均Tokens使用量已突破5000亿次,平均每个企业客户Tokens日均使用量较5月15日模型发布时增长22倍。国产大模型越来越受到认...……更多
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
...最强大模型。历经一年多追赶,国产大模型终于进入核心竞技场,可与国外一流大模型一较高下。奋力追赶一年,成就最强中文大模型大模型技术爆发一年多,行业竞争态势激烈而又多变。通义千问走了一条最“卷”的路,2023...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...人工智能实验室(GAIR Lab)推出的OlympicArena[1] (奥林匹克竞技场)满足了这个需求。奥林匹克学科竞赛不仅是对人类(碳基智能)思维敏捷性、知识掌握和逻辑推理的极限挑战,更是AI(“硅基智能”)锻炼的绝佳练兵场,是衡...……更多
国内首个官方“大模型标准符合性评测”公布
...委员会人工智能分委会全体会议期间,国内首个官方“大模型标准符合性评测”结果公布,腾讯混元大模型、阿里通义千问等大模型成为首批通过评测的四款国产大模型的其中之二。据介绍,“大模型标准符合性评测”由中国电...……更多
AI大模型“国标”首批测试结果公布,人工智能成市场新焦点
12月22日,国内首个官方“大模型标准符合性评测”结果公布,百度文心一言、腾讯混元大模型、360智脑、阿里云通义千问四款国产大模型首批通过测试。测试结果称,上述四款模型符合《人工智能大规模预训练模型第2部分:评...……更多
...报记者 赵广立2024年全国高考的“硝烟”刚刚散去,“大模型考生”就被抓回来重新“做题”了。市面上涌现出的大模型产品让人眼花缭乱,围绕“大模型技术哪家强”的讨论不绝于耳,各色名目的大模型评测应运而生。作为国...……更多
零一万物Yi-1.5来了,国产开源大模型排行榜再次刷新
...机器之心编辑部在 OpenAI 发布会的前一天,来自中国的大模型公司零一万物,让开源大模型社区活跃了起来:Yi 大模型家族新成员「Yi-1.5」模型正式开源。在项目主页可以看到,Yi-1.5 包括一系列预训练和微调模型,分为 6B、9B、3...……更多
王者荣耀:国际版开测三天,预约人数激增,安卓用户终于可以登录
...究此前,很多玩家都以为《ArenaofValor》(中文译名:勇士竞技场),是王者荣耀的国际版。事实上,《ArenaofValor》这款游戏,是新加坡Garena游戏公司,和腾讯天美工作室共同开发,主要发行在欧美地区的一款Moba游戏。发行在港澳台...……更多
本文转自:新华每日电讯“百模大战”以来,AI大模型的部分榜单上出现了一个奇怪现象:长期盘踞在榜单前列的,经常是一些名不见经传的国产大模型,它们竟然以接近满分的优势碾压了ChatGPT、Gemini和其他知名的AI大模型。之...……更多
国产GPU力挺!摩尔线程宣布支持满血Deepseek-V3-0324
快科技3月28日消息,日前,DeepSeek宣布DeepSeek V3模型完成小版本升级,版本号为DeepSeek-V3-0324。27日晚,摩尔线程宣布,其迅速响应并完成了对DeepSeek-V3的无缝升级,实现了零报错、零兼容性问题的光速部署。摩尔线程表示,在Deeps...……更多
...系技术成果转化企业智谱AI推出了全自研的第三代基座大模型ChatGLM3,继此前推出千亿基座的对话模型ChatGLM和ChatGLM2之后再次实现突破。评测显示,在44个中英文公开数据集测试中,ChatGLM3在国内同尺寸模型中排名首位。ChatGLM3语...……更多
360智脑7b参数模型采用3.4万亿tokens训练
...12日消息,360公司日前在GitHub上开源了360智脑7B(70亿参数模型)。360智脑大模型采用3.4万亿Tokens的语料库训练,以中文、英文、代码为主,开放4K、32K、360K三种不同文本长度。360表示,360K(约50万字)是当前国产开源模型文本长...……更多
智谱AI新一代基座大模型GLM-4在司南评测中跻身前列,位居国内第一
1月30日,上海人工智能实验室发布了大模型开源开放评测体系司南(OpenCompass 2.0),同时揭晓了2023年度大模型公开评测榜单,GPT-4 Turbo在各项评测中均获最佳表现,智谱AI新一代基座大模型GLM-4紧随其后,排名第二。上海人工智...……更多
三个大模型组队挑战o1,实测360多模型协作干掉提示词工程
...务的版本。还是在360AI浏览器中,AI助手还上线了“模型竞技场”(bot.360.com),支持54款大模型产品的“同台竞技”,最新版本中还上线了“组队较量”、“匿名比拼”、“随机对战”等功能。总的来说,360AI搜索还是360AI浏览器...……更多
DeepSeek的一次小更新 堪比发布新模型
...一上传,就登上了 Hugging Face 的趋势榜单。在国外大模型竞技场 KCORES 的测评中, V3-0324 的代码能力得分 328.3 ,超过了普通版的 Claude 3.7 Sonnet 的 322.3 分,接近 Claude 3.7 Sonnet 思维链版本的 334.8 分,排……更多
更多关于科技的资讯:
厦门网讯(厦门日报记者 张珺 通讯员 吴冰冰)我市跨境电商生态再添新支点,日前,POD(按需定制)专卖孵化平台公司正式落户银城智谷海熹跨境电商产业园
2025-11-25 08:11:00
AI赋能千行百业一线故事(十七):这位“农事专家”,让种地更聪明
这位“农事专家”,让种地更聪明——AI赋能千行百业一线故事(十七)11月14日,雄安新区都市农业科技博览园温室大棚内,工作人员查看番茄长势
2025-11-25 08:41:00
荣耀加冕!锦程酒管多店荣登消费者喜爱榜-2025年中国高端酒店100强
2025 年 11 月 20 日-21日—— 在备受文旅与酒店行业瞩目的 “2025 迈点文旅节・第七届迈点酒店运营创新大会” 上
2025-11-25 09:25:00
苏河汇一站式解决方案破解电商企业合规难题,驱动行业发展
2025年“双十一”收官,中国电商行业持续稳健增长,行业生态也迎来深刻演进。各大平台已从流量竞争转向全域生态协同,“双十一”形态亦呈现“简-繁-简”的演变
2025-11-25 09:25:00
治污攻坚 | 天宁:伊顿与黑牡丹的“近零碳”之路引领工业绿色未来
2025年,在常州市工信局公示的近零碳工厂名单中,伊顿电力设备有限公司和黑牡丹纺织有限公司两家企业相继成功入选。根据常州市的标准
2025-11-25 10:16:00
人工智能技术的深度嵌入,正重塑人才培养逻辑与知识范式,高等教育人才培养体系面临着前所未有的挑战。“数字创业自我效能驱动创业意向(DESE-EI)模型及边界条件研究(24A0450)”课题组研究认为
2025-11-25 10:31:00
常机电方案 | 深耕教材建设“试验田” 打造产教融合教材新范式
当传统职教教材还在讲述已被淘汰的技术时,常州机电职业技术学院的学生们手中,正翻动着源自理想汽车生产线的最新案例集。在近日落幕的2025年国家教材建设重点研究基地学术论坛上
2025-11-25 10:55:00
“温暖科技”升维竞争,米连科技让伊对算法拥有温度
在算法主导的数字时代,科技与人文的平衡正成为衡量企业创新深度的新标尺。当大多数科技公司仍在追求极致的算法效率时,米连科技通过旗下情感社交平台伊对
2025-11-25 10:55:00
四川托普学院“人工智能训练师定向班”进阶企业实战阶段
近日,四川托普信息技术职业学院信息工程学院与山西数智科云科技服务有限公司共建的“人工智能训练师定向培养班”取得重要进展
2025-11-25 13:57:00
Ria Flow睿晰声誉管理全场景Agent正式启动内测,AI驱动行业智能化变革
近日,由大观传播、市场部网与公关行三方联合研发的Ria Flow睿晰——声誉管理全场景Agent,正式启动内部测试。作为一款深度整合行业经验与AI技术的智能工具
2025-11-25 14:57:00
江南时报讯 高新技术企业总数453家,平均每5天就有一家高新技术企业破土而出。规上工业企业研发投入较“十三五”末增长58%
2025-11-25 15:09:00
新加坡国家AI计划放弃Meta模型 转向阿里千问
11月25日消息,据新加坡媒体报道,新加坡国家人工智能计划(AISG)正在进行一次重大战略调整,在其最新的东南亚语言大模型项目中
2025-11-25 15:52:00
载体筑基 产业聚链 连云港海州区招商磁场持续增强
试运营即实现85%可租赁面积入驻,科创飞地孵化101家创新企业……连日来,海州区载体招商捷报频传。华欧科技产业园、连云港玉兰高新创业园等一批特色载体多点开花
2025-11-25 15:55:00
——解码全场景智慧服务生态的进化之路当人工智能重构交易链路、区块链穿透信任壁垒、大数据预判人居需求,房地产互联网平台正经历一场从“信息中介”到“智慧服务商”的质变
2025-11-25 16:09:00
一、引言随着数字技术、绿色经济与平台生态的深度融合,新经济环境已呈现“要素重构、生态重塑、约束强化、风险常态化”的特征
2025-11-25 16:16:00