王者,模型,国产,模型,竞技场,评测头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...一结束，该实验室旗下司南评测体系OpenCompass选取6个开源模型及GPT-4o进行高考“语数外”全卷能力测试。评测采用全国新课标I卷，参与评测的所有开源模型开源时间均早于高考，确保评测“闭卷”性。同时，成绩由具有高考评...……更多

2024-06-20 10:19:00评测结果,人工智能,上海,人工,实验室,评测

清华发布2024年3月版《SuperBench大模型综合能力

本文转自：新华网最近，由清华大学基础模型研究中心联合中关村实验室研制的SuperBench大模型综合能力评测框架，正式对外发布2024年3月版《SuperBench大模型综合能力评测报告》。评测共包含了14个海内外具有代表性的模型，结...……更多

2024-04-22 09:46:00评测报告,清华,模型,评测,能力,报告

媲美OpenAI事实性基准，这个中文评测集让o1-previ

...和顶尖的技术人才，成立未来生活实验室。实验室聚焦大模型、多模态等 AI 技术方向，致力于打造大模型相关基础算法、模型能力和各类 AI Native 应用，引领 AI 在生活消费领域的技术创新。如何解决模型生成幻觉一直是人工智...……更多

2024-11-21 09:43:00事实性,基准,中文,评测,事实,模型

多模态模型评测框架lmms-eval发布！全面覆盖，低成本，

...稿邮箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com随着大模型研究的深入，如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力，LLaVA-……更多

2024-08-22 09:50:00模态,框架,模型,评测,污染,成本

首个AI高考全卷评测结果发布：数学全都不及格

...布首个AI高考全卷评测结果，月初开源的阿里通义千问大模型Qwen2-72B排名第一，在语数外三科420分的满分中获得303分，OpenAI的GPT-4o和上海人工智能实验室的书生·浦语2.0文曲星（InternLM2-20B-WQX）排名二三位。本次评测采用全国新课...……更多

2024-06-20 11:10:00评测结果,全都,评测,数学,高考,结果

港中文团队提出大模型元推理范式，革新大模型的评价体系

...院工作过一段时间。在 ChatGPT 面世以后，他意识到针对大模型的研究范式存在一定的不足，于是决定来到香港中文大学读博。图 | 曾忠燊（来源：曾忠燊）前不久，曾忠燊和所在团队提出一个全新评测范式。基于这一评测范式，...……更多

2024-03-04 10:23:00革新,模型,范式,中文,推理,团队

中文大模型最新评测出炉：腾讯混元国内第一！

快科技8月5日消息，在最新发布的中文多模态大模型SuperCLUE-V基准评测中，腾讯混元大模型获国内排名第一，稳居卓越领导者象限。此次评测聚焦于大模型理解复杂现实世界的关键能力，即多模态理解，俗称“图生文”。多模态...……更多

2024-08-05 08:07:00腾讯,中文,模型,评测,模型,模态

首个AI高考全卷评测结果发布：最高分303，数学全不及格

...设计的高难度综合性测试，目前普遍被研究者用于考察大模型的智能水平。在前不久高考结束后，上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。6月19日， OpenCompass发布了首个...……更多

2024-06-24 09:22:00评测结果,最高分,评测,数学,高考,结果

零一万物大模型Yi-34B夺得全球开源评测“双料冠军”，已在

...带队创办的AI2.0公司零一万物正式开源发布首款预训练大模型Yi-34B，模型开放商用申请，已在阿里云魔搭社区ModelScope首发。魔搭第一时间推出了模型部署相关教程，供开发者参考并快速上手。零一万物此次开源的Yi系列模型包含3...……更多

2023-11-06 15:25:00阿里,万物,模型,评测,冠军,全球

AI潮起共筑数智之基

...，中国移动正式发布了由万卡级智算集群、千亿多模态大模型、汇聚百大要素的生态平台共同构成的“九天”人工智能基座，并开放三大人工智能基地，加快大模型产业化、规模化发展，为数字中国建设注入更加强劲动能。集聚...……更多

2024-05-25 07:21:00潮起,模型,中国,中国移动,移动,模态

商汤商量获SuperCLUE 9月评测总榜和子榜两项第一，A

...和子榜两项第一，AI智能体方向受瞩目近日，中文通用大模型综合性评测基准SuperCLUE发布9月总排行榜和各个分类任务榜单，商汤商量SenseChat 3.0 位列中文大模型总榜排名第一。在新增的AI Agent（AI智能体）子榜中，SenseChat 3.0 同样...……更多

2023-10-13 14:26:00商汤,评测,方向,智能,模型,商汤

东湖评论：AI何以在模拟高考中表现抢眼？

6月24日，在某科技媒体发布的高考新课标Ⅰ卷大模型评测报告中，GPT-4o 以562分排名文科总分第一。国内产品中，豆包等三款国产AI考上文科一本线。字节跳动旗下的豆包拔得头筹，成绩是542.5分，其后依次是百度文心、百川智能...……更多

2024-06-26 11:03:00东湖,中表,高考,评论,豆包,教育

多家券商最新研判：海螺AI爆火，MiniMax商业化进展迅速

...。海螺的“出圈”并非偶然。自今年8月底MiniMax推出视频模型并应用于海螺AI后，海螺AI上的视频创作热度持续攀升。据“AI产品榜”统计，海螺AI网页版在9月的访问增速超8倍，海外用户纷纷在社交平台分享使用体验，普遍认为海...……更多

2024-11-15 09:59:00海螺,券商,多家,进展,商业,海螺

击败Gemini-1.5-Pro、GPT-4V，从容大模型多

机器之心报道机器之心编辑部近日，云从科技从容大模型在综合评测权威平台 OpenCompass 的多模态评测领域中取得重大进展。最新评测结果显示，云从科技的从容大模型在该体系中的平均得分为 65.5，这一成绩使得从容大模型跻...……更多

2024-06-29 09:36:00模态,从容,模型,能力,全球,模态

AI安全守护计划启动！信通院牵头，AIIA安全治理委员会发布

...治理框架、合规治理、赋能治理展开，安全组主要开展大模型安全、合规等研究及基准测试。今年6月，中国信通院依托该委员会发起“人工智能安全守护计划”，包括建立威胁信息共享机制、开展AIGC真实内容来源可信工作、建...……更多

2024-07-25 09:26:00安全,信通,模型,评测,委员会,委员

teleai星辰语音大模型：多方言能力再次突破

...？你听得懂各地方言吗？时隔不到半年，TeleAI星辰语音大模型的多方言能力再次突破，不仅攻克了湛江话、宜宾话、洛阳话、烟台话等，将方言种类从30种提升至40种的同时，还引入对英文的识别，构建起AI时代的沟通桥梁。当前...……更多

2024-11-16 20:12:00音大,方言,星辰,模型,再次,突破

7个第一，11个首发，讯飞星火放大招，大模型规模化落地可期！

...发者节开幕式上，科大讯飞董事长刘庆峰公布讯飞星火大模型应用成绩单，并发布讯飞星火4.0 Turbo：七大核心能力全面超过GPT-4 Turbo，数学和代码能力超越GPT-4o，国内外中英文14项主流测试集中讯飞星火4.0 Turbo实现9项第一。与此...……更多

2024-10-24 16:48:00讯飞,星火,落地,模型,规模,讯飞

AI手机没有独家大模型供应商

...活跃用户的苹果市场，将成为大模型厂商最激烈的AI性能竞技场。吃百家饭的AI手机手机品牌与大模型公司合作，苹果不算开先河。1月，荣耀、三星就与百度展开合作，三星将文心一言集成进了Galaxy AI，荣耀通过YOYO接入文心一...……更多

2024-07-25 11:54:00模型,供应商,供应,手机,模型,手机

三大股指高开，人工智能AIETF涨超2%，三六零领涨超5%

...涨超8%。消息面上，近期商汤发布“日日新SenseNova5.0”大模型，该模型在多个客观评测指标上达到或超越了GPT-4Turbo。日日新5.0在知识、数学、推理及代码能力上显著提升，多模态能力达到全球领先水平；科大讯飞星火V3.5春季上...……更多

2024-05-06 17:58:00人工智能,人工,三大,智能,人工智能,人工

百川智能发布baichuan3稳定语言模型

1月29日，百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中，Baichuan3都展现了出色的能力，尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表...……更多

2024-01-29 19:57:00百川,模型,语言,智能,模型,百川

全模态对齐框架align-anything来啦：实现跨模态指

...、张钊为、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作，包括 Aligner（NeurIPS 2024 Oral）、ProgressGym（NeurIPS 2024 Spotlight）以及 Safe-RLHF（ICLR 2024 Spotlight）等系列……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据

没排上SearchGPT？比Perplexity更好用的国产

...智能体框架模拟人的思维过程。如果向 Perplexity.ai 提问「王者荣耀当前赛季哪个射手最强？」它会直接搜索这个问题，并总结网上已有的回复。把这个问题交给 MindSearch，它会把这个问题拆解成一个逻辑链：「当前赛季是哪个赛...……更多

2024-08-02 09:41:00国产,节点,搜索,问题,智能,信息

安兔兔评测pc版正式发布，欢迎大家下载体验

...估，小到简单的数学运算，大到复杂的逻辑推理和大语言模型问答等多个方面，更加全面地展现CPU在不同AI应用中的表现。由于CPU属于计算机的核心部件，所以在AI处理中起着至关重要的作用。GPU测试部分，与CPU的测试基本相同...……更多

2024-10-04 00:33:00评测,体验,测试,模型,处理,电脑

全国产算力平台“飞星一号”的首个成果发布：讯飞星火V3.5来

科大讯飞举行星火认知大模型V3.5升级发布会。受访者供图华龙网讯（首席记者董进）1月30日，科大讯飞举行星火认知大模型V3.5升级发布会。科大讯飞董事长刘庆峰、研究院院长刘聪，正式发布基于首个全国产算力训练的讯飞...……更多

2024-01-30 22:41:00讯飞,星火,成果发布,成果,全国,平台

AI赛道集体回调，资金加速流入，多个赛道有望受到催化

...催化：1）人工智能AIETF(515070)：多模态大模型大爆发，AI王者归来2）云计算50ETF(516630)：AI崛起，算力先行，国产算力扛大旗！3）数据ETF(516000)：大模型狂飙，数据要素助力AI新格局4）机器人ETF(562500)：AI赋能，具身智能浪潮来袭5...……更多

2024-05-27 12:36:00赛道,催化,多个,集体,资金,模型

“通用大模型底座上不会出现代差”

...人大代表刘庆峰详解我国人工智能产业发展——“通用大模型底座上不会出现代差”本报记者王菡娟《&nbsp人民政协报》（&nbsp2024年03月14日 &nbsp第&nbsp07&nbsp版）无论是ChatGPT的诞生还是Sora引发的全球关注，大模……更多

2024-03-14 01:43:00底座,模型,人工智能,模型,人工,智能