王者,模型,国产,模型,竞技场,评测头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

20款国产大模型角逐“最强王者”

...海人工智能实验室联合魔搭社区推出中国大语言模型评测竞技场Compass Arena，首度集齐国内主流大模型全阵容，阿里通义千问、百度文心一言、腾讯混元、字节跳动豆包、书生·浦语等20款国产大模型出战，角逐中国大模型“最强...……更多

2024-06-02 05:34:00王者,模型,国产,模型,竞技场,评测

AI界新晋王者被曝抄袭、作弊、做假，脸都丢光了

（id:SouthReviews）原标题 | 他们抄袭，作弊，做假，却宣称超越作者 | 南风窗记者朱秋雨编辑 | 向由排版 | 菲菲AI大模型大战在2023年爆发后，AI创业者不免感到有些心灰意冷——不管自己的团队如何加班加点，好让产品迭代面世...……更多

2023-12-20 00:10:00王者,抄袭,模型,万物,公司,数据

智源评测体系发布国内外“百模”评估结果出炉

5月17日，智源研究院举办大模型评测发布会，正式推出智源评测体系，发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测，分别从主观、客观两个维度考察了语言模型的简单理...……更多

2024-05-17 17:26:00评测,评估,体系,结果,模型,评测

AI大模型也高考？成绩单出来了，星火综合第一

...湘晨报、量子位等多家权威媒体对近10款国产人工智能大模型进行了高考作文、数学、物理三个科目的评测，并公布了成绩。我们来一起回顾一下：首先进行的是高考作文的评测。在搜狐科技的评测中，三位资深语文教师作为...……更多

2024-06-12 09:29:00星火,成绩单,模型,成绩,高考,综合

字节扣子模型广场，给AI大模型搭了一座擂台

...移动App工场。在小雷看来，字节扣子创造性推出的“模型竞技场”其实也是受到A/B测试方法论的启发，让开发者可以更高效地开发Bot，同时帮助所有大模型更快进化，字节扣子正在邀请更多大模型对其开放 API，加入到其评测范...……更多

2024-06-14 11:40:00模型,扣子,字节,擂台,一座,广场

阿里云发布通义千问2.5，性能赶超GPT-4 Turbo

...最强大模型。历经一年多追赶，国产大模型终于进入核心竞技场，可与国外一流大模型一较高下。奋力追赶一年，成就最强中文大模型大模型技术爆发一年多，行业竞争态势激烈而又多变。通义千问走了一条最“卷”的路，2023...……更多

2024-05-09 12:00:00通义,阿里,性能,通义,模型,阿里

奥林匹克竞赛里选最聪明的AI：Claude-3.5-Sonn

...人工智能实验室（GAIR Lab）推出的OlympicArena[1] （奥林匹克竞技场）满足了这个需求。奥林匹克学科竞赛不仅是对人类（碳基智能）思维敏捷性、知识掌握和逻辑推理的极限挑战，更是AI（“硅基智能”）锻炼的绝佳练兵场，是衡...……更多

2024-06-25 09:45:00奥林,奥林匹克,竞赛,模型,推理,能力

国内首个官方“大模型标准符合性评测”公布

...委员会人工智能分委会全体会议期间，国内首个官方“大模型标准符合性评测”结果公布，腾讯混元大模型、阿里通义千问等大模型成为首批通过评测的四款国产大模型的其中之二。据介绍，“大模型标准符合性评测”由中国电...……更多

2023-12-23 15:09:00符合性,模型,评测,标准,官方,模型

AI大模型“国标”首批测试结果公布，人工智能成市场新焦点

12月22日，国内首个官方“大模型标准符合性评测”结果公布，百度文心一言、腾讯混元大模型、360智脑、阿里云通义千问四款国产大模型首批通过测试。测试结果称，上述四款模型符合《人工智能大规模预训练模型第2部分：评...……更多

2023-12-26 14:16:00人工智能,国标,人工,模型,结果,智能

“AI考生”闯关高考，谁是最会做题大模型？

...报记者赵广立2024年全国高考的“硝烟”刚刚散去，“大模型考生”就被抓回来重新“做题”了。市面上涌现出的大模型产品让人眼花缭乱，围绕“大模型技术哪家强”的讨论不绝于耳，各色名目的大模型评测应运而生。作为国...……更多

2024-06-26 07:26:00考生,模型,高考,模型,评测,高考

零一万物Yi-1.5来了，国产开源大模型排行榜再次刷新

...机器之心编辑部在 OpenAI 发布会的前一天，来自中国的大模型公司零一万物，让开源大模型社区活跃了起来：Yi 大模型家族新成员「Yi-1.5」模型正式开源。在项目主页可以看到，Yi-1.5 包括一系列预训练和微调模型，分为 6B、9B、3...……更多

2024-05-14 09:56:00万物,模型,国产,再次,排行榜,模型

刷榜跑分？AI评测不应走偏路线

本文转自：新华每日电讯“百模大战”以来，AI大模型的部分榜单上出现了一个奇怪现象：长期盘踞在榜单前列的，经常是一些名不见经传的国产大模型，它们竟然以接近满分的优势碾压了ChatGPT、Gemini和其他知名的AI大模型。之...……更多

2024-03-22 02:41:00评测,路线,模型,考官,题库,考生

智谱AI推出第三代基座大模型可在手机上部署

...系技术成果转化企业智谱AI推出了全自研的第三代基座大模型ChatGLM3，继此前推出千亿基座的对话模型ChatGLM和ChatGLM2之后再次实现突破。评测显示，在44个中英文公开数据集测试中，ChatGLM3在国内同尺寸模型中排名首位。ChatGLM3语...……更多

2023-10-28 08:25:00三代,基座,可在,模型,手机,模型

360智脑7b参数模型采用3.4万亿tokens训练

...12日消息，360公司日前在GitHub上开源了360智脑7B（70亿参数模型）。360智脑大模型采用3.4万亿Tokens的语料库训练，以中文、英文、代码为主，开放4K、32K、360K三种不同文本长度。360表示，360K（约50万字）是当前国产开源模型文本长...……更多

2024-04-14 01:04:00模型,训练,参数,模型,文本,评测

智谱AI新一代基座大模型GLM-4在司南评测中跻身前列，位居

1月30日，上海人工智能实验室发布了大模型开源开放评测体系司南（OpenCompass 2.0），同时揭晓了2023年度大模型公开评测榜单，GPT-4 Turbo在各项评测中均获最佳表现，智谱AI新一代基座大模型GLM-4紧随其后，排名第二。上海人工智...……更多

2024-02-04 14:00:00司南,基座,前列,新一代,模型,评测

不同量级参数模型性能同样优秀夸克大模型再登行业评测榜首

【CNMO新闻】“大模型时代，夸克有巨大机会创造出革新性搜索产品。”11月22日，夸克大模型公布了其面向搜索、生产力工具和资产管理助手的大模型技术布局。数据显示，夸克千亿级参数大模型登顶C-Eval和CMMLU两大权威榜单，...……更多

2023-11-24 13:53:00夸克,模型,量级,榜首,评测,性能

中国信通院发布大模型安全基准测试报告 360智脑综合排名第一

...本文转自：中国新闻网近日，中国信息通信研究院发布大模型安全基准测试AI Safety Bench 2024年Q1的首轮测评报告(下称“测评报告”)，结果显示，三六零集团自研的认知通用大模型360智脑综合排名第一。大模型安全基准测试AI Safety...……更多

2024-04-10 20:16:00信通,基准,中国,模型,测试,报告

openaigpt-4o登顶竞技场排行榜

...工WilliamFedus周一在社交平台X证实，近期在LMSYS聊天机器人竞技场(ChatbotArena)上表现优异的神秘聊天机器人“gpt-chatbot”，正是他们刚刚发布的全新人工智能模型GPT-4o。Fedus还透露，GPT-4o在测试中登顶了竞技场排行榜，取得了有史以...……更多

2024-05-15 13:37:00竞技场,排行榜,竞技,模型,竞技场,竞技

AI大模型参加高考 GPT-4o文科成绩最好理科普遍不行

...媒体近日举办了一项“另类高考”，让近两年大火的AI大模型来模拟考生作答高考试题，看它们的表现究竟如何。从该媒体公布的最新发布高考新课标Ⅰ卷大模型评测报告中，GPT-4o以562分排名文科总分第一。国内产品中，字节跳...……更多

2024-06-27 19:06:00理科,文科,模型,成绩,高考,最好

国产ai大模型首批评估名单公布

6月11日消息，中国信息通信研究院公布了可信AI代码大模型评估的首轮评估名单，阿里云通义灵码、华为云盘古、智谱codegeex等国产AI大模型均入选并首批通过。此次大模型评估以《智能化软件工程技术和应用要求第1部分：代码...……更多

2024-06-12 09:54:00模型,评估,国产,名单,模型,能力

360集团携手中国信通院共促人工智能安全发展

本文转自：法治日报随着人工智能技术的迅猛发展，大模型在各个领域的应用日益广泛。为全力筑牢人工智能安全防线，进一步提高大模型技术的安全风险防范能力，今年2月，中国信息通信研究院（以下简称中国信通院）联合3...……更多

2024-04-09 01:58:00信通,人工智能,中国,人工,智能,集团

国产低价显卡坞评测：能让轻薄本用上本地大模型

...情况，需要AMD的驱动进一步完善。轻薄本也能玩转本地大模型接下来老规矩，现在怎么说也算是AI大模型的应用期，这有张显卡不拿去跑大模型，就跟矿潮的时候买了张显卡却没试过挖矿一样，那肯定就是不行的。不过，目前...……更多

2024-04-30 11:00:00显卡,模型,评测,国产,低价,显卡

腾讯混元文生图大模型升级并对外开源

5月14日消息，腾讯宣布旗下的混元文生图大模型升级并对外开源，目前已经在HuggingFace及Github上发布，包含模型权重、推理代码、模型算法等完整模型，可供企业与个人开发者免费商用。▲混元文生图效果▲混元长文生图效果升...……更多

2024-05-15 14:23:00文生,腾讯,模型,对外,升级,文生

东方财富董事长其实：建议进一步推动股权投资支持科技创新

...推动股权投资支持科技创新的建议》和《关于支持垂直大模型开发与应用的建议》。推动股权投资支持科技创新方面，其实提出了三方面建议：一是进一步健全政府引导基金容错机制，二是支持链主企业开展早期风险投资，三是...……更多

2024-03-07 17:31:00进一,科技创新,股权,董事长,董事,财富

llava-1.6与gpt-4vmp面硬刚的性能，一起来看看

...据集上的表现甚至胜于GPT-4V，成为了开源模型中的“性能王者“。图片来源：LLaVA-1.6官网的标准评测数据在不拘泥于单一模态的内容生成，具有Text-to-Text和Image-to-Text两种模式的同时，LLaVa-1.6的过人之处还在于更低的训练数据成...……更多

2024-02-10 21:04:00性能,模型,模态,训练,数据,卷上

让AI去高考，豆包等四款大模型考上文科“一本”

...网高考不仅仅是检测国内莘莘学子的一项重要考试，在大模型“百家争鸣”的今天，也是对国内AI大模型的一次考验。如果让大模型和国内学子同台竞技，做同一套高考真题试卷，结果会是怎样？大模型考上文科本科，豆包获国...……更多

2024-06-26 11:14:00豆包,一本,文科,模型,高考,模型

月狐数据发布中国市场首份《AIGC应用app智能化评测报告》

近年来，国内AI大模型行业蓬勃发展，市场上AIGC产品如雨后春笋般涌现，产品功能、体验和玩法日趋丰富，同时用户对于AIGC产品的使用兴趣度不断提升，生成式AI普及范围持续扩大，截止2023年12月，生成式AI移动应用全网安装渗...……更多

2024-03-14 17:06:00数据发布,评测报告,中国,评测,智能,报告

百度与优必选合作，人形机器人“大脑”有了AI大模型

百度与优必选合作，人形机器人“大脑”有了AI大模型深圳商报·读创客户端首席记者袁静娴4月1日，记者从优必选获悉，优必选近日已确定与百度携手合作，尝试让人形机器人Walker S接入文心大模型，进行具身智能应用升级训...……更多

2024-04-02 11:23:00人形,机器人,大脑,模型,机器,合作

国产AI芯片评测“智越计划”启动

...的AI芯片进行详细调研和评测。评测将涵盖内容科技、大模型、金融、医疗、智能驾驶、云计算、智能工业、智慧城市等多个主流AI应用领域。团队将采取一系列的严格测试和应用场景模拟，从技术规格、功能、通信性能、技术...……更多

2023-10-23 15:02:00芯片,评测,国产,芯片,评测,人工智能

昆仑万维发布开源13B高质量商用大模型领先Llama2和B

10月30日，昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列，并配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B系列目前包括130亿参数的两大模型：Skywork-13B-Base模型、Skywork-13B-Mat……更多

2023-10-30 15:35:00万维,昆仑,商用,高质量,模型,领先

page 1/667 首页上一页 12 3 4 5 6 下一页末页

更多关于科技的资讯：