王者,模型,国产,模型,竞技场,评测头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

不同量级参数模型性能同样优秀夸克大模型再登行业评测榜首

【CNMO新闻】“大模型时代，夸克有巨大机会创造出革新性搜索产品。”11月22日，夸克大模型公布了其面向搜索、生产力工具和资产管理助手的大模型技术布局。数据显示，夸克千亿级参数大模型登顶C-Eval和CMMLU两大权威榜单，...……更多

2023-11-24 13:53:00夸克,模型,量级,榜首,评测,性能

谷歌开源系模型第二代免费开放！27B媲美Llama3 70B

...至还能与其两倍大的模型竞争。目前Gemma 2已入驻大模型竞技场（LMSYS Chatbot Arena），Gemma 2 27B排名与Llama3 70B相当：而Gemma 2 9B的排名甚至比肩Qwen 2 72B：该结果也让网友纷纷表示难以置信。此外，VentureBeat表示，两种……更多

2024-07-01 09:21:00二代,模型,开放,模型,性能,网友

中国信通院发布大模型安全基准测试报告 360智脑综合排名第一

...本文转自：中国新闻网近日，中国信息通信研究院发布大模型安全基准测试AI Safety Bench 2024年Q1的首轮测评报告(下称“测评报告”)，结果显示，三六零集团自研的认知通用大模型360智脑综合排名第一。大模型安全基准测试AI Safety...……更多

2024-04-10 20:16:00信通,基准,中国,模型,测试,报告

逆水寒“ai竞技场”将于11月22日正式上线

...日，国风MMO手游逆水寒宣布将在其2.2.2新版本中上线“AI竞技场”功能，这一创新举措旨在通过游戏平台，汇聚广大玩家力量，对当下热门的AI大模型进行客观评估。据悉，逆水寒“AI竞技场”将邀请国内多家知名AI厂商参与，包...……更多

2024-11-21 10:46:00逆水寒,竞技场,将于,竞技,模型,逆水寒

openaigpt-4o登顶竞技场排行榜

...工WilliamFedus周一在社交平台X证实，近期在LMSYS聊天机器人竞技场(ChatbotArena)上表现优异的神秘聊天机器人“gpt-chatbot”，正是他们刚刚发布的全新人工智能模型GPT-4o。Fedus还透露，GPT-4o在测试中登顶了竞技场排行榜，取得了有史以...……更多

2024-05-15 13:37:00竞技场,排行榜,竞技,模型,竞技场,竞技

to B要挣钱、to C要谨慎，李开复的大模型坚持

10月15日深夜，零一万物的Yi-Lighting大模型在LMSYS盲测竞技场的投票数超过1万次，拿到了这个国际权威测试榜单的入场券，"出来的结果是，我们排在全球第六"，10月16日上午，零一万物CEO李开复向媒体宣布时一字一顿。为了强调...……更多

2024-10-17 09:58:00李开复,模型,模型,李开复,万物,时间差

AI大模型参加高考 GPT-4o文科成绩最好理科普遍不行

...媒体近日举办了一项“另类高考”，让近两年大火的AI大模型来模拟考生作答高考试题，看它们的表现究竟如何。从该媒体公布的最新发布高考新课标Ⅰ卷大模型评测报告中，GPT-4o以562分排名文科总分第一。国内产品中，字节跳...……更多

2024-06-27 19:06:00理科,文科,模型,成绩,高考,最好

讯飞星火X1全面升级领跑教育、医疗、司法行业应用

...文转自：人民网-安徽频道4月20日，科大讯飞深度推理大模型——讯飞星火X1迎来全新升级。作为当前业界唯一基于全国产算力训练的深度推理大模型，升级后的星火X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答等...……更多

2025-04-22 16:50:00讯飞,星火,行业应用,司法,升级,医疗

国产ai大模型首批评估名单公布

6月11日消息，中国信息通信研究院公布了可信AI代码大模型评估的首轮评估名单，阿里云通义灵码、华为云盘古、智谱codegeex等国产AI大模型均入选并首批通过。此次大模型评估以《智能化软件工程技术和应用要求第1部分：代码...……更多

2024-06-12 09:54:00模型,评估,国产,名单,模型,能力

360集团携手中国信通院共促人工智能安全发展

本文转自：法治日报随着人工智能技术的迅猛发展，大模型在各个领域的应用日益广泛。为全力筑牢人工智能安全防线，进一步提高大模型技术的安全风险防范能力，今年2月，中国信息通信研究院（以下简称中国信通院）联合3...……更多

2024-04-09 01:58:00信通,人工智能,中国,人工,智能,集团

奥特曼晒“草莓”引热议神秘新模型现身竞技场网友第一波实测

...新模型，真的藏不住了！先是有匿名聊天机器人现身lmsys竞技场，声称自己是GPT-4系列模型一部分，吊足了大家的胃口。随后奥特曼又发了一个浮想联翩的推文，正是他花园里的草莓照片，并配文：i love summer in the garden。上个月Op...……更多

2024-08-08 15:11:00奥特,奥特曼,一波,实测,竞技场,草莓

国产大模型 DeepSeek-V3 开源：6710 亿参数自

...（12 月 26 日）发布博文，宣布上线并同步开源 DeepSeek-V3 模型，用户可以登录官网 chat.deepseek.com，与最新版 V3 模型对话。IT之家援引博文介绍，DeepSeek-V3 是一个 6710 亿参数的专家混合（MoE，使用多个专家网络将问题空间划分为同...……更多

2024-12-27 09:20:00模型,国产,参数,模型,缓存,价格

国产低价显卡坞评测：能让轻薄本用上本地大模型

...情况，需要AMD的驱动进一步完善。轻薄本也能玩转本地大模型接下来老规矩，现在怎么说也算是AI大模型的应用期，这有张显卡不拿去跑大模型，就跟矿潮的时候买了张显卡却没试过挖矿一样，那肯定就是不行的。不过，目前...……更多

2024-04-30 11:00:00显卡,模型,评测,国产,低价,显卡

GPT-4omini为啥登顶竞技场？OpenAI刷分秘诀被扒

为啥GPT-4o mini能登顶大模型竞技场？？原来是OpenAI会刷分呀。这两天，lmsys竞技场公布了一份充满争议的榜单。其中才面世不久的GPT-4o mini和满血版并列第一，把Claude 3.5 Sonnet甩在身后。结果网友炸锅了，大家凭体感觉得这不可能...……更多

2024-07-30 09:30:00奥特,奥特曼,竞技场,秘诀,竞技,模型

腾讯混元文生图大模型升级并对外开源

5月14日消息，腾讯宣布旗下的混元文生图大模型升级并对外开源，目前已经在HuggingFace及Github上发布，包含模型权重、推理代码、模型算法等完整模型，可供企业与个人开发者免费商用。▲混元文生图效果▲混元长文生图效果升...……更多

2024-05-15 14:23:00文生,腾讯,模型,对外,升级,文生

零一万物新模型盲测国产首超GPT-4o！李开复透露：一次训练

...息，日前李开复的零一万物公司，正式对外发布了新旗舰模型Yi-Lightning。在盲测榜单LMSYS中，Yi-Lightning位列第六，仅次于OpenAI的GPT-4o、o1系列，Google的Gemini 1.5 pro系列，与马斯克xAI旗下Grok-2打平。值得一提的是，此次盲测中Li……更多

2024-10-17 16:49:00李开复,万物,模型,国产,成本,训练

东方财富董事长其实：建议进一步推动股权投资支持科技创新

...推动股权投资支持科技创新的建议》和《关于支持垂直大模型开发与应用的建议》。推动股权投资支持科技创新方面，其实提出了三方面建议：一是进一步健全政府引导基金容错机制，二是支持链主企业开展早期风险投资，三是...……更多

2024-03-07 17:31:00进一,科技创新,股权,董事长,董事,财富

OpenAI 再成“榜一大哥”：o1-preview AI

... Decoder 昨日（9 月 19 日）发布博文，报道称在聊天机器人竞技场（Chatbot Arena）上，OpenAI 的新人工智能模型 o1-preview 和 o1-mini 问鼎榜首。聊天机器人竞技场简介聊天机器人竞技场是一个比较人工智能模型的平台，它利用 6000 多个...……更多

2024-09-21 09:33:00大哥,模型,任务,数学,模型,人工智能