信通,基准,中国,模型,测试,报告头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

本文转自：中国新闻网近日，中国信息通信研究院发布大模型安全基准测试AI Safety Bench 2024年Q1的首轮测评报告(下称“测评报告”)，结果显示，三六零集团自研的认知通用大模型360智脑综合排名第一。大模型安全基准测试AI Safet...……更多

2024-04-10 20:16:00信通,基准,中国,模型,测试,报告

360集团携手中国信通院共促人工智能安全发展

...范能力，今年2月，中国信息通信研究院（以下简称中国信通院）联合360集团，发起大模型安全基准测试SafetyAI Bench制定工作。大模型安全基准测试秉持“公平公正、产业应用、选型参考”原则，采用科学严谨的测试方法，评估大...……更多

2024-04-09 01:58:00信通,人工智能,中国,人工,智能,集团

中国信通院启动“CAICT人工智能伙伴计划”

日前，“2024中国信通院ICT深度观察报告会”人工智能伙伴分论坛在京召开。会上，“CAICT人工智能伙伴计划”启动。未来，中国信通院将与合作伙伴紧密围绕国家重大需求，在政策研究、标准制定、开放共享、行业赋能以及国...……更多

2023-12-26 17:41:00信通,人工智能,中国,人工,伙伴,智能

AI安全守护计划启动！信通院牵头，AIIA安全治理委员会发布

...、安全组两个工作组，近百家单位加入，主任单位由中国信通院牵头，副主任单位包括多家知名企业和高校。其中，治理组工作围绕AI治理框架、合规治理、赋能治理展开，安全组主要开展大模型安全、合规等研究及基准测试。...……更多

2024-07-25 09:26:00安全,信通,模型,评测,委员会,委员

中国信通院开展医疗健康大模型效能评估工作

...记者10日从中国信息通信研究院了解到，今年6月来，中国信通院选取多款通用大模型和医疗健康行业大模型开展效能评估工作，结果显示，通用大模型在医学知识广度方面具有一定优势，医疗健康行业大模型在特定医疗任务上表...……更多

2024-10-10 20:28:00信通,效能,中国,模型,评估,医疗

浪潮科技作为首批成员单位加入信通院“政务大模型推进中心”

12月21日，＂2024中国信通院ICT深度观察报告会政企数字化转型论坛＂在北京召开。此次论坛聚焦政企数字化转型，浪潮科技作为首批成员单位受邀出席“政务大模型推进中心”成立仪式。中国信通院作为国内IT领域重要权威机构...……更多

2023-12-22 18:53:00信通,浪潮,政务,模型,成员,单位

中国信通院发布《代码大模型》标准

...，据人工智能产业发展联盟AIIA消息，2024年1月25日，中国信通院联合中国工商银行牵头发布《智能化软件工程技术和应用要求第1部分：代码大模型》标准，该标准适用于企业在代码大模型的研发、评估和验收等过程中，为代码大...……更多

2024-01-31 11:30:00信通,中国,模型,代码,标准,模型

「世界开源新王」跌落神坛？重测跑分暴跌实锤造假，2人团队光速

...性消息——结果没多久，Reflection 70B就被打假了：公布的基准测试结果和他们的独立测试之间存在显著差异。无论是AI研究者，还是第三方评估者，都无法复现Matt Shumer所声称的结果。根据Artificial Analysis的数据，Reflection 70B在基准...……更多

2024-10-08 09:47:00神坛,光速,团队,世界,模型,基准

智能装备数字孪生技术创新与测试工信部重点实验室落户中国信通院

...水电装备、安全应急装备等重点行业装备领域，发挥中国信通院在数字孪生、人工智能、大数据等信息技术领域的创新优势，开展基于数据科学的装备模型构建、仿真、验证等工作，致力于为产业界提供一批基于模型的装备优化...……更多

2023-01-19 09:45:00信通,技术创新,中国,实验室,重点,实验

大模型训练被实习生攻击？字节跳动回应：已辞退

...全性方面的问题已经受到业内高度关注。今年8月，中国信通院发文称，近年来，以大模型为核心的人工智能技术飞速发展，成为数字经济增长新动能。然而，作为新质生产力的大模型在安全性方面仍存在较多缺陷，这为其大规...……更多

2024-10-19 21:50:00实习生,字节,模型,实习,攻击,训练

AI科学家太多，谁靠谱一试便知！普林斯顿新基准CORE-Be

【新智元导读】普林斯顿大学新发布的CORE-Bench基准测试，通过270个基于90篇跨学科科学论文的任务，可评估AI智能体在计算可重复性方面的表现，最简单任务的准确率可以达到60%，最难任务准确率仅有21%大模型的能力越来越强，...……更多

2024-09-26 13:38:00普林,普林斯顿,斯顿,准确率,基准,科学家

南京经开区举行大模型产业发展推进会

...目签约落地，“智谷杯”大模型应用创新大赛颁奖，中国信通院大模型“样板间工程”优秀案例颁证，“可信AI”大模型评估最新结果发布……南京经开区力推大模型和产业融合，不断丰富产业生态，增强产业发展韧劲，正在加...……更多

2024-11-29 19:31:00开区,推进会,南京,产业发展,模型,产业

首家！数势科技通过中国信通院数据指标管理平台技术要求专项测试

2024年5月10日，在中国信息通信研究院（以下简称“中国信通院”）组织的首批数据指标管理平台技术要求专项测试中，北京数势云创科技有限公司（以下简称“数势科技”）顺利完成了数据指标管理平台技术要求专项测试的全...……更多

2024-05-13 16:00:00信通,中国,专项,指标,测试,数据

嘉为蓝鲸荣誉入选信通院汽车云市场图谱

...格局。历经严格的框架讨论、评估、遴选多个环节，中国信通院汽车云工作组发布了《汽车云市场图谱1.0》，全方位展示在汽车云领域处于领先地位的代表性企业。嘉为科技旗下研运解决方案品牌嘉为蓝鲸荣誉上榜云服务厂商优...……更多

2024-03-04 16:30:00信通,蓝鲸,图谱,荣誉,汽车,市场

突发！谷歌发布史上最强大模型Gemini，打爆GPT-4

...的高效Gemini版本（1.8B/3.25B）其中Gemini Ultra一上来就在32个基准测试中拿下30个SOTA，并且第一个在MMLU基准上达到人类专家水平。而Gemini Pro从今天起，就会在Bard中实装上线。同时，谷歌Gemini团队还公布了一份60页的详细技术报告...……更多

2023-12-07 09:35:00突发,模型,模态,模型,基准,数据

迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测

...一款名为 MMed-Llama 3 的全新基座模型，以 8B 的尺寸在多项基准测试中超越了现有的开源模型，更加适合通过医学指令微调，适配到各种医学场景。所有数据和代码、模型均已开源。MMedBench 上的准确率，图 d 展⽰了在 MMedC 上进...……更多

2024-09-30 09:51:00多语,大规,模型,语料,基准,大规模

中国信通院与联想集团联合发布《中国企业智能化成熟度报告（20

...自：人民日报1月11日，中国信息通信研究院（简称“中国信通院”）与联想集团共同发布《中国企业智能化成熟度报告（2022）》（简称《报告》）。《报告》提出兼具实用性和可操作性的智能化转型方法论，致力于帮助广大企...……更多

2023-01-12 05:32:00联想集团,中国,信通,致远,成熟度,高质量

多模态竞技场对标90B Llama 3.2！Pixtral

...要好。最后，与开源模型一起，Mistral还贡献了一个开源基准测试MM-MT-Bench，用于在实际场景中评估视觉语言模型。技术细节当前的多模态大模型基本上都是：模态编码器 + 投影模块 + 大语言模型主干。如果需要多模态输出，后...……更多

2024-11-20 09:43:00模态,竞技场,竞技,报告,技术,模态

代码模型自我进化超越GPT-4o蒸馏！UIUC伯克利等提出自

...，超过了参数量大10倍的CodeLlama-70B-Instruct。在全部的三项基准测试（代码生成、数据科学编程、代码编辑）中，SelfCodeAlign都战胜了之前最先进的指令微调方法OctoPack。此外，在HumanEval+上，SelfCodeAlign的性能超越了基于GPT-3.5……更多

2024-11-29 09:26:00伯克,伯克利,进化,模型,代码,方法