信通,基准,中国,模型,测试,报告头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

本文转自：中国新闻网近日，中国信息通信研究院发布大模型安全基准测试AI Safety Bench 2024年Q1的首轮测评报告(下称“测评报告”)，结果显示，三六零集团自研的认知通用大模型360智脑综合排名第一。大模型安全基准测试AI Safet...……更多

2024-04-10 20:16:00信通,基准,中国,模型,测试,报告

360集团携手中国信通院共促人工智能安全发展

...范能力，今年2月，中国信息通信研究院（以下简称中国信通院）联合360集团，发起大模型安全基准测试SafetyAI Bench制定工作。大模型安全基准测试秉持“公平公正、产业应用、选型参考”原则，采用科学严谨的测试方法，评估大...……更多

2024-04-09 01:58:00信通,人工智能,中国,人工,智能,集团

中国信通院启动“CAICT人工智能伙伴计划”

日前，“2024中国信通院ICT深度观察报告会”人工智能伙伴分论坛在京召开。会上，“CAICT人工智能伙伴计划”启动。未来，中国信通院将与合作伙伴紧密围绕国家重大需求，在政策研究、标准制定、开放共享、行业赋能以及国...……更多

2023-12-26 17:41:00信通,人工智能,中国,人工,伙伴,智能

AI安全守护计划启动！信通院牵头，AIIA安全治理委员会发布

...、安全组两个工作组，近百家单位加入，主任单位由中国信通院牵头，副主任单位包括多家知名企业和高校。其中，治理组工作围绕AI治理框架、合规治理、赋能治理展开，安全组主要开展大模型安全、合规等研究及基准测试。...……更多

2024-07-25 09:26:00安全,信通,模型,评测,委员会,委员

浪潮科技作为首批成员单位加入信通院“政务大模型推进中心”

12月21日，＂2024中国信通院ICT深度观察报告会政企数字化转型论坛＂在北京召开。此次论坛聚焦政企数字化转型，浪潮科技作为首批成员单位受邀出席“政务大模型推进中心”成立仪式。中国信通院作为国内IT领域重要权威机构...……更多

2023-12-22 18:53:00信通,浪潮,政务,模型,成员,单位

中国信通院发布《代码大模型》标准

...，据人工智能产业发展联盟AIIA消息，2024年1月25日，中国信通院联合中国工商银行牵头发布《智能化软件工程技术和应用要求第1部分：代码大模型》标准，该标准适用于企业在代码大模型的研发、评估和验收等过程中，为代码大...……更多

2024-01-31 11:30:00信通,中国,模型,代码,标准,模型

智能装备数字孪生技术创新与测试工信部重点实验室落户中国信通院

...水电装备、安全应急装备等重点行业装备领域，发挥中国信通院在数字孪生、人工智能、大数据等信息技术领域的创新优势，开展基于数据科学的装备模型构建、仿真、验证等工作，致力于为产业界提供一批基于模型的装备优化...……更多

2023-01-19 09:45:00信通,技术创新,中国,实验室,重点,实验

AI科学家太多，谁靠谱一试便知！普林斯顿新基准CORE-Be

【新智元导读】普林斯顿大学新发布的CORE-Bench基准测试，通过270个基于90篇跨学科科学论文的任务，可评估AI智能体在计算可重复性方面的表现，最简单任务的准确率可以达到60%，最难任务准确率仅有21%大模型的能力越来越强，...……更多

2024-09-26 13:38:00普林,普林斯顿,斯顿,准确率,基准,科学家

首家！数势科技通过中国信通院数据指标管理平台技术要求专项测试

2024年5月10日，在中国信息通信研究院（以下简称“中国信通院”）组织的首批数据指标管理平台技术要求专项测试中，北京数势云创科技有限公司（以下简称“数势科技”）顺利完成了数据指标管理平台技术要求专项测试的全...……更多

2024-05-13 16:00:00信通,中国,专项,指标,测试,数据

嘉为蓝鲸荣誉入选信通院汽车云市场图谱

...格局。历经严格的框架讨论、评估、遴选多个环节，中国信通院汽车云工作组发布了《汽车云市场图谱1.0》，全方位展示在汽车云领域处于领先地位的代表性企业。嘉为科技旗下研运解决方案品牌嘉为蓝鲸荣誉上榜云服务厂商优...……更多

2024-03-04 16:30:00信通,蓝鲸,图谱,荣誉,汽车,市场

突发！谷歌发布史上最强大模型Gemini，打爆GPT-4

...的高效Gemini版本（1.8B/3.25B）其中Gemini Ultra一上来就在32个基准测试中拿下30个SOTA，并且第一个在MMLU基准上达到人类专家水平。而Gemini Pro从今天起，就会在Bard中实装上线。同时，谷歌Gemini团队还公布了一份60页的详细技术报告...……更多

2023-12-07 09:35:00突发,模型,模态,模型,基准,数据

迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测

...一款名为 MMed-Llama 3 的全新基座模型，以 8B 的尺寸在多项基准测试中超越了现有的开源模型，更加适合通过医学指令微调，适配到各种医学场景。所有数据和代码、模型均已开源。MMedBench 上的准确率，图 d 展⽰了在 MMedC 上进...……更多

2024-09-30 09:51:00多语,大规,模型,语料,基准,大规模

中国信通院与联想集团联合发布《中国企业智能化成熟度报告（20

...自：人民日报1月11日，中国信息通信研究院（简称“中国信通院”）与联想集团共同发布《中国企业智能化成熟度报告（2022）》（简称《报告》）。《报告》提出兼具实用性和可操作性的智能化转型方法论，致力于帮助广大企...……更多

2023-01-12 05:32:00联想集团,中国,信通,致远,成熟度,高质量

苹果AI震撼上线iPhone，进化版Siri却没有ChatG

...示了AFM-server在HuggingFace OpenLLM排行榜V1，以及HELM-Lite v1.5.0基准上的结果。可以看到，AFM预训练模型有着强大的语言和推理能力，从而为后训练和特征微调提供了坚实的基础。后训练人类评估对于苹果AI的应用场景来说，人类评估...……更多

2024-08-01 09:40:00进化,模型,苹果,报告,技术,苹果

2023 AI现状报告：GPT-4仍最强，监管方向缺乏全球共

...变得更加强大和灵活，比较它们的能力越来越困难。由于基准变得不那么明确，用于评估大语言模型的“基于氛围”的方法在业界越来越普遍。·人工智能安全在2023年首次占据舞台中心。但人工智能界内部存在深刻分歧，世界各...……更多

2023-10-12 15:21:00共识,监管,现状,方向,报告,全球

OpenAI o1 模型 PlanBench 规划能力实测：

... 日消息，来自亚利桑那州立大学的科研团队利用 PlanBench 基准，测试了 OpenAI o1 模型的规划能力。研究结果表明 o1 模型取得了长足的进步，但仍然存在很大的局限性。PlanBench 基准简介PlanBench 开发于 2022 年，用于评估人工智能系...……更多

2024-09-26 09:50:00准确率,实测,模型,能力,规划,模型

联想与信通院发企业智能化成熟度报告：中国企业智能化转型进入深

1月12日消息，近日，联想集团联合中国信息通信研究院发布业内首份《中国企业智能化成熟度报告（2022）》，《报告》指出中国企业智能化转型已经进入“深水区”。资料图在汲取业界已有理论研究成果，对比参考政府、行业...……更多

2023-01-12 11:00:00信通,智能,成熟度,企业,深水,中国

LLM仍然不能规划，刷屏的OpenAI o1远未达到饱和

...史记录。o1 模型拥有真正的通用推理能力。在一系列高难基准测试中展现出了超强实力，相比 GPT-4o 有巨大提升，让大模型的上限从「没法看」直接上升到优秀水平，不专门训练直接数学奥赛金牌，甚至能在博士级别的科学问答...……更多

2024-09-25 09:48:00饱和,规划,模型,测试,规划,能力

2024数据智能大会在北京召开

...坛及数据资源估值与入表闭门研讨会，大会主论坛由中国信通院云计算与大数据研究所大数据与智能化部主任姜春宇主持，并邀请了来自金融、通信、信息技术、航空、健康科技、大数据等多个领域的近千位专家、代表现场参会...……更多

2024-06-20 16:09:00北京,大会,智能,数据,数据,智能

国网宁夏信通设备全过程贯通成果落地应用

...转自：中国电力报贾博本报讯（贾博）4月7日，国网宁夏信通公司数据运营平台完成设备全过程贯通各类作业任务全链路、全环节监控场景构建，标志着宁夏电力设备全过程贯通全链路联调测试工作全面完成，为核心设备各环节...……更多

2024-04-22 01:29:00信通,宁夏,落地,全过程,成果,应用

小米超越苹果登顶中国第一，雷军：能拿第一确实不容易

...米和华为的带动下，终于迎来了复苏时刻。1月22日，中国信通院发布了2023年12月以及全年国内手机市场运行分析报告。据相关数据显示，2023年12月，国内市场手机出货量2827.5万部，同比增长1.5%，其中5G手机2420万部，同比增长4.2%...……更多

2024-01-24 16:18:00雷军,小米,中国,苹果,华为,小米

AI大模型时代，瑞数信息变革“下一代应用与数据安全”

...程中，面临着严峻的数据安全考验和应用漏洞风险。中国信通院云大所开源和软件安全部副主任卫斌针对中国信通院WAAP能力要求等应用安全相关标准内容进行了详细介绍，WAAP正成为未来安全防护发展方向之一。中国信通院云...……更多

2023-11-01 23:02:00下一代,变革,模型,应用,时代,安全

昆仑万维发布开源13B高质量商用大模型领先Llama2和B

...、Skywork-13B-Math模型，它们在CEVAL, GSM8K等多个权威评测与基准测试上都展现了同等规模模型的最佳效果，其中文能力尤为出色，在中文科技、金融、政务等领域表现均高于其他开源模型。除模型开源外，Skywork-13B系列大模型还将开...……更多

2023-10-30 15:35:00万维,昆仑,商用,高质量,模型,领先

AI大模型“国标”首批测试结果公布，人工智能成市场新焦点

...旨在建立大模型标准符合性名录，是基于官方大模型测试基准的权威评测，被业内称为AI大模型“国标”。受此消息影响，12月25日三六零强势涨停。但26日受大盘整体弱势影响，该股开盘短暂震荡。AI大模型高速发展随着ChatGPT应...……更多

2023-12-26 14:16:00人工智能,国标,人工,模型,结果,智能

全球AI安全评估测试有了新基准

...型安全领域两项国际标准发布全球AI安全评估测试有了新基准随着人工智能系统，特别是大语言模型成为社会各方面不可或缺的一部分，以一个全面的标准来解决它们的安全挑战变得至关重要。◎本报记者崔爽第27届联合国科技...……更多

2024-04-25 04:00:00基准,评估,测试,安全,全球,人工智能

2024可信云大会成功召开，天翼云携手产业各界共绘AI未来！

...标准化协会主办，中国信息通信研究院（以下简称“中国信通院”）承办的2024可信云大会在北京成功召开。大会主论坛上，中国信通院携手天翼云共同发布《央国企云上数智实践指南（2024）》，天翼云科技有限公司助理总经理...……更多

2024-07-26 11:45:00云大,天翼,可信,产业,成功,天翼

多模态模型评测框架lmms-eval发布！全面覆盖，低成本，

...，执行这些数据集的全面评估变得非常耗时。此外，这些基准在训练期间也容易受到污染的影响。为此， LMMs-Eval 提出了 LMMs-Eval-Lite 来兼顾广覆盖和低成本。他们也设计了 LiveBench 来做到低成本和零数据泄露。LMMs-Eval-Lite: 广覆盖...……更多

2024-08-22 09:50:00模态,框架,模型,评测,污染,成本

反击OpenAI，谷歌放出最强悍大模型Gemini

...指领先水平的大模型）。图源：谷歌技术报告在权威MMMU基准测试中，Gemini Ultra获得了59.4%的SOTA分数。这项基准测试是经典的多模态测试，由跨不同领域的多模式任务组成，能够体现大模型的深度推理能力，而推理过程本身，需...……更多

2023-12-07 10:31:00强悍,模型,模态,模型,训练,能力

精准狙击Llama 3.1？Mistral AI开源Larg

...量低于 Llama 3.1 的 4050 亿，但两者性能接近。并且在多个基准测试中与 GPT-4o、Anthropic 的 Claude 3.5 Sonnet 媲美。今年 2 月，Mistral AI 推出了最初的 Large 模型，其上下文窗口包含 32,000 个 token，新版模型在此……更多

2024-07-26 09:36:00模型,基准,多语,测试,性能,生成