• 我的订阅
  • 头条热搜
中国信通院发布大模型安全基准测试报告 360智脑综合排名第一
本文转自:中国新闻网近日,中国信息通信研究院发布大模型安全基准测试AI Safety Bench 2024年Q1的首轮测评报告(下称“测评报告”),结果显示,三六零集团自研的认知通用大模型360智脑综合排名第一。大模型安全基准测试AI Safet...……更多
...范能力,今年2月,中国信息通信研究院(以下简称中国信通院)联合360集团,发起大模型安全基准测试SafetyAI Bench制定工作。大模型安全基准测试秉持“公平公正、产业应用、选型参考”原则,采用科学严谨的测试方法,评估大...……更多
日前,“2024中国信通院ICT深度观察报告会”人工智能伙伴分论坛在京召开。会上,“CAICT人工智能伙伴计划”启动。未来,中国信通院将与合作伙伴紧密围绕国家重大需求,在政策研究、标准制定、开放共享、行业赋能以及国...……更多
AI安全守护计划启动!信通院牵头,AIIA安全治理委员会发布三类模型安全评测
...、安全组两个工作组,近百家单位加入,主任单位由中国信通院牵头,副主任单位包括多家知名企业和高校。其中,治理组工作围绕AI治理框架、合规治理、赋能治理展开,安全组主要开展大模型安全、合规等研究及基准测试。...……更多
浪潮科技作为首批成员单位加入信通院“政务大模型推进中心”
12月21日,"2024中国信通院ICT深度观察报告会政企数字化转型论坛"在北京召开。此次论坛聚焦政企数字化转型,浪潮科技作为首批成员单位受邀出席“政务大模型推进中心”成立仪式。中国信通院作为国内IT领域重要权威机构...……更多
中国信通院发布《代码大模型》标准
...,据人工智能产业发展联盟AIIA消息,2024年1月25日,中国信通院联合中国工商银行牵头发布《智能化软件工程技术和应用要求第1部分:代码大模型》标准,该标准适用于企业在代码大模型的研发、评估和验收等过程中,为代码大...……更多
...水电装备、安全应急装备等重点行业装备领域,发挥中国信通院在数字孪生、人工智能、大数据等信息技术领域的创新优势,开展基于数据科学的装备模型构建、仿真、验证等工作,致力于为产业界提供一批基于模型的装备优化...……更多
AI科学家太多,谁靠谱一试便知!普林斯顿新基准CORE-Bench:最强模型仅有21%准确率
【新智元导读】普林斯顿大学新发布的CORE-Bench基准测试,通过270个基于90篇跨学科科学论文的任务,可评估AI智能体在计算可重复性方面的表现,最简单任务的准确率可以达到60%,最难任务准确率仅有21%大模型的能力越来越强,...……更多
首家!数势科技通过中国信通院数据指标管理平台技术要求专项测试
2024年5月10日,在中国信息通信研究院(以下简称“中国信通院”)组织的首批数据指标管理平台技术要求专项测试中,北京数势云创科技有限公司(以下简称“数势科技”)顺利完成了数据指标管理平台技术要求专项测试的全...……更多
嘉为蓝鲸荣誉入选信通院汽车云市场图谱
...格局。历经严格的框架讨论、评估、遴选多个环节,中国信通院汽车云工作组发布了《汽车云市场图谱1.0》,全方位展示在汽车云领域处于领先地位的代表性企业。嘉为科技旗下研运解决方案品牌嘉为蓝鲸荣誉上榜云服务厂商优...……更多
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...的高效Gemini版本(1.8B/3.25B)其中Gemini Ultra一上来就在32个基准测试中拿下30个SOTA,并且第一个在MMLU基准上达到人类专家水平。而Gemini Pro从今天起,就会在Bard中实装上线。 同时,谷歌Gemini团队还公布了一份60页的详细技术报告...……更多
中国信通院与联想集团联合发布《中国企业智能化成熟度报告(2022)》 助力高质量发展行稳致远
...自:人民日报1月11日,中国信息通信研究院(简称“中国信通院”)与联想集团共同发布《中国企业智能化成熟度报告(2022)》(简称《报告》)。《报告》提出兼具实用性和可操作性的智能化转型方法论,致力于帮助广大企...……更多
苹果AI震撼上线iPhone,进化版Siri却没有ChatGPT!47页技术报告揭秘自研模型
...示了AFM-server在HuggingFace OpenLLM排行榜V1,以及HELM-Lite v1.5.0基准上的结果。可以看到,AFM预训练模型有着强大的语言和推理能力,从而为后训练和特征微调提供了坚实的基础。后训练 人类评估对于苹果AI的应用场景来说,人类评估...……更多
微软华人团队发布全新基准AGIEval,专为人类考试而生
随着语言模型的能力越来越强,现有的这些评估基准实在有点小儿科了,有些任务的性能都甩了人类一截。通用人工智能(AGI)的一个重要特点是模型具有处理人类水平任务的泛化能力,而依赖于人工数据集的传统基准测试并...……更多
2023 AI现状报告:GPT-4仍最强,监管方向缺乏全球共识
...变得更加强大和灵活,比较它们的能力越来越困难。由于基准变得不那么明确,用于评估大语言模型的“基于氛围”的方法在业界越来越普遍。·人工智能安全在2023年首次占据舞台中心。但人工智能界内部存在深刻分歧,世界各...……更多
OpenAI o1 模型 PlanBench 规划能力实测:准确率 97.8%
... 日消息,来自亚利桑那州立大学的科研团队利用 PlanBench 基准,测试了 OpenAI o1 模型的规划能力。研究结果表明 o1 模型取得了长足的进步,但仍然存在很大的局限性。PlanBench 基准简介PlanBench 开发于 2022 年,用于评估人工智能系...……更多
联想与信通院发企业智能化成熟度报告:中国企业智能化转型进入深水区
1月12日消息,近日,联想集团联合中国信息通信研究院发布业内首份《中国企业智能化成熟度报告(2022)》,《报告》指出中国企业智能化转型已经进入“深水区”。资料图在汲取业界已有理论研究成果,对比参考政府、行业...……更多
LLM仍然不能规划,刷屏的OpenAI o1远未达到饱和
...史记录。o1 模型拥有真正的通用推理能力。在一系列高难基准测试中展现出了超强实力,相比 GPT-4o 有巨大提升,让大模型的上限从「没法看」直接上升到优秀水平,不专门训练直接数学奥赛金牌,甚至能在博士级别的科学问答...……更多
2024数据智能大会在北京召开
...坛及数据资源估值与入表闭门研讨会,大会主论坛由中国信通院云计算与大数据研究所大数据与智能化部主任姜春宇主持,并邀请了来自金融、通信、信息技术、航空、健康科技、大数据等多个领域的近千位专家、代表现场参会...……更多
...转自:中国电力报贾博本报讯 (贾博)4月7日,国网宁夏信通公司数据运营平台完成设备全过程贯通各类作业任务全链路、全环节监控场景构建,标志着宁夏电力设备全过程贯通全链路联调测试工作全面完成,为核心设备各环节...……更多
小米超越苹果登顶中国第一,雷军:能拿第一确实不容易
...米和华为的带动下,终于迎来了复苏时刻。1月22日,中国信通院发布了2023年12月以及全年国内手机市场运行分析报告。据相关数据显示,2023年12月,国内市场手机出货量2827.5万部,同比增长1.5%,其中5G手机2420万部,同比增长4.2%...……更多
AI大模型时代,瑞数信息变革“下一代应用与数据安全”
...程中,面临着严峻的数据安全考验和应用漏洞风险。中国信通院云大所开源和软件安全部副主任卫斌针对中国信通院WAAP能力要求等应用安全相关标准内容进行了详细介绍,WAAP正成为未来安全防护发展方向之一。 中国信通院云...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
...、Skywork-13B-Math模型,它们在CEVAL, GSM8K等多个权威评测与基准测试上都展现了同等规模模型的最佳效果,其中文能力尤为出色,在中文科技、金融、政务等领域表现均高于其他开源模型。除模型开源外,Skywork-13B系列大模型还将开...……更多
AI大模型“国标”首批测试结果公布,人工智能成市场新焦点
...旨在建立大模型标准符合性名录,是基于官方大模型测试基准的权威评测,被业内称为AI大模型“国标”。受此消息影响,12月25日三六零强势涨停。但26日受大盘整体弱势影响,该股开盘短暂震荡。AI大模型高速发展随着ChatGPT应...……更多
全球AI安全评估测试有了新基准
...型安全领域两项国际标准发布全球AI安全评估测试有了新基准随着人工智能系统,特别是大语言模型成为社会各方面不可或缺的一部分,以一个全面的标准来解决它们的安全挑战变得至关重要。◎本报记者 崔 爽第27届联合国科技...……更多
2024可信云大会成功召开,天翼云携手产业各界共绘AI未来!
...标准化协会主办,中国信息通信研究院(以下简称“中国信通院”)承办的2024可信云大会在北京成功召开。大会主论坛上,中国信通院携手天翼云共同发布《央国企云上数智实践指南(2024)》,天翼云科技有限公司助理总经理...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...,执行这些数据集的全面评估变得非常耗时。此外,这些基准在训练期间也容易受到污染的影响。为此, LMMs-Eval 提出了 LMMs-Eval-Lite 来兼顾广覆盖和低成本。他们也设计了 LiveBench 来做到低成本和零数据泄露。LMMs-Eval-Lite: 广覆盖...……更多
反击OpenAI,谷歌放出最强悍大模型Gemini
...指领先水平的大模型)。 图源:谷歌技术报告在权威MMMU基准测试中,Gemini Ultra获得了59.4%的SOTA分数。这项基准测试是经典的多模态测试,由跨不同领域的多模式任务组成,能够体现大模型的深度推理能力,而推理过程本身,需...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
...量低于 Llama 3.1 的 4050 亿,但两者性能接近。并且在多个基准测试中与 GPT-4o、Anthropic 的 Claude 3.5 Sonnet 媲美。今年 2 月,Mistral AI 推出了最初的 Large 模型,其上下文窗口包含 32,000 个 token,新版模型在此……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...的经济价值,其中我国将突破30万亿元,占比超过四成。信通院启动《大模型数据开发管理能力评价方法总体要求》编制工作12月12日,为破解大模型训练数据发展瓶颈,深入推进人工智能数据高质量发展,由中国信息通信研究院...……更多
更多关于科技的资讯:
iPhone 16交货时间缩短,成近年最不受欢迎一代
2024年9月26日,摩根士丹利在研报中指出,iPhone16的交货时间较前几代产品明显缩短,这说明该产品的受欢迎程度可能不及预期
2024-09-26 20:20:00
星纪魅族举办AI生态发布会,AI 手机、智能穿戴设备登场
9月25日消息,在今日举办的星纪魅族AI生态发布会上,星纪魅族科技有限公司展示了其在智能手机、智能穿戴设备和智能汽车领域的最新产品
2024-09-26 20:21:00
一加13保密壳背板外观曝光,或采用苹果同款长焦方案
9月26日消息,继此前一加中国区总裁李杰透露一加13即将上市后,业内也开始传出这台新机的更多信息。数码博主@数码闲聊站发文展示了一加13的保密壳背板外观
2024-09-26 20:21:00
比苹果还薄!高管晒出vivo小屏旗舰新机照片
近日,vivo产品经理韩伯啸在微博中晒出了一组图片,为网传了许久的vivo“小屏旗舰”手机,从微博显示的机型名称可以得知
2024-09-26 20:21:00
魅族 Lucky 08评测:兼具高颜值的旗舰级AI手机
近年来,AI技术愈发火热,诸多智能手机厂商都纷纷在手机内集成AI大模型相关技术。魅族则直接推出了一款AI手机——魅族Lucky08
2024-09-26 20:21:00
为了一个边框投入上亿,OPPO真是下血本
大家还记得iPhone16系列正式发布之后,刘作虎晒出一张图片。当时行业猜测这是OPPOFindX8系列中某款机型与iPhone16Pro系列的R角对比图
2024-09-26 20:21:00
Redmi Note 14 Pro进水保修,王腾玩大了
按照行业惯例支持防水的手机,一旦进水之后厂家都是不保修的。这也引起很多用户的不满,甚至有iPhone用户为此来起诉苹果
2024-09-26 20:21:00
解释vivo X200,顺手捧了一下小米14,蓝厂格局真大
10月份的旗舰非常有意思,目前只有vivoX200系列确认了发布日期,但是官方却一点都不预热。反而是还没有确认发布日期的OPPOFindX8系列
2024-09-26 20:22:00
摩根士丹利发报告,iPhone 16系列销量不如预期
不知道大家发现没有今年iPhone16系列的热度远远不如前几年,现在已经几乎看不到讨论iPhone16系列的,即使有也是关于iPhone16系列销量不如预期的
2024-09-26 20:23:00
刺激!小米15、荣耀Maigc7都在抢骁龙8Gen 4首发
现在已经确认联发科天玑9400将在10月9日正式发布,vivoX200系列将在10月14日正式发布,全球首发联发科天玑9400
2024-09-26 20:23:00
vivo OriginOS5官方自爆,这四个界面信息量巨大
都知道vivo在10月份会很忙,但率先出现的并不是vivoX200系列,而是OriginOS5.0操作系统。根据官方的信息vivo2024开发者大会将在10月10日举行
2024-09-26 20:23:00
Redmi K80系列电池容量曝光,王腾够狠
不知道大家发现这一波关于高通骁龙8Gen4机型的讨论之中,除了主品牌的机型之外iQOO13、一加13等子品牌的机型也在不断爆料之中
2024-09-26 20:23:00
vivo与郑钦文达成合作,蓝厂小屏旗舰命名确认
大家都知道今年vivoX20系列共有三款机型,除了标准版与Pro之外还有一个小屏旗舰。这是新加的机型,如何命名成为行业关注的焦点所在
2024-09-26 20:23:00
Redmi发布会有创新,王腾不请媒体和粉丝
常规的新机发布会,各品牌都会邀请媒体和粉丝到现场参加。特别是会邀请很多媒体进行报道,即使是线上的发布会,也会邀请一些重量级的媒体到现场
2024-09-26 20:23:00
推动算力交易,赋能产业发展
本文转自:人民日报海外版贵州打造面向全国的算力保障基地:推动算力交易,赋能产业发展本报记者 陈隽逸《 人民日报海外版 》( 2024年09月27日 第 08 版)贵州贵阳大数据科创城一角
2024-09-27 05:00:00