• 我的订阅
  • 头条热搜
中国信通院发布大模型安全基准测试报告 360智脑综合排名第一
本文转自:中国新闻网近日,中国信息通信研究院发布大模型安全基准测试AI Safety Bench 2024年Q1的首轮测评报告(下称“测评报告”),结果显示,三六零集团自研的认知通用大模型360智脑综合排名第一。大模型安全基准测试AI Safet...……更多
...范能力,今年2月,中国信息通信研究院(以下简称中国信通院)联合360集团,发起大模型安全基准测试SafetyAI Bench制定工作。大模型安全基准测试秉持“公平公正、产业应用、选型参考”原则,采用科学严谨的测试方法,评估大...……更多
日前,“2024中国信通院ICT深度观察报告会”人工智能伙伴分论坛在京召开。会上,“CAICT人工智能伙伴计划”启动。未来,中国信通院将与合作伙伴紧密围绕国家重大需求,在政策研究、标准制定、开放共享、行业赋能以及国...……更多
AI安全守护计划启动!信通院牵头,AIIA安全治理委员会发布三类模型安全评测
...、安全组两个工作组,近百家单位加入,主任单位由中国信通院牵头,副主任单位包括多家知名企业和高校。其中,治理组工作围绕AI治理框架、合规治理、赋能治理展开,安全组主要开展大模型安全、合规等研究及基准测试。...……更多
浪潮科技作为首批成员单位加入信通院“政务大模型推进中心”
12月21日,"2024中国信通院ICT深度观察报告会政企数字化转型论坛"在北京召开。此次论坛聚焦政企数字化转型,浪潮科技作为首批成员单位受邀出席“政务大模型推进中心”成立仪式。中国信通院作为国内IT领域重要权威机构...……更多
中国信通院发布《代码大模型》标准
...,据人工智能产业发展联盟AIIA消息,2024年1月25日,中国信通院联合中国工商银行牵头发布《智能化软件工程技术和应用要求第1部分:代码大模型》标准,该标准适用于企业在代码大模型的研发、评估和验收等过程中,为代码大...……更多
...水电装备、安全应急装备等重点行业装备领域,发挥中国信通院在数字孪生、人工智能、大数据等信息技术领域的创新优势,开展基于数据科学的装备模型构建、仿真、验证等工作,致力于为产业界提供一批基于模型的装备优化...……更多
首家!数势科技通过中国信通院数据指标管理平台技术要求专项测试
2024年5月10日,在中国信息通信研究院(以下简称“中国信通院”)组织的首批数据指标管理平台技术要求专项测试中,北京数势云创科技有限公司(以下简称“数势科技”)顺利完成了数据指标管理平台技术要求专项测试的全...……更多
嘉为蓝鲸荣誉入选信通院汽车云市场图谱
...格局。历经严格的框架讨论、评估、遴选多个环节,中国信通院汽车云工作组发布了《汽车云市场图谱1.0》,全方位展示在汽车云领域处于领先地位的代表性企业。嘉为科技旗下研运解决方案品牌嘉为蓝鲸荣誉上榜云服务厂商优...……更多
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...的高效Gemini版本(1.8B/3.25B)其中Gemini Ultra一上来就在32个基准测试中拿下30个SOTA,并且第一个在MMLU基准上达到人类专家水平。而Gemini Pro从今天起,就会在Bard中实装上线。 同时,谷歌Gemini团队还公布了一份60页的详细技术报告...……更多
中国信通院与联想集团联合发布《中国企业智能化成熟度报告(2022)》 助力高质量发展行稳致远
...自:人民日报1月11日,中国信息通信研究院(简称“中国信通院”)与联想集团共同发布《中国企业智能化成熟度报告(2022)》(简称《报告》)。《报告》提出兼具实用性和可操作性的智能化转型方法论,致力于帮助广大企...……更多
苹果AI震撼上线iPhone,进化版Siri却没有ChatGPT!47页技术报告揭秘自研模型
...示了AFM-server在HuggingFace OpenLLM排行榜V1,以及HELM-Lite v1.5.0基准上的结果。可以看到,AFM预训练模型有着强大的语言和推理能力,从而为后训练和特征微调提供了坚实的基础。后训练 人类评估对于苹果AI的应用场景来说,人类评估...……更多
2023 AI现状报告:GPT-4仍最强,监管方向缺乏全球共识
...变得更加强大和灵活,比较它们的能力越来越困难。由于基准变得不那么明确,用于评估大语言模型的“基于氛围”的方法在业界越来越普遍。·人工智能安全在2023年首次占据舞台中心。但人工智能界内部存在深刻分歧,世界各...……更多
联想与信通院发企业智能化成熟度报告:中国企业智能化转型进入深水区
1月12日消息,近日,联想集团联合中国信息通信研究院发布业内首份《中国企业智能化成熟度报告(2022)》,《报告》指出中国企业智能化转型已经进入“深水区”。资料图在汲取业界已有理论研究成果,对比参考政府、行业...……更多
2024数据智能大会在北京召开
...坛及数据资源估值与入表闭门研讨会,大会主论坛由中国信通院云计算与大数据研究所大数据与智能化部主任姜春宇主持,并邀请了来自金融、通信、信息技术、航空、健康科技、大数据等多个领域的近千位专家、代表现场参会...……更多
...转自:中国电力报贾博本报讯 (贾博)4月7日,国网宁夏信通公司数据运营平台完成设备全过程贯通各类作业任务全链路、全环节监控场景构建,标志着宁夏电力设备全过程贯通全链路联调测试工作全面完成,为核心设备各环节...……更多
小米超越苹果登顶中国第一,雷军:能拿第一确实不容易
...米和华为的带动下,终于迎来了复苏时刻。1月22日,中国信通院发布了2023年12月以及全年国内手机市场运行分析报告。据相关数据显示,2023年12月,国内市场手机出货量2827.5万部,同比增长1.5%,其中5G手机2420万部,同比增长4.2%...……更多
AI大模型时代,瑞数信息变革“下一代应用与数据安全”
...程中,面临着严峻的数据安全考验和应用漏洞风险。中国信通院云大所开源和软件安全部副主任卫斌针对中国信通院WAAP能力要求等应用安全相关标准内容进行了详细介绍,WAAP正成为未来安全防护发展方向之一。 中国信通院云...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
...、Skywork-13B-Math模型,它们在CEVAL, GSM8K等多个权威评测与基准测试上都展现了同等规模模型的最佳效果,其中文能力尤为出色,在中文科技、金融、政务等领域表现均高于其他开源模型。除模型开源外,Skywork-13B系列大模型还将开...……更多
AI大模型“国标”首批测试结果公布,人工智能成市场新焦点
...旨在建立大模型标准符合性名录,是基于官方大模型测试基准的权威评测,被业内称为AI大模型“国标”。受此消息影响,12月25日三六零强势涨停。但26日受大盘整体弱势影响,该股开盘短暂震荡。AI大模型高速发展随着ChatGPT应...……更多
全球AI安全评估测试有了新基准
...型安全领域两项国际标准发布全球AI安全评估测试有了新基准随着人工智能系统,特别是大语言模型成为社会各方面不可或缺的一部分,以一个全面的标准来解决它们的安全挑战变得至关重要。◎本报记者 崔 爽第27届联合国科技...……更多
2024可信云大会成功召开,天翼云携手产业各界共绘AI未来!
...标准化协会主办,中国信息通信研究院(以下简称“中国信通院”)承办的2024可信云大会在北京成功召开。大会主论坛上,中国信通院携手天翼云共同发布《央国企云上数智实践指南(2024)》,天翼云科技有限公司助理总经理...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...,执行这些数据集的全面评估变得非常耗时。此外,这些基准在训练期间也容易受到污染的影响。为此, LMMs-Eval 提出了 LMMs-Eval-Lite 来兼顾广覆盖和低成本。他们也设计了 LiveBench 来做到低成本和零数据泄露。LMMs-Eval-Lite: 广覆盖...……更多
反击OpenAI,谷歌放出最强悍大模型Gemini
...指领先水平的大模型)。 图源:谷歌技术报告在权威MMMU基准测试中,Gemini Ultra获得了59.4%的SOTA分数。这项基准测试是经典的多模态测试,由跨不同领域的多模式任务组成,能够体现大模型的深度推理能力,而推理过程本身,需...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
...量低于 Llama 3.1 的 4050 亿,但两者性能接近。并且在多个基准测试中与 GPT-4o、Anthropic 的 Claude 3.5 Sonnet 媲美。今年 2 月,Mistral AI 推出了最初的 Large 模型,其上下文窗口包含 32,000 个 token,新版模型在此……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...的经济价值,其中我国将突破30万亿元,占比超过四成。信通院启动《大模型数据开发管理能力评价方法总体要求》编制工作12月12日,为破解大模型训练数据发展瓶颈,深入推进人工智能数据高质量发展,由中国信息通信研究院...……更多
AI+隐私计算助力保险创新,“隐语”入选信通院大数据优秀案例
AI+隐私计算助力保险创新,“隐语”入选信通院大数据优秀案例近日,中国信通院发布了2023 大数据“星河”案例榜单,蚂蚁集团“基于‘隐语联合定价方案’实现新能源车险精算定价”项目获得数据要素流通优秀案例。(图:...……更多
钉钉入选信通院首批“企业级数智化AI融合推进计划”成员单位
...0发布暨企业级数智化AI应用研讨会”在京召开。会上中国信通院发布企业数智化成熟度IOMM3.0标准、《央国企数智化转型发展研究报告(2024)》,正式启动“企业级数智化AI融合推进计划”,钉钉作为首批成员单位入选该计划,...……更多
AMD跑大模型终于Yes!MI300X对比NVIDIA H100/200毫不逊色
...The Information发布的评测报告,AMD的Instinct MI300X GPU在AI推理基准测试中的表现与NVIDIA的H100 GPU相当,显示出AMD在高性能AI计算领域的进步。这份评测报告由MLCommons提供数据,在测试中,AMD的MI300X GPU以及NVIDIA的……更多
GPT-4劲敌,谷歌进入高能+高产模式
....5 Pro官方测试数据Gemini 1.5 Pro大大超过Gemini 1.0 Pro,在27项基准(共31项)上表现更好,特别是在数学、科学和推理(+28.9%),多语言(+22.3%),视频理解(+11.2%)和代码(+8.9%)等领域。即使是对比Gemini 系列的高端产品Gemini……更多
更多关于科技的资讯:
新技术多 新产品多 海外订单多 龙头企业杭汽轮展现“中国制造”力量与速度
1700多名工人全部到岗。“春节一过,汽轮机生产车间就全面复工,上线全年排产计划,生产订单稳中有升。”杭州汽轮动力集团股份有限公司副总经理邵建伟翻开厚厚一叠生产动态表
2025-02-14 07:55:00
近日,在太原海关所属晋阳海关报关大厅里,海关工作人员仔细核对市民潘女士携带宠物犬的申报信息后,对宠物犬扫描芯片并进行临床检查
2025-02-14 07:57:00
甄嬛传余莺儿扮演者被行拘 自爆无证驾驶逃逸:公开道歉我错了
快科技2月14日消息,近日,电视剧《甄嬛传》中余莺儿(余答应)的扮演者女演员崔漫莉在直播间自曝,其在浙江东阳市横店镇拍戏时曾酒后无证驾车并肇事逃逸
2025-02-14 08:21:00
M2版Mac mini比M4版还贵!苹果定价引发争议
快科技2月14日消息,在苹果美国官网,苹果开售官翻版Mac mini,因M4版本的价格比M2版本更便宜,其定价模式引发争议
2025-02-14 08:21:00
英伟达宣布RTX 5070显卡延期上市:从2月跳票至3月5日
快科技2月14日消息,在2025年CES展上,英伟达CEO黄仁勋正式发布万众期待的RTX 50系列显卡。首批共五款产品
2025-02-14 08:21:00
票房破100亿!韩国电视台种草《哪吒2》:好莱坞级特效 中国版漫威
快科技2月14日消息,日前,电影《哪吒之魔童闹海》票房(含预售)已达100亿元,成为我国影史首部百亿元票房影片。据媒体报道
2025-02-14 08:21:00
厦门网讯(厦门日报记者 林露虹)工信部近日公布“2024年工业领域数据要素应用场景典型实践案例”名单,共8个方向的73个案例入选
2025-02-14 08:41:00
谷歌Gemini宣布上线全局记忆功能:可回忆曾经所有对话
快科技2月14日消息,据报道,谷歌正式宣布其人工智能平台Gemini AI上线了一项备受期待的“全局记忆”功能。此创新功能赋予Gemini AI前所未有的能力
2025-02-14 08:51:00
2分9秒944最速量产车!小米SU7 Ultra刷新上海国际赛车场纪录 雷军:里程碑式跨越
快科技2月14日消息,今日,小米CEO雷军宣布,小米SU7 Ultra在上海国际赛车场跑出2分9秒944的成绩,成为上赛最速量产车
2025-02-14 08:51:00
亚马逊下订《指环王》第三季
续订并无悬念,但拖到现在才放行表明幕后并非一团和气。《指环王:力量之戒》第二季早在去年十月便播放完毕,结尾留有悬念:索伦在各条战线取得胜利
2025-02-14 08:51:00
英国强索苹果iCloud后门 iPhone用户瑟瑟发抖:美国发声
快科技2月14日消息,据国外媒体报道称,英国安全部门官员近来要求美国苹果公司创建所谓的“后门”,允许他们检索全球任何苹果用户上传到云端的所有内容
2025-02-14 09:21:00
硅谷一天上映27场 哪吒2上演DeepSeek时刻:强势冲击迪士尼大本营
势不可挡,哪吒驾临美国!硅谷影院一天上映27场本周开始,中国魔幻动画电影《哪吒2:魔童闹海》正式登陆北美市场(美国与加拿大)
2025-02-14 09:21:00
国家电网分析《哪吒2》引天雷威力:2800万度电!
2月14日消息,在电影《哪吒2》中,申正道施法引动天雷长达十余秒,这意味着什么呢? “国资小新”微博发文分析,现实中,雷电平均电流是3万安培
2025-02-14 09:21:00
性能、价格全方位碾压RTX 4060!AMD RX 7650 GRE首发评测
一、前言:提前迎接RTX 5060由于依旧使用和上代产品相同的台积电4N制程工艺(实际上是5nm),这一代RTX 50系相比上代的提升实在有限
2025-02-14 09:21:00
全球最薄折叠屏!OPPO Find N5入网:详细参数出炉
快科技2月14日消息,今天,工信部公布了OPPO Find N5(设备型号为PKH110)的证件照以及详细参数。据悉,OPPO Find N5外屏尺寸是6
2025-02-14 09:21:00