• 我的订阅
  • 头条热搜
中国信通院发布大模型安全基准测试报告 360智脑综合排名第一
本文转自:中国新闻网近日,中国信息通信研究院发布大模型安全基准测试AI Safety Bench 2024年Q1的首轮测评报告(下称“测评报告”),结果显示,三六零集团自研的认知通用大模型360智脑综合排名第一。大模型安全基准测试AI Safet...……更多
...范能力,今年2月,中国信息通信研究院(以下简称中国信通院)联合360集团,发起大模型安全基准测试SafetyAI Bench制定工作。大模型安全基准测试秉持“公平公正、产业应用、选型参考”原则,采用科学严谨的测试方法,评估大...……更多
日前,“2024中国信通院ICT深度观察报告会”人工智能伙伴分论坛在京召开。会上,“CAICT人工智能伙伴计划”启动。未来,中国信通院将与合作伙伴紧密围绕国家重大需求,在政策研究、标准制定、开放共享、行业赋能以及国...……更多
AI安全守护计划启动!信通院牵头,AIIA安全治理委员会发布三类模型安全评测
...、安全组两个工作组,近百家单位加入,主任单位由中国信通院牵头,副主任单位包括多家知名企业和高校。其中,治理组工作围绕AI治理框架、合规治理、赋能治理展开,安全组主要开展大模型安全、合规等研究及基准测试。...……更多
...记者10日从中国信息通信研究院了解到,今年6月来,中国信通院选取多款通用大模型和医疗健康行业大模型开展效能评估工作,结果显示,通用大模型在医学知识广度方面具有一定优势,医疗健康行业大模型在特定医疗任务上表...……更多
浪潮科技作为首批成员单位加入信通院“政务大模型推进中心”
12月21日,"2024中国信通院ICT深度观察报告会政企数字化转型论坛"在北京召开。此次论坛聚焦政企数字化转型,浪潮科技作为首批成员单位受邀出席“政务大模型推进中心”成立仪式。中国信通院作为国内IT领域重要权威机构...……更多
中国信通院发布《代码大模型》标准
...,据人工智能产业发展联盟AIIA消息,2024年1月25日,中国信通院联合中国工商银行牵头发布《智能化软件工程技术和应用要求第1部分:代码大模型》标准,该标准适用于企业在代码大模型的研发、评估和验收等过程中,为代码大...……更多
「世界开源新王」跌落神坛?重测跑分暴跌实锤造假,2人团队光速「滑跪」
...性消息——结果没多久,Reflection 70B就被打假了:公布的基准测试结果和他们的独立测试之间存在显著差异。无论是AI研究者,还是第三方评估者,都无法复现Matt Shumer所声称的结果。根据Artificial Analysis的数据,Reflection 70B在基准...……更多
...水电装备、安全应急装备等重点行业装备领域,发挥中国信通院在数字孪生、人工智能、大数据等信息技术领域的创新优势,开展基于数据科学的装备模型构建、仿真、验证等工作,致力于为产业界提供一批基于模型的装备优化...……更多
...全性方面的问题已经受到业内高度关注。今年8月,中国信通院发文称,近年来,以大模型为核心的人工智能技术飞速发展,成为数字经济增长新动能。然而,作为新质生产力的大模型在安全性方面仍存在较多缺陷,这为其大规...……更多
AI科学家太多,谁靠谱一试便知!普林斯顿新基准CORE-Bench:最强模型仅有21%准确率
【新智元导读】普林斯顿大学新发布的CORE-Bench基准测试,通过270个基于90篇跨学科科学论文的任务,可评估AI智能体在计算可重复性方面的表现,最简单任务的准确率可以达到60%,最难任务准确率仅有21%大模型的能力越来越强,...……更多
首家!数势科技通过中国信通院数据指标管理平台技术要求专项测试
2024年5月10日,在中国信息通信研究院(以下简称“中国信通院”)组织的首批数据指标管理平台技术要求专项测试中,北京数势云创科技有限公司(以下简称“数势科技”)顺利完成了数据指标管理平台技术要求专项测试的全...……更多
嘉为蓝鲸荣誉入选信通院汽车云市场图谱
...格局。历经严格的框架讨论、评估、遴选多个环节,中国信通院汽车云工作组发布了《汽车云市场图谱1.0》,全方位展示在汽车云领域处于领先地位的代表性企业。嘉为科技旗下研运解决方案品牌嘉为蓝鲸荣誉上榜云服务厂商优...……更多
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...的高效Gemini版本(1.8B/3.25B)其中Gemini Ultra一上来就在32个基准测试中拿下30个SOTA,并且第一个在MMLU基准上达到人类专家水平。而Gemini Pro从今天起,就会在Bard中实装上线。 同时,谷歌Gemini团队还公布了一份60页的详细技术报告...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...一款名为 MMed-Llama 3 的全新基座模型,以 8B 的尺寸在多项基准测试中超越了现有的开源模型,更加适合通过医学指令微调,适配到各种医学场景。 所有数据和代码、模型均已开源。MMedBench 上的准确率,图 d 展⽰了在 MMedC 上进...……更多
中国信通院与联想集团联合发布《中国企业智能化成熟度报告(2022)》 助力高质量发展行稳致远
...自:人民日报1月11日,中国信息通信研究院(简称“中国信通院”)与联想集团共同发布《中国企业智能化成熟度报告(2022)》(简称《报告》)。《报告》提出兼具实用性和可操作性的智能化转型方法论,致力于帮助广大企...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...要好。 最后,与开源模型一起,Mistral还贡献了一个开源基准测试MM-MT-Bench,用于在实际场景中评估视觉语言模型。技术细节当前的多模态大模型基本上都是:模态编码器 + 投影模块 + 大语言模型主干。如果需要多模态输出,后...……更多
苹果AI震撼上线iPhone,进化版Siri却没有ChatGPT!47页技术报告揭秘自研模型
...示了AFM-server在HuggingFace OpenLLM排行榜V1,以及HELM-Lite v1.5.0基准上的结果。可以看到,AFM预训练模型有着强大的语言和推理能力,从而为后训练和特征微调提供了坚实的基础。后训练 人类评估对于苹果AI的应用场景来说,人类评估...……更多
自动化、可复现,基于大语言模型群体智能的多维评估基准
...)也越来越强。因此,在多样的应用场景中对其进行性能基准测试已成为了一项重大挑战。目前最受欢迎的基准测试是 Chatbot Arena,它通过收集用户对模型输出的偏好来对 LLM 进行综合排名。然而,随着 LLM 逐渐落地于众多应用场...……更多
2023 AI现状报告:GPT-4仍最强,监管方向缺乏全球共识
...变得更加强大和灵活,比较它们的能力越来越困难。由于基准变得不那么明确,用于评估大语言模型的“基于氛围”的方法在业界越来越普遍。·人工智能安全在2023年首次占据舞台中心。但人工智能界内部存在深刻分歧,世界各...……更多
OpenAI o1 模型 PlanBench 规划能力实测:准确率 97.8%
... 日消息,来自亚利桑那州立大学的科研团队利用 PlanBench 基准,测试了 OpenAI o1 模型的规划能力。研究结果表明 o1 模型取得了长足的进步,但仍然存在很大的局限性。PlanBench 基准简介PlanBench 开发于 2022 年,用于评估人工智能系...……更多
联想与信通院发企业智能化成熟度报告:中国企业智能化转型进入深水区
1月12日消息,近日,联想集团联合中国信息通信研究院发布业内首份《中国企业智能化成熟度报告(2022)》,《报告》指出中国企业智能化转型已经进入“深水区”。资料图在汲取业界已有理论研究成果,对比参考政府、行业...……更多
LLM仍然不能规划,刷屏的OpenAI o1远未达到饱和
...史记录。o1 模型拥有真正的通用推理能力。在一系列高难基准测试中展现出了超强实力,相比 GPT-4o 有巨大提升,让大模型的上限从「没法看」直接上升到优秀水平,不专门训练直接数学奥赛金牌,甚至能在博士级别的科学问答...……更多
2024数据智能大会在北京召开
...坛及数据资源估值与入表闭门研讨会,大会主论坛由中国信通院云计算与大数据研究所大数据与智能化部主任姜春宇主持,并邀请了来自金融、通信、信息技术、航空、健康科技、大数据等多个领域的近千位专家、代表现场参会...……更多
...转自:中国电力报贾博本报讯 (贾博)4月7日,国网宁夏信通公司数据运营平台完成设备全过程贯通各类作业任务全链路、全环节监控场景构建,标志着宁夏电力设备全过程贯通全链路联调测试工作全面完成,为核心设备各环节...……更多
小米超越苹果登顶中国第一,雷军:能拿第一确实不容易
...米和华为的带动下,终于迎来了复苏时刻。1月22日,中国信通院发布了2023年12月以及全年国内手机市场运行分析报告。据相关数据显示,2023年12月,国内市场手机出货量2827.5万部,同比增长1.5%,其中5G手机2420万部,同比增长4.2%...……更多
AI大模型时代,瑞数信息变革“下一代应用与数据安全”
...程中,面临着严峻的数据安全考验和应用漏洞风险。中国信通院云大所开源和软件安全部副主任卫斌针对中国信通院WAAP能力要求等应用安全相关标准内容进行了详细介绍,WAAP正成为未来安全防护发展方向之一。 中国信通院云...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
...、Skywork-13B-Math模型,它们在CEVAL, GSM8K等多个权威评测与基准测试上都展现了同等规模模型的最佳效果,其中文能力尤为出色,在中文科技、金融、政务等领域表现均高于其他开源模型。除模型开源外,Skywork-13B系列大模型还将开...……更多
AI大模型“国标”首批测试结果公布,人工智能成市场新焦点
...旨在建立大模型标准符合性名录,是基于官方大模型测试基准的权威评测,被业内称为AI大模型“国标”。受此消息影响,12月25日三六零强势涨停。但26日受大盘整体弱势影响,该股开盘短暂震荡。AI大模型高速发展随着ChatGPT应...……更多
AI落地千行百业,存储痛点凸显,浪潮信息如何助力AI向实?
...AI应用场景的契合度。这一点,也是全球唯一的AI/ML存储基准测试——MLPerf所关注的本质。MLPerf存储基准测试面向AI/ML用户的痛点,即存储和计算的平衡及两者的有效利用。然而测试中存储架构的多样与存算节点的非标准化,导致...……更多
更多关于科技的资讯:
研究称古罗马铅污染降低了整个欧洲智商:上世纪在美国重演
1月7日消息,古罗马可以说是曾经最先进的国家之一,然而根据美国沙漠研究所的一项新研究,古罗马时期的采矿导致了广泛的铅污染
2025-01-07 16:48:00
全新岚图梦想家上市110天大定突破50000台:单车均价超38.9万!
快科技1月7日消息,全新岚图梦想家自9月19日上市以来,仅110天便累计大定订单突破50000台。据悉,该车的售价区间为32
2025-01-07 16:48:00
保定高新区:AIIA数据委员会2025第一次工作会议在保定中关村创新中心举办
本文转自:人民网-河北频道文化教育高质量数据集建设研讨会现场 。刘奥文摄1月3日,以“承文教精粹 启数据新篇”为主题的中国人工智能产业发展联盟(AIIA)数据委员会2025第一次工作会议暨文化教育高质量数据集建设研讨会在保定高新区召开
2025-01-07 16:58:00
将“优质平价”带给更多咖啡馆,菲诺和瑞幸做起toB咖啡豆
文|李振兴1月6日,2025菲诺伙伴大会在浙江桐乡举行,除发布燕麦奶等新品外,菲诺正式宣布成为瑞幸toB专业咖啡豆的特约经销商
2025-01-07 17:11:00
兴业工匠 | 兴业银行青岛分行张文雅:在基层岗位绽放璀璨星光
鲁网1月7日讯在兴业银行的大家庭里,有这样一位普通而又不平凡的柜员——青岛分行营业部对公柜员张文雅。她以十四年如一日的坚守
2025-01-07 17:16:00
年味渐浓,心意先行,2025大润发“年货大街”欢乐启航
鲁网1月7日讯新春佳节的脚步日益临近,处处年味渐浓。消费者们也怀揣着对新年美好期许,开启了采购年货的旅程。为满足广大消费者购物需求
2025-01-07 17:16:00
连续6年布局品牌年轻化,榄菊已然成为中国消杀行业TOP品牌
消杀,顾名思义,就是消毒杀虫的简称,指采用物理、化学或生物的方法,对病原微生物和传染病媒介进行消毒处理、生物控制的措施
2025-01-07 17:17:00
老酒公社首次年度品牌增长战略大会在济南举行
1月3日,老酒公社首次年度品牌增长战略大会在济南召开。本次大会以“老酒公社首次年度品牌增长战略大会”为主题,旨在通过分享
2025-01-07 17:17:00
游戏本进入4K高刷时代!七彩虹RTX 5090新机将星X18 Max曝光
快科技1月7日消息,今天CES 2025正式开幕,七彩虹也放出了自家新品的预热,推出了全新的将星X18 Max游戏本。这款游戏本最大的亮点就是18英寸的大屏幕搭载了4K和200Hz的高刷
2025-01-07 17:18:00
天猫2024开店报告:32品牌成交破亿 733品牌成交超千万
快科技1月7日消息,今日下午,天猫发布了2024年度商家开店报告。报告显示,2024年天猫平台新入驻的商家数量同比增长了83%
2025-01-07 17:18:00
英伟达官方公布50系显卡性能对比图:性能大涨
今日(1月7日)英伟达CES 2025大会上,黄仁勋正式公布了RTX 50系显卡和售价。现在英伟达官网上线了50系显卡的介绍内容
2025-01-07 17:18:00
车借给堂弟开被撞报废 车主:没三者车损险 只能自己赔
快科技1月7日消息,如果亲戚朋友向你借车开,你会借吗?如果发生事故,责任你会怎么算?据报道,日前,云南普洱一车主向媒体反映
2025-01-07 17:18:00
投资造火箭 丰田也想上天
丰田也要投资造火箭了。在拉斯维加斯消费电子展CES上,丰田举办了一场新闻发布会,丰田章男亲自站台,释放出了一个重要信号——丰田正在探索轨道火箭的开发和生产
2025-01-07 17:18:00
开足马力!黄仁勋:Blackwell正在45座工厂全面量产中
快科技1月7日消息,今日,NVIDIA CEO黄仁勋宣布,正式推出新一代Blackwell家族产品。全新的RTX 50系列显卡采用Blackwell架构
2025-01-07 17:18:00
全新一代国产宝马X3量产:轴距加长看齐大哥宝马X5
快科技1月7日行消息,今日,全新一代宝马X3在华晨宝马铁西工厂里达厂区总装车间的最终装配线驶出,这也是首辆国产的全新宝马X3
2025-01-07 17:18:00