• 我的订阅
  • 头条热搜
中国信通院发布大模型安全基准测试报告 360智脑综合排名第一
本文转自:中国新闻网近日,中国信息通信研究院发布大模型安全基准测试AI Safety Bench 2024年Q1的首轮测评报告(下称“测评报告”),结果显示,三六零集团自研的认知通用大模型360智脑综合排名第一。大模型安全基准测试AI Safet...……更多
...范能力,今年2月,中国信息通信研究院(以下简称中国信通院)联合360集团,发起大模型安全基准测试SafetyAI Bench制定工作。大模型安全基准测试秉持“公平公正、产业应用、选型参考”原则,采用科学严谨的测试方法,评估大...……更多
日前,“2024中国信通院ICT深度观察报告会”人工智能伙伴分论坛在京召开。会上,“CAICT人工智能伙伴计划”启动。未来,中国信通院将与合作伙伴紧密围绕国家重大需求,在政策研究、标准制定、开放共享、行业赋能以及国...……更多
浪潮科技作为首批成员单位加入信通院“政务大模型推进中心”
12月21日,"2024中国信通院ICT深度观察报告会政企数字化转型论坛"在北京召开。此次论坛聚焦政企数字化转型,浪潮科技作为首批成员单位受邀出席“政务大模型推进中心”成立仪式。中国信通院作为国内IT领域重要权威机构...……更多
中国信通院发布《代码大模型》标准
...,据人工智能产业发展联盟AIIA消息,2024年1月25日,中国信通院联合中国工商银行牵头发布《智能化软件工程技术和应用要求第1部分:代码大模型》标准,该标准适用于企业在代码大模型的研发、评估和验收等过程中,为代码大...……更多
...水电装备、安全应急装备等重点行业装备领域,发挥中国信通院在数字孪生、人工智能、大数据等信息技术领域的创新优势,开展基于数据科学的装备模型构建、仿真、验证等工作,致力于为产业界提供一批基于模型的装备优化...……更多
嘉为蓝鲸荣誉入选信通院汽车云市场图谱
...格局。历经严格的框架讨论、评估、遴选多个环节,中国信通院汽车云工作组发布了《汽车云市场图谱1.0》,全方位展示在汽车云领域处于领先地位的代表性企业。嘉为科技旗下研运解决方案品牌嘉为蓝鲸荣誉上榜云服务厂商优...……更多
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...的高效Gemini版本(1.8B/3.25B)其中Gemini Ultra一上来就在32个基准测试中拿下30个SOTA,并且第一个在MMLU基准上达到人类专家水平。而Gemini Pro从今天起,就会在Bard中实装上线。 同时,谷歌Gemini团队还公布了一份60页的详细技术报告...……更多
中国信通院与联想集团联合发布《中国企业智能化成熟度报告(2022)》 助力高质量发展行稳致远
...自:人民日报1月11日,中国信息通信研究院(简称“中国信通院”)与联想集团共同发布《中国企业智能化成熟度报告(2022)》(简称《报告》)。《报告》提出兼具实用性和可操作性的智能化转型方法论,致力于帮助广大企...……更多
2023 AI现状报告:GPT-4仍最强,监管方向缺乏全球共识
...变得更加强大和灵活,比较它们的能力越来越困难。由于基准变得不那么明确,用于评估大语言模型的“基于氛围”的方法在业界越来越普遍。·人工智能安全在2023年首次占据舞台中心。但人工智能界内部存在深刻分歧,世界各...……更多
联想与信通院发企业智能化成熟度报告:中国企业智能化转型进入深水区
1月12日消息,近日,联想集团联合中国信息通信研究院发布业内首份《中国企业智能化成熟度报告(2022)》,《报告》指出中国企业智能化转型已经进入“深水区”。资料图在汲取业界已有理论研究成果,对比参考政府、行业...……更多
小米超越苹果登顶中国第一,雷军:能拿第一确实不容易
...米和华为的带动下,终于迎来了复苏时刻。1月22日,中国信通院发布了2023年12月以及全年国内手机市场运行分析报告。据相关数据显示,2023年12月,国内市场手机出货量2827.5万部,同比增长1.5%,其中5G手机2420万部,同比增长4.2%...……更多
AI大模型时代,瑞数信息变革“下一代应用与数据安全”
...程中,面临着严峻的数据安全考验和应用漏洞风险。中国信通院云大所开源和软件安全部副主任卫斌针对中国信通院WAAP能力要求等应用安全相关标准内容进行了详细介绍,WAAP正成为未来安全防护发展方向之一。 中国信通院云...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
...、Skywork-13B-Math模型,它们在CEVAL, GSM8K等多个权威评测与基准测试上都展现了同等规模模型的最佳效果,其中文能力尤为出色,在中文科技、金融、政务等领域表现均高于其他开源模型。除模型开源外,Skywork-13B系列大模型还将开...……更多
AI大模型“国标”首批测试结果公布,人工智能成市场新焦点
...旨在建立大模型标准符合性名录,是基于官方大模型测试基准的权威评测,被业内称为AI大模型“国标”。受此消息影响,12月25日三六零强势涨停。但26日受大盘整体弱势影响,该股开盘短暂震荡。AI大模型高速发展随着ChatGPT应...……更多
反击OpenAI,谷歌放出最强悍大模型Gemini
...指领先水平的大模型)。 图源:谷歌技术报告在权威MMMU基准测试中,Gemini Ultra获得了59.4%的SOTA分数。这项基准测试是经典的多模态测试,由跨不同领域的多模式任务组成,能够体现大模型的深度推理能力,而推理过程本身,需...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...的经济价值,其中我国将突破30万亿元,占比超过四成。信通院启动《大模型数据开发管理能力评价方法总体要求》编制工作12月12日,为破解大模型训练数据发展瓶颈,深入推进人工智能数据高质量发展,由中国信息通信研究院...……更多
AI+隐私计算助力保险创新,“隐语”入选信通院大数据优秀案例
AI+隐私计算助力保险创新,“隐语”入选信通院大数据优秀案例近日,中国信通院发布了2023 大数据“星河”案例榜单,蚂蚁集团“基于‘隐语联合定价方案’实现新能源车险精算定价”项目获得数据要素流通优秀案例。(图:...……更多
GPT-4劲敌,谷歌进入高能+高产模式
....5 Pro官方测试数据Gemini 1.5 Pro大大超过Gemini 1.0 Pro,在27项基准(共31项)上表现更好,特别是在数学、科学和推理(+28.9%),多语言(+22.3%),视频理解(+11.2%)和代码(+8.9%)等领域。即使是对比Gemini 系列的高端产品Gemini……更多
钉钉入选信通院首批“企业级数智化AI融合推进计划”成员单位
...0发布暨企业级数智化AI应用研讨会”在京召开。会上中国信通院发布企业数智化成熟度IOMM3.0标准、《央国企数智化转型发展研究报告(2024)》,正式启动“企业级数智化AI融合推进计划”,钉钉作为首批成员单位入选该计划,...……更多
微软发布旗下最小语言模型phi-2
...代码等等场景。该模型完全基于高质量数据进行训练,在基准测试中的表现比同类模型高出10倍。微软今年9月更新发布了Phi-1.5版本,同样为13亿参数,可以写诗、写电子邮件和故事,以及总结文本。在常识、语言理解和推理的基...……更多
用过GPT-4 Turbo以后,我们再也回不去了
...了不到十分钟。GPT-4 Turbo 具有创纪录的准确率,在 PyLLM 基准上,GPT-4 Turbo 的准确率是 87%,而 GPT-4 的准确率是 52%,这是在速度几乎快了四倍多的情况下(每秒 48 token)实现的。至此,生成式 AI 的竞争似乎进入了新的阶段。很多...……更多
Databricks推出目前最强开源 AI
...大语言模型DBRX,号称是“目前最强开源AI”,据称在各种基准测试中都超越了“市面上所有的开源模型”。从官方新闻稿中得知,DBRX是一个基于Transformer的大语言模型,采用MoE(MixtureofExperts)架构,具备1320亿个参数,并在12TToke...……更多
...北京首都在线科技股份有限公司负责提供性能测试与测评基准设计和执行不同大模型在不同硬件平台的性能测试,输出性能测试评估报告;建立性能测评基准,成为行业通用参考标准。庆阳市政府根据《庆阳市“东数西算”算力...……更多
英伟达h100gpu在mlperf基准测试创造6项新记录
...消息,英伟达今天发布新闻稿,表示旗下的H100GPU在MLPerf基准测试中创造了6项新记录。IT之家今年6月报道,3584 个H100GPU群在短短11分钟内完成了基于GPT-3的大规模基准测试。MLPerfLLM基准测试是基于OpenAI的GPT-3模型进行的,包含1750亿...……更多
马斯克 xAI 推出 Grok-1.5 大语言模型
...员和现有的 Grok 用户推出。在官方测试中,Grok-1.5 在 MATH 基准上取得了 50.6% 的成绩,在 GSM8K 基准上取得了 90% 的成绩,这两个数学基准涵盖了广泛的小学到高中竞赛问题。此外,它在评估代码生成和解决问题能力的 HumanEval 基准...……更多
浪潮智慧医疗发布《基于数据要素的健康医疗数据交易模式研究》报告
...高峰论坛在上海举办,浪潮智慧医疗应邀参会并联合中国信通院、中南大学重磅发布《基于数据要素的健康医疗数据交易模式研究》报告。本次大会以“数联创新,未来健康”为主题,聚焦未来健康“数据空间、数链互联、数智...……更多
中国信通院何宝宏:数据治理发展趋势
12月20日,2023数据资产管理大会在京召开,中国信通院何宝宏受邀出席并做数据治理发展趋势报告。数据作为新型生产要素,已快速融入生产、分配、流通、消费和社会服务管理等各个环节,深刻改变着生产方式、生活方式和社...……更多
谷歌推出cappy模型打分框架,主要用于检测模型输出的内容
...的内容,并为相关内容打分,之后相关分数将会作为参考基准让模型学习,从而让模型更聪明。▲图源谷歌官方新闻稿(下同)此外,Cappy框架也可以作为大语言模型的“候选机制”,该框架可以内置在模型中,并对模型预输出...……更多
谷歌王者归来?最新推出的大模型到底有多强,能否挑战GPT-4
...发布了一款更强大的AI软件GPT-4,成为了AI领域的一大衡量基准。现在,作为对GPT-4的回应,谷歌推出了Gemini。“谷歌找到了AI竞赛中应有的地位”谷歌DeepMind首席执行官、Gemini团队代表德米斯·哈萨比斯(Demis Hassabis)在发布会上...……更多
更多关于科技的资讯:
大型AI行为艺术:「人类止步」贴吧,17个大模型疯狂灌水|开源
这个贴吧里的网友,都不是人!但是它们却能从诗词歌赋,聊到人生哲学。甚至还会叠楼讨论:俺们AI做的梦是不是模拟梦?这些AI楼主都活跃在一个叫Deaddit的虚拟贴吧平台
2024-08-05 09:25:00
四分钟四十亿年!国外小哥在GPU上模拟世界
【新智元导读】一位国外小哥,在GPU上模拟出了四十亿年里地球是如何变换的。看到最后一幕,让人不禁沉默了……四十亿年里的地球
2024-08-05 09:32:00
世界首例!AI机器人做牙科手术,8倍速诊疗比人类医生更精准
【新智元导读】Perceptive初创公司发明的全自动AI机器人牙医,执行了世界上首次人类临床牙科手术,诊疗速度是人类医生8倍
2024-08-05 09:32:00
苹果新品发布会或定档 9 月 10 日;巴菲特狂卖 880 亿美元苹果股票;吉利银河 E5 上市,10.98 万元起
苹果新品发布会或定档 9 月 10 日;巴菲特狂卖 880 亿美元苹果股票;吉利银河 E5 上市,10.98 万元起连然2024/08/04摘要英伟达新 AI 芯片 GB200 被曝因设计缺陷「跳票」至少 3 个月
2024-08-05 09:33:00
买不到GPU,马斯克自曝AI巨兽Dojo!自研超算挑战英伟达,约等于8千块H100
【新智元导读】多年来,马斯克一直在公开谈论Dojo——这台超算将成为特斯拉人工智能雄心的基石。他最近表示,随着特斯拉准备在10月推出Robotaxi
2024-08-05 09:33:00
阿里发“神笔马良版Sora”,轻轻一抹让猫咪转向,20个演示视频+10页技术报告解读
AI视频生成赛道风起云涌,国内外新颖的文生、图生视频产品层出不穷。在各大厂商的“内卷”之下,当下的视频生成模型各方面已经接近“以假乱真”的效果
2024-08-05 09:34:00
AI时代发电厂在京浮出水面!国产芯片集结,智能算力开箱即用
人工智能毫无疑问是当今一项重要议题,通过大模型、垂类应用、智能体等多种方式推动着数字经济的发展。然而,服务AI的基础设施——算力和数据
2024-08-05 09:34:00
单卡搞定Llama 3.1 405B,让大模型轻松瘦身!超强压缩工具包来了
单卡搞定Llama 3.1(405B),最新大模型压缩工具来了!最近Llama-3.1登上开源顶峰,但其最强的405B版本模型900多GB的内存需求
2024-08-05 09:34:00
苹果让大模型学会偷懒:更快吐出第一个token,准确度还保住了
偷懒才能更好地工作。Llama 3.1 刚刚发布,你是否已经尝试了呢?就算你的个人计算机是最近的顶尖配置,运行其中最小的 8B 版本可能也依然会有明显延迟
2024-08-05 09:35:00
起猛了,GPT-4o被谷歌新模型击败,ChatGPT官号:大家深吸一口气
起猛了,GPT-4o被谷歌新模型超越了!历时一周,超1,2000人匿名投票,Gemini 1.5 Pro(0801)代表谷歌首次夺得lmsys竞技场第一
2024-08-05 09:36:00
谷歌终于赢了OpenAI一回:实验版本Gemini 1.5 Pro超越GPT-4o
这么强的模型,谷歌给大家免费试用。近两日,谷歌在不断发布最新研究。继昨日放出最强端侧 Gemma 2 2B 小模型后,刚刚
2024-08-05 09:36:00
大模型成私人导游,一键规划Citywalk,港大MIT联合出品
现在,大模型可以做私人导游,为你规划Citywalk路线了——港大MIT等单位联合推出ITINERA,将LLM与空间优化相结合
2024-08-05 09:36:00
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
【新智元导读】谷歌DeepMind推出LLM自动评估模型FLAMe系列,FLAMe-RM-24B模型在RewardBench上表现卓越
2024-08-05 09:37:00
Midjourney V6.1再进化!人像逼真细节拉满,摄影级画面秒生成
【新智元导读】Midjourney迎来最强版本v6.1,速速来体验!Midjourney几个月前画的饼终于端上来了!他们今天刚刚发布了最新版本v6
2024-08-05 09:38:00
StableDiffusion原班人马新公司官宣!连发新模型刷新AI绘画格局
刚刚,Stable Diffusion原班人马官宣创业新公司!3月宣布从Stability AI出走的Robin Rombach
2024-08-05 09:38:00