评测结果,人工智能,上海,人工,实验室,评测头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...20日消息，上海人工智能实验室19日公布了首个AI高考全卷评测结果。据介绍，2024年全国高考甫一结束，该实验室旗下司南评测体系OpenCompass选取6个开源模型及GPT-4o进行高考“语数外”全卷能力测试。评测采用全国新课标I卷，参...……更多

2024-06-20 10:19:00评测结果,人工智能,上海,人工,实验室,评测

首个AI高考全卷评测结果发布：最高分303，数学全不及格

...能力测试。6月19日， OpenCompass发布了首个大模型高考全卷评测结果。语数外三科加起来的满分为420分，此次高考测试结果显示，阿里通义千问2-72B排名第一，为303分，OpenAI的GPT-4o排名第二，得分296分，上海人工智能实验室的书生...……更多

2024-06-24 09:22:00评测结果,最高分,评测,数学,高考,结果

首个AI高考全卷评测结果发布：数学全都不及格

6月19日，上海人工智能实验室发布首个AI高考全卷评测结果，月初开源的阿里通义千问大模型Qwen2-72B排名第一，在语数外三科420分的满分中获得303分，OpenAI的GPT-4o和上海人工智能实验室的书生·浦语2.0文曲星（InternLM2-20B-WQX）排...……更多

2024-06-20 11:10:00评测结果,全都,评测,数学,高考,结果

国内首个官方“大模型标准符合性评测”公布

...方公众号，在12月22日的全国信息技术标准化技术委员会人工智能分委会全体会议期间，国内首个官方“大模型标准符合性评测”结果公布，腾讯混元大模型、阿里通义千问等大模型成为首批通过评测的四款国产大模型的其中之...……更多

2023-12-23 15:09:00符合性,模型,评测,标准,官方,模型

智源评测体系发布国内外“百模”评估结果出炉

...140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测，分别从主观、客观两个维度考察了语言模型的简单理解、知识运用、推理能力、数学能力、代码能力、任务解决、安全与价值观七大能力；针对...……更多

2024-05-17 17:26:00评测,评估,体系,结果,模型,评测

国产AI芯片评测“智越计划”启动

...技术生态、产业生态和开放性等多个维度进行评估，确保评测结果客观真实。此次评测结果将形成针对特定应用场景的综合报告和产品推荐目录，为政府、企业和研究机构建设智算中心提供芯片选型的重要参考和决策依据。在评...……更多

2023-10-23 15:02:00芯片,评测,国产,芯片,评测,人工智能

“AI考生”闯关高考，谁是最会做题大模型？

...考语、数、外全卷能力测试。据OpenCompass于6月19日发布的评测结果，大模型的语文、英语考试水平还不错，但数学都不及格，最高分只有75分（满分150分）。参加OpenCompass此次高考测试的大模型，分别是来自阿里巴巴、零一万物、...……更多

2024-06-26 07:26:00考生,模型,高考,模型,评测,高考

用AI来做全国高考试卷，真的有人试了！结果：成绩偏科很严重

...代替学生去高考，会怎么样？欸，还真的有人试了。上海人工智能实验室近日公布了司南评测体系OpenCompass选取开源大模型测试今年高考的全国新课标I卷“语数外”的结果，为了确保“闭卷”考试，大模型的开源时间早于高考，...……更多

2024-06-26 22:29:00试卷,成绩,高考,结果,全国,模型

当技术越来越智能，我们如何守护安全？

...数字取证、异常检测技术的关注，到最近3年又扩展到了人工智能、深度学习和隐私保护的相关的技术上。“随着人工智能的发展，我们已经很重视相关的安全问题，比如像人工智能算法可能会在对抗攻击的情况下被误导。”清...……更多

2023-11-09 23:33:00越来,越来越,智能,安全,技术,人工智能

大模型像“文科生”？业内人士在沪“论战”

...型自我学习和迭代能力还不足，计算效率还不高。不管是人工智能整体发展，还是大模型具体“升级”，业内人士适逢人工智能时代，看到的希望重重，遇到的挑战也重重。另外，在罗璇看来，人工智能的未来总体方向是通用的...……更多

2024-04-15 22:01:00文科生,文科,业内人士,模型,业内,人士

人工智能的偏见——基于全球大语言模型情商与智商偏见测试

...及百川模型。本次测试提供了一个有趣的视角来观察当前人工智能大模型的发展状况。偏见测试结果得分以绝对值形式呈现，旨在凸显不同大语言模型在性别视角下处理问题的偏见程度，也揭示了它们在不同领域的优势和不足。...……更多

2024-01-04 13:54:00偏见,人工智能,情商,智商,人工,模型

中关村科金1+N新品系列亮相，为企业打造大模型强人工智能应用

本文转自：新华网作为人工智能领域最重要的突破性进展之一，大模型正日益成为推动全球科技进步和经济增长的强劲动力。11月23日，在由中关村科金与中国信息通信研究院人工智能研究中心、人工智能关键技术和应用评测工...……更多

2023-11-24 09:56:00中关,中关村,人工智能,人工,模型,新品

“整活”保险业务，AI大模型哪家强？

...的AI大模型能否完美“适配”保险行业？10月10日发布的《人工智能大模型保险行业应用评测报告》（以下简称《报告》）便揭晓了答案。根据《报告》，10个主流大模型在知识问答领域表现普遍较好，在智能核保、智能理赔、话...……更多

2023-10-10 17:56:00模型,业务,模型,报告,应用,能力

昆仑万维发布开源13B高质量商用大模型领先Llama2和B

...社区发展提供最佳技术支持，降低大模型商业门槛，推动人工智能技术落地千行百业，为人工智能生态建设添砖加瓦，携手开源社区探索未知世界、创造美好未来。两大模型领先行业昆仑万维「天工」Skywork-13B系列包括两大模型...……更多

2023-10-30 15:35:00万维,昆仑,商用,高质量,模型,领先

AI潮起共筑数智之基

...0+项评测指标、200+项评测场景、100多万专属评测数据集，评测结果客观性跻身国内外主流基准第一阵营。依托自研大模型评测智能体，支持评测数据自学习、用例自编排、执行自适应，同比评测周期缩短90%以上，已服务政府部委...……更多

2024-05-25 07:21:00潮起,模型,中国,中国移动,移动,模态

AI大模型“国标”首批测试结果公布，人工智能成市场新焦点

...大模型首批通过测试。测试结果称，上述四款模型符合《人工智能大规模预训练模型第2部分：评测指标与方法》语言大模型的相关技术要求，通用性、智能性等维度达到国家相关标准。该测试由工信部中国电子技术标准化研究...……更多

2023-12-26 14:16:00人工智能,国标,人工,模型,结果,智能

中国信通院发布大模型安全基准测试报告 360智脑综合排名第一

...安全基准测试AI Safety Bench是中国信息通信研究院依托中国人工智能产业发展联盟(AIIA)安全治理委员会，联合17家单位发起的，秉持公平公正、产业应用和场景导向的原则，目标建立业内权威大模型安全中文基准测试体系。以提高...……更多

2024-04-10 20:16:00信通,基准,中国,模型,测试,报告

清华郑纬民院士：AI for Science的出现，让高性能

...玩笑说法，但实际上也是一种趋势。除此之外，他还谈到人工智能计算机设计的三大平衡性原则、AI基准设计四大目标以及如何通过并行方法加速大规模预训练模型。为了完整体现郑纬民院士的分享及思考，在不改变原意的基础...……更多

2023-01-11 05:00:00清华,院士,高性能,人工智能,模型,智能

中国电信人工智能研究院携手智源研究院推动开源社区发展

...。经过微调的对话模型进行了客观、自动化的能力评测，评测结果显示，总分上Tele-FLM完成了对GPT-3.5-Turbo的超越。在分项得分中，Tele-FLM在总共的11个分项中有十项达到或超过GPT-3.5-Turbo水平。仅今年，中国电信人工智能研究院便...……更多

2024-04-30 20:00:00研究院,中国电信,研究,人工智能,中国,人工

融资超25亿元，他们的目标和OpenAI很像

...大模型的元年不是2023年，而是2020年。因为2020年6月美国人工智能研究公司OpenAI发布了GPT-3（生成式预训练模型），曾被业界认为是当时的技术巅峰之作。 “2015年成立的OpenAI最开始是一家人工智能研究实验室，主要关注强化学习...……更多

2023-11-13 07:44:00融资,目标,张鹏,模型,技术,训练

华藏生态共创，为大模型商业变现注入活力

...展目标，引领全球通用大模型的成果落地与商业变现，为人工智能发展注入取之不尽、用之不竭的活力。以商业变现为核心，为何小i可以建成华藏生态？\"商业变现\"是华藏生态的核心所在。发布会上，小i集团董事局主席兼CEO袁...……更多

2023-10-27 11:56:00共创,模型,活力,生态,商业,生态

宏碁传奇Edge 16评测：搭载内置Ryzen AI引擎的锐

在这个万物互联的时代，人工智能早已渗透到各行各业，日常生活中接触的数码电子产品，几乎都实现了智能化，而作为重要生产力工具的PC，除了硬件性能上的提升，机身、屏幕的变化外，与AI人工智能似乎毫不相干，但这并...……更多

2023-10-11 15:58:00评测,引擎,传奇,处理器,处理,测试

国家大模型标准测试结果公布首批仅四家企业产品通过

...觉等多模态领域，旨在建立大模型标准符合性名录，引领人工智能产业健康有序发展。【来源：凤凰网科技】返回搜狐，查看更多责任编辑： ……更多

2023-12-23 15:02:00四家,产品通过,模型,结果,测试,标准

君迪报告：中国智能座舱功能日益丰富

...户体验是值得主机厂去尝试的新思路。此外，AIGC(生成式人工智能技术)进入车内，扩展智能座舱新场景： AIGC正在重塑我们与汽车的交互方式。AIGC技术在行程规划方面的应用具有革命性意义。通过综合分析用户的行为习惯、历史...……更多

2023-12-01 15:08:00座舱,中国,功能,智能,报告,座舱

智谱AI新一代基座大模型GLM-4在司南评测中跻身前列，位居

1月30日，上海人工智能实验室发布了大模型开源开放评测体系司南（OpenCompass 2.0），同时揭晓了2023年度大模型公开评测榜单，GPT-4 Turbo在各项评测中均获最佳表现，智谱AI新一代基座大模型GLM-4紧随其后，排名第二。上海人工智...……更多

2024-02-04 14:00:00司南,基座,前列,新一代,模型,评测

奥林匹克竞赛里选最聪明的AI：Claude-3.5-Sonn

...zhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com上海交通大学生成式人工智能实验室 (GAIR Lab) 的研究团队，主要研究方向是：大模型训练、对齐与评估。团队主页：https://plms.ai/AI技术日新月异，近来Anthropic公司最新发布……更多

2024-06-25 09:45:00奥林,奥林匹克,竞赛,模型,推理,能力