评测结果,人工智能,上海,人工,实验室,评测头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...20日消息，上海人工智能实验室19日公布了首个AI高考全卷评测结果。据介绍，2024年全国高考甫一结束，该实验室旗下司南评测体系OpenCompass选取6个开源模型及GPT-4o进行高考“语数外”全卷能力测试。评测采用全国新课标I卷，参...……更多

2024-06-20 10:19:00评测结果,人工智能,上海,人工,实验室,评测

首个AI高考全卷评测结果发布：最高分303，数学全不及格

...能力测试。6月19日， OpenCompass发布了首个大模型高考全卷评测结果。语数外三科加起来的满分为420分，此次高考测试结果显示，阿里通义千问2-72B排名第一，为303分，OpenAI的GPT-4o排名第二，得分296分，上海人工智能实验室的书生...……更多

2024-06-24 09:22:00评测结果,最高分,评测,数学,高考,结果

首个AI高考全卷评测结果发布：数学全都不及格

6月19日，上海人工智能实验室发布首个AI高考全卷评测结果，月初开源的阿里通义千问大模型Qwen2-72B排名第一，在语数外三科420分的满分中获得303分，OpenAI的GPT-4o和上海人工智能实验室的书生·浦语2.0文曲星（InternLM2-20B-WQX）排...……更多

2024-06-20 11:10:00评测结果,全都,评测,数学,高考,结果

国内首个官方“大模型标准符合性评测”公布

...方公众号，在12月22日的全国信息技术标准化技术委员会人工智能分委会全体会议期间，国内首个官方“大模型标准符合性评测”结果公布，腾讯混元大模型、阿里通义千问等大模型成为首批通过评测的四款国产大模型的其中之...……更多

2023-12-23 15:09:00符合性,模型,评测,标准,官方,模型

智源评测体系发布国内外“百模”评估结果出炉

...140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测，分别从主观、客观两个维度考察了语言模型的简单理解、知识运用、推理能力、数学能力、代码能力、任务解决、安全与价值观七大能力；针对...……更多

2024-05-17 17:26:00评测,评估,体系,结果,模型,评测

国产AI芯片评测“智越计划”启动

...技术生态、产业生态和开放性等多个维度进行评估，确保评测结果客观真实。此次评测结果将形成针对特定应用场景的综合报告和产品推荐目录，为政府、企业和研究机构建设智算中心提供芯片选型的重要参考和决策依据。在评...……更多

2023-10-23 15:02:00芯片,评测,国产,芯片,评测,人工智能

“AI考生”闯关高考，谁是最会做题大模型？

...考语、数、外全卷能力测试。据OpenCompass于6月19日发布的评测结果，大模型的语文、英语考试水平还不错，但数学都不及格，最高分只有75分（满分150分）。参加OpenCompass此次高考测试的大模型，分别是来自阿里巴巴、零一万物、...……更多

2024-06-26 07:26:00考生,模型,高考,模型,评测,高考

击败Gemini-1.5-Pro、GPT-4V，从容大模型多

...平台 OpenCompass 的多模态评测领域中取得重大进展。最新评测结果显示，云从科技的从容大模型在该体系中的平均得分为 65.5，这一成绩使得从容大模型跻身全球前三，超越了谷歌的 Gemini-1.5-Pro 和 GPT-4v，仅次于 GPT-4o（69.9）和 Clau...……更多

2024-06-29 09:36:00模态,从容,模型,能力,全球,模态

迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测

...或者联系报道。本文的主要作者来自上海交通大学和上海人工智能实验室智慧医疗联合团队，共同第一作者为上海交通大学博士生邱芃铖和吴超逸，共同通讯作者为上海交通大学人工智能学院王延峰教授和谢伟迪副教授，这是该...……更多

2024-09-30 09:51:00多语,大规,模型,语料,基准,大规模

用AI来做全国高考试卷，真的有人试了！结果：成绩偏科很严重

...代替学生去高考，会怎么样？欸，还真的有人试了。上海人工智能实验室近日公布了司南评测体系OpenCompass选取开源大模型测试今年高考的全国新课标I卷“语数外”的结果，为了确保“闭卷”考试，大模型的开源时间早于高考，...……更多

2024-06-26 22:29:00试卷,成绩,高考,结果,全国,模型

云从科技从容大模型荣登中国大模型第一梯队

...台OpenCompass的多模态评测领域中也取得了重大进展。最新评测结果显示，从容大模型在该体系中的平均得分为65.5，这一成绩使其跻身全球前三，超越了谷歌的Gemini-1.5-Pro和GPT-4v，仅次于GPT-4o（69.9）和Claude3.5-Sonnet（67.9）。在国内...……更多

2024-08-09 15:00:00模型,梯队,中国,从容,科技,模型

媲美OpenAI事实性基准，这个中文评测集让o1-previ

...特定需求的模型。目前 o1-preview 模型表现最为全面，但是评测结果展示了许多其他模型在特定垂直领域的强有力的表现（具体详见论文和榜单）。最后，欢迎广大研究者使用我们的评测集进行实验和研究。淘天集团算法技术 - 未...……更多

2024-11-21 09:43:00事实性,基准,中文,评测,事实,模型

当技术越来越智能，我们如何守护安全？

...数字取证、异常检测技术的关注，到最近3年又扩展到了人工智能、深度学习和隐私保护的相关的技术上。“随着人工智能的发展，我们已经很重视相关的安全问题，比如像人工智能算法可能会在对抗攻击的情况下被误导。”清...……更多

2023-11-09 23:33:00越来,越来越,智能,安全,技术,人工智能

大模型像“文科生”？业内人士在沪“论战”

...型自我学习和迭代能力还不足，计算效率还不高。不管是人工智能整体发展，还是大模型具体“升级”，业内人士适逢人工智能时代，看到的希望重重，遇到的挑战也重重。另外，在罗璇看来，人工智能的未来总体方向是通用的...……更多

2024-04-15 22:01:00文科生,文科,业内人士,模型,业内,人士

云从科技：大模型五虎与AI智能体的领航者

...型的步伐。此外，在综合评测权威平台OpenCompass公布的评测结果显示，云从科技的从容大模型在该体系中的平均得分为65.5，这一成绩使得从容大模型跻身全球前三，超越了谷歌的Gemini-1.5-Pro和GPT-4v，仅次于GPT-4o（69.9）和Claude3.5-...……更多

2024-08-08 17:45:00五虎,领航,模型,智能,科技,智能

全模态对齐框架align-anything来啦：实现跨模态指

...目由北京大学对齐小组开发并进行长期维护，团队专注于人工智能系统的安全交互与价值对齐，指导老师为北京大学人工智能研究院杨耀东助理教授。核心成员包括吉嘉铭、周嘉懿、邱天异、陈博远、王恺乐、洪东海、楼翰涛、...……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据

人工智能的偏见——基于全球大语言模型情商与智商偏见测试

...及百川模型。本次测试提供了一个有趣的视角来观察当前人工智能大模型的发展状况。偏见测试结果得分以绝对值形式呈现，旨在凸显不同大语言模型在性别视角下处理问题的偏见程度，也揭示了它们在不同领域的优势和不足。...……更多

2024-01-04 13:54:00偏见,人工智能,情商,智商,人工,模型

中关村科金1+N新品系列亮相，为企业打造大模型强人工智能应用

本文转自：新华网作为人工智能领域最重要的突破性进展之一，大模型正日益成为推动全球科技进步和经济增长的强劲动力。11月23日，在由中关村科金与中国信息通信研究院人工智能研究中心、人工智能关键技术和应用评测工...……更多

2023-11-24 09:56:00中关,中关村,人工智能,人工,模型,新品

“整活”保险业务，AI大模型哪家强？

...的AI大模型能否完美“适配”保险行业？10月10日发布的《人工智能大模型保险行业应用评测报告》（以下简称《报告》）便揭晓了答案。根据《报告》，10个主流大模型在知识问答领域表现普遍较好，在智能核保、智能理赔、话...……更多

2023-10-10 17:56:00模型,业务,模型,报告,应用,能力

昆仑万维发布开源13B高质量商用大模型领先Llama2和B

...社区发展提供最佳技术支持，降低大模型商业门槛，推动人工智能技术落地千行百业，为人工智能生态建设添砖加瓦，携手开源社区探索未知世界、创造美好未来。两大模型领先行业昆仑万维「天工」Skywork-13B系列包括两大模型...……更多

2023-10-30 15:35:00万维,昆仑,商用,高质量,模型,领先

AI安全守护计划启动！信通院牵头，AIIA安全治理委员会发布

...情况，并启动了AI安全守护计划，发布了三大类别的安全评测结果。AIIA安全治理委员会成立于2023年12月底，经过半年运营，现有治理组、安全组两个工作组，近百家单位加入，主任单位由中国信通院牵头，副主任单位包括多家知...……更多

2024-07-25 09:26:00安全,信通,模型,评测,委员会,委员

AI潮起共筑数智之基

...0+项评测指标、200+项评测场景、100多万专属评测数据集，评测结果客观性跻身国内外主流基准第一阵营。依托自研大模型评测智能体，支持评测数据自学习、用例自编排、执行自适应，同比评测周期缩短90%以上，已服务政府部委...……更多

2024-05-25 07:21:00潮起,模型,中国,中国移动,移动,模态

AI大模型“国标”首批测试结果公布，人工智能成市场新焦点

...大模型首批通过测试。测试结果称，上述四款模型符合《人工智能大规模预训练模型第2部分：评测指标与方法》语言大模型的相关技术要求，通用性、智能性等维度达到国家相关标准。该测试由工信部中国电子技术标准化研究...……更多

2023-12-26 14:16:00人工智能,国标,人工,模型,结果,智能

Bengio团队提出多模态新基准，直指Claude 3.5和

...一致时，就会推翻 “假设”，重新尝试新的假设。人类评测结果人类在 VCR 任务下的水平如何呢？下图中展示了母语者或各语言的流利使用者在英 / 中两种语言的简单 / 困难设定下的准确度：如果考虑包含时间、地名、人名的...……更多

2024-06-29 09:37:00模态,基准,弱点,团队,模型,任务

中国信通院发布大模型安全基准测试报告 360智脑综合排名第一

...安全基准测试AI Safety Bench是中国信息通信研究院依托中国人工智能产业发展联盟(AIIA)安全治理委员会，联合17家单位发起的，秉持公平公正、产业应用和场景导向的原则，目标建立业内权威大模型安全中文基准测试体系。以提高...……更多

2024-04-10 20:16:00信通,基准,中国,模型,测试,报告

清华郑纬民院士：AI for Science的出现，让高性能

...玩笑说法，但实际上也是一种趋势。除此之外，他还谈到人工智能计算机设计的三大平衡性原则、AI基准设计四大目标以及如何通过并行方法加速大规模预训练模型。为了完整体现郑纬民院士的分享及思考，在不改变原意的基础...……更多

2023-01-11 05:00:00清华,院士,高性能,人工智能,模型,智能

中国电信人工智能研究院携手智源研究院推动开源社区发展

...。经过微调的对话模型进行了客观、自动化的能力评测，评测结果显示，总分上Tele-FLM完成了对GPT-3.5-Turbo的超越。在分项得分中，Tele-FLM在总共的11个分项中有十项达到或超过GPT-3.5-Turbo水平。仅今年，中国电信人工智能研究院便...……更多

2024-04-30 20:00:00研究院,中国电信,研究,人工智能,中国,人工

中科大/华为诺亚出手！芯片性能≠布局评分，EDA设计框架全面

...专家先验知识。因此，许多设计自动化方法，尤其是基于人工智能的算法，被开发出来以实现这一过程的自动化。然而，由于芯片设计的工作流程较长，对这些算法的评估通常集中在易于计算的中间代理指标上（例如半周长线...……更多

2024-08-13 09:40:00诺亚,华为,布局,框架,芯片,评分

融资超25亿元，他们的目标和OpenAI很像

...大模型的元年不是2023年，而是2020年。因为2020年6月美国人工智能研究公司OpenAI发布了GPT-3（生成式预训练模型），曾被业界认为是当时的技术巅峰之作。 “2015年成立的OpenAI最开始是一家人工智能研究实验室，主要关注强化学习...……更多

2023-11-13 07:44:00融资,目标,张鹏,模型,技术,训练

“天文知识能力最强”的大语言模型来了

...领域中的未知问题，加速天文发现。“传统天文研究亟需人工智能技术赋能，以突破天文数据处理困境。”国家天文台台长、党委副书记刘继峰说，“天文学界常说‘以天之语，解物之道’，但‘天籁之声’非常嘈杂，信息量巨...……更多

2024-11-03 11:12:00知识能力,天文,模型,能力,语言,知识

page 1/1334 首页上一页 12 3 4 5 6 下一页末页

更多关于科技的资讯：

浙大研制出可穿戴变脸面具：一张面具无痕切换8种不同脸型

快科技3月10日消息，浙江大学发文称，该校机械工程学院邹俊教授课题组研制出一种可穿戴的变脸面具。这种面具实现了一张面具在多个相貌之间的无痕切换

2025-03-10 14:47:00

国产机器狗宇树Go1新技能：靠自己蹬腿滑滑板

快科技3月10日消息，据报道，密歇根大学与南方科技大学的联合研究团队近日取得突破，通过混合自主学习技术，成功让宇树Go1机器狗掌握了蹬腿滑滑板的技能

2025-03-10 14:47:00

21.7特斯拉！米哈游投资的能量奇点创高温超导磁体新纪录

快科技3月10日消息，今日，能量奇点宣布其在高温超导磁体领域取得重大突破。能量奇点自主研制的大孔径强场磁体——经天磁体成功完成了首轮通流实验

2025-03-10 14:47:00

华为nova13 Pro影像评测：氛围感照片制造机

一、前言：在当下，记录生活已经成为人们日常生活的一部分。尤其是情侣间，用镜头定格那些甜蜜的瞬间，不仅是一种记录，更是一种表达情感的方式

2025-03-10 14:47:00

聚力谋新篇｜胡望明委员：让人工智能重新定义钢铁行业

本文转自：人民网-上海频道人民网记者唐小丽“智能化对钢铁行业而言，无疑是一次革命性的机遇，它不仅标志着技术上的革新，更是推动行业迈向高质量发展的关键力量

2025-03-10 14:49:00

国家超算互联网平台接入阿里千问大模型

3月10日消息，国家超算互联网平台接入阿里巴巴通义千问大模型，对外提供千问QwQ-32B API 服务，用户可免费获得100万tokens

2025-03-10 14:54:00

高天试验设备｜冷热冲击试验箱的内部组成部件

当我们对产品进行冷热试验时，会需要用到冷热冲击试验箱。冷热冲击试验箱是一种常用的实验设备，主要是用于测试材料结构或复合材料

2025-03-10 15:00:00

南京试剂：春日健行，共赴自然之约

“等闲识得东风面，万紫千红总是春”。为关爱员工身心健康，倡导绿色生活理念，在第115个国际妇女节这个美好日子里，南京试剂以“相约春天

2025-03-10 15:01:00

高天试验设备｜高低温冲击试验箱和高低温试验箱有什么区别？

高低温冲击试验箱是一种精密仪器设备，主要是用来测试金属、塑料、橡胶、电子等材料在瞬间高温及低温情况下的性能稳定性。而高低温试验箱主要通过控制高温

2025-03-10 15:02:00

科技赋能消费新体验，机器人亮相下沙奥特莱斯

在消费升级与科技发展的时代背景下，科技元素正以前所未有的速度渗透到人们生活的各个领域，从日常出行到休闲娱乐，科技变革随处可见

2025-03-10 15:03:00

高天试验设备｜操作高低温冲击试验箱的基本步骤

高低温冲击试验箱是一种精密仪器设备，主要用来测试金属、塑料、橡胶、电子等材料在瞬间高温及低温情况下的性能稳定性。不过高低温冲击试验箱作为一项关键的产品质量检测工具

2025-03-10 15:03:00

罗永浩发微博招人！疑布局人工智能操作系统与AI手机市场

3月10日，罗永浩通过其个人微博发布招聘信息，其AR创业公司细红线科技（Thin Red Line）2025年春季招聘启动

2025-03-10 15:04:00

你达标了吗智联报告：2025年职场女性平均月薪8978元

快科技3月10日消息，近日，智联招聘发布的《2025中国女性职场现状调查报告》显示，2025年职场女性平均月薪8978元

2025-03-10 15:17:00

美媒急了：为啥小米能造车3年就成功苹果用了10年研究却不行

快科技3月10日消息，近日美国权威媒体《纽约时报》发文，对小米汽车的成功表示赞赏。文章指出，中国电子产品巨头小米在短短三年内成功推出了首款电动汽车SU7

2025-03-10 15:17:00

宇树机器人加速全球市场扩张：入驻阿里跨境平台

快科技3月10日消息，据媒体报道，近日，在今年春晚舞台上一战成名的宇树科技，已在阿里跨境电商平台速卖通开设官方店铺，并上架了多款商品

2025-03-10 15:17:00

头条订阅服务