评测结果,人工智能,上海,人工,实验室,评测头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...20日消息，上海人工智能实验室19日公布了首个AI高考全卷评测结果。据介绍，2024年全国高考甫一结束，该实验室旗下司南评测体系OpenCompass选取6个开源模型及GPT-4o进行高考“语数外”全卷能力测试。评测采用全国新课标I卷，参...……更多

2024-06-20 10:19:00评测结果,人工智能,上海,人工,实验室,评测

首个AI高考全卷评测结果发布：最高分303，数学全不及格

...能力测试。6月19日， OpenCompass发布了首个大模型高考全卷评测结果。语数外三科加起来的满分为420分，此次高考测试结果显示，阿里通义千问2-72B排名第一，为303分，OpenAI的GPT-4o排名第二，得分296分，上海人工智能实验室的书生...……更多

2024-06-24 09:22:00评测结果,最高分,评测,数学,高考,结果

首个AI高考全卷评测结果发布：数学全都不及格

6月19日，上海人工智能实验室发布首个AI高考全卷评测结果，月初开源的阿里通义千问大模型Qwen2-72B排名第一，在语数外三科420分的满分中获得303分，OpenAI的GPT-4o和上海人工智能实验室的书生·浦语2.0文曲星（InternLM2-20B-WQX）排...……更多

2024-06-20 11:10:00评测结果,全都,评测,数学,高考,结果

国内首个官方“大模型标准符合性评测”公布

...方公众号，在12月22日的全国信息技术标准化技术委员会人工智能分委会全体会议期间，国内首个官方“大模型标准符合性评测”结果公布，腾讯混元大模型、阿里通义千问等大模型成为首批通过评测的四款国产大模型的其中之...……更多

2023-12-23 15:09:00符合性,模型,评测,标准,官方,模型

智源评测体系发布国内外“百模”评估结果出炉

...140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测，分别从主观、客观两个维度考察了语言模型的简单理解、知识运用、推理能力、数学能力、代码能力、任务解决、安全与价值观七大能力；针对...……更多

2024-05-17 17:26:00评测,评估,体系,结果,模型,评测

国产AI芯片评测“智越计划”启动

...技术生态、产业生态和开放性等多个维度进行评估，确保评测结果客观真实。此次评测结果将形成针对特定应用场景的综合报告和产品推荐目录，为政府、企业和研究机构建设智算中心提供芯片选型的重要参考和决策依据。在评...……更多

2023-10-23 15:02:00芯片,评测,国产,芯片,评测,人工智能

“AI考生”闯关高考，谁是最会做题大模型？

...考语、数、外全卷能力测试。据OpenCompass于6月19日发布的评测结果，大模型的语文、英语考试水平还不错，但数学都不及格，最高分只有75分（满分150分）。参加OpenCompass此次高考测试的大模型，分别是来自阿里巴巴、零一万物、...……更多

2024-06-26 07:26:00考生,模型,高考,模型,评测,高考

击败Gemini-1.5-Pro、GPT-4V，从容大模型多

...平台 OpenCompass 的多模态评测领域中取得重大进展。最新评测结果显示，云从科技的从容大模型在该体系中的平均得分为 65.5，这一成绩使得从容大模型跻身全球前三，超越了谷歌的 Gemini-1.5-Pro 和 GPT-4v，仅次于 GPT-4o（69.9）和 Clau...……更多

2024-06-29 09:36:00模态,从容,模型,能力,全球,模态

迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测

...或者联系报道。本文的主要作者来自上海交通大学和上海人工智能实验室智慧医疗联合团队，共同第一作者为上海交通大学博士生邱芃铖和吴超逸，共同通讯作者为上海交通大学人工智能学院王延峰教授和谢伟迪副教授，这是该...……更多

2024-09-30 09:51:00多语,大规,模型,语料,基准,大规模

用AI来做全国高考试卷，真的有人试了！结果：成绩偏科很严重

...代替学生去高考，会怎么样？欸，还真的有人试了。上海人工智能实验室近日公布了司南评测体系OpenCompass选取开源大模型测试今年高考的全国新课标I卷“语数外”的结果，为了确保“闭卷”考试，大模型的开源时间早于高考，...……更多

2024-06-26 22:29:00试卷,成绩,高考,结果,全国,模型

云从科技从容大模型荣登中国大模型第一梯队

...台OpenCompass的多模态评测领域中也取得了重大进展。最新评测结果显示，从容大模型在该体系中的平均得分为65.5，这一成绩使其跻身全球前三，超越了谷歌的Gemini-1.5-Pro和GPT-4v，仅次于GPT-4o（69.9）和Claude3.5-Sonnet（67.9）。在国内...……更多

2024-08-09 15:00:00模型,梯队,中国,从容,科技,模型

商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”

...了多任务、多模态的通用视觉评测基准，可以提供权威的评测结果，推动基于统一标准的公平和准确评测，加快通用视觉模型的产业化应用步伐。通过开源社区的建设，OpenGVLab帮助开发者显著降低通用视觉模型的开发门槛，用更...……更多

2023-03-15 13:30:00商汤,模态,书生,模型,任务,社区

媲美OpenAI事实性基准，这个中文评测集让o1-previ

...特定需求的模型。目前 o1-preview 模型表现最为全面，但是评测结果展示了许多其他模型在特定垂直领域的强有力的表现（具体详见论文和榜单）。最后，欢迎广大研究者使用我们的评测集进行实验和研究。淘天集团算法技术 - 未...……更多

2024-11-21 09:43:00事实性,基准,中文,评测,事实,模型

当技术越来越智能，我们如何守护安全？

...数字取证、异常检测技术的关注，到最近3年又扩展到了人工智能、深度学习和隐私保护的相关的技术上。“随着人工智能的发展，我们已经很重视相关的安全问题，比如像人工智能算法可能会在对抗攻击的情况下被误导。”清...……更多

2023-11-09 23:33:00越来,越来越,智能,安全,技术,人工智能

大模型像“文科生”？业内人士在沪“论战”

...型自我学习和迭代能力还不足，计算效率还不高。不管是人工智能整体发展，还是大模型具体“升级”，业内人士适逢人工智能时代，看到的希望重重，遇到的挑战也重重。另外，在罗璇看来，人工智能的未来总体方向是通用的...……更多

2024-04-15 22:01:00文科生,文科,业内人士,模型,业内,人士

云从科技：大模型五虎与AI智能体的领航者

...型的步伐。此外，在综合评测权威平台OpenCompass公布的评测结果显示，云从科技的从容大模型在该体系中的平均得分为65.5，这一成绩使得从容大模型跻身全球前三，超越了谷歌的Gemini-1.5-Pro和GPT-4v，仅次于GPT-4o（69.9）和Claude3.5-...……更多

2024-08-08 17:45:00五虎,领航,模型,智能,科技,智能

全模态对齐框架align-anything来啦：实现跨模态指

...目由北京大学对齐小组开发并进行长期维护，团队专注于人工智能系统的安全交互与价值对齐，指导老师为北京大学人工智能研究院杨耀东助理教授。核心成员包括吉嘉铭、周嘉懿、邱天异、陈博远、王恺乐、洪东海、楼翰涛、...……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据

人工智能的偏见——基于全球大语言模型情商与智商偏见测试

...及百川模型。本次测试提供了一个有趣的视角来观察当前人工智能大模型的发展状况。偏见测试结果得分以绝对值形式呈现，旨在凸显不同大语言模型在性别视角下处理问题的偏见程度，也揭示了它们在不同领域的优势和不足。...……更多

2024-01-04 13:54:00偏见,人工智能,情商,智商,人工,模型

中关村科金1+N新品系列亮相，为企业打造大模型强人工智能应用

本文转自：新华网作为人工智能领域最重要的突破性进展之一，大模型正日益成为推动全球科技进步和经济增长的强劲动力。11月23日，在由中关村科金与中国信息通信研究院人工智能研究中心、人工智能关键技术和应用评测工...……更多

2023-11-24 09:56:00中关,中关村,人工智能,人工,模型,新品

“整活”保险业务，AI大模型哪家强？

...的AI大模型能否完美“适配”保险行业？10月10日发布的《人工智能大模型保险行业应用评测报告》（以下简称《报告》）便揭晓了答案。根据《报告》，10个主流大模型在知识问答领域表现普遍较好，在智能核保、智能理赔、话...……更多

2023-10-10 17:56:00模型,业务,模型,报告,应用,能力

昆仑万维发布开源13B高质量商用大模型领先Llama2和B

...社区发展提供最佳技术支持，降低大模型商业门槛，推动人工智能技术落地千行百业，为人工智能生态建设添砖加瓦，携手开源社区探索未知世界、创造美好未来。两大模型领先行业昆仑万维「天工」Skywork-13B系列包括两大模型...……更多

2023-10-30 15:35:00万维,昆仑,商用,高质量,模型,领先

AI安全守护计划启动！信通院牵头，AIIA安全治理委员会发布

...情况，并启动了AI安全守护计划，发布了三大类别的安全评测结果。AIIA安全治理委员会成立于2023年12月底，经过半年运营，现有治理组、安全组两个工作组，近百家单位加入，主任单位由中国信通院牵头，副主任单位包括多家知...……更多

2024-07-25 09:26:00安全,信通,模型,评测,委员会,委员

AI潮起共筑数智之基

...0+项评测指标、200+项评测场景、100多万专属评测数据集，评测结果客观性跻身国内外主流基准第一阵营。依托自研大模型评测智能体，支持评测数据自学习、用例自编排、执行自适应，同比评测周期缩短90%以上，已服务政府部委...……更多

2024-05-25 07:21:00潮起,模型,中国,中国移动,移动,模态

AI大模型“国标”首批测试结果公布，人工智能成市场新焦点

...大模型首批通过测试。测试结果称，上述四款模型符合《人工智能大规模预训练模型第2部分：评测指标与方法》语言大模型的相关技术要求，通用性、智能性等维度达到国家相关标准。该测试由工信部中国电子技术标准化研究...……更多

2023-12-26 14:16:00人工智能,国标,人工,模型,结果,智能

科大讯飞刘庆峰：讯飞星火大模型10月底整体赶超ChatGPT

...回答，引发掌声不断。刘庆峰表示，认知大模型成为通用人工智能的曙光，科大讯飞有信心实现“智能涌现”。当前讯飞星火认知大模型已经在文本生成、知识问答、数学能力三大能力上已超ChatGPT。他进一步公布大模型年内三...……更多

2023-05-08 13:43:00讯飞,星火,模型,整体,讯飞,星火

Bengio团队提出多模态新基准，直指Claude 3.5和

...一致时，就会推翻 “假设”，重新尝试新的假设。人类评测结果人类在 VCR 任务下的水平如何呢？下图中展示了母语者或各语言的流利使用者在英 / 中两种语言的简单 / 困难设定下的准确度：如果考虑包含时间、地名、人名的...……更多

2024-06-29 09:37:00模态,基准,弱点,团队,模型,任务

中国信通院发布大模型安全基准测试报告 360智脑综合排名第一

...安全基准测试AI Safety Bench是中国信息通信研究院依托中国人工智能产业发展联盟(AIIA)安全治理委员会，联合17家单位发起的，秉持公平公正、产业应用和场景导向的原则，目标建立业内权威大模型安全中文基准测试体系。以提高...……更多

2024-04-10 20:16:00信通,基准,中国,模型,测试,报告

清华郑纬民院士：AI for Science的出现，让高性能

...玩笑说法，但实际上也是一种趋势。除此之外，他还谈到人工智能计算机设计的三大平衡性原则、AI基准设计四大目标以及如何通过并行方法加速大规模预训练模型。为了完整体现郑纬民院士的分享及思考，在不改变原意的基础...……更多

2023-01-11 05:00:00清华,院士,高性能,人工智能,模型,智能

中国电信人工智能研究院携手智源研究院推动开源社区发展

...。经过微调的对话模型进行了客观、自动化的能力评测，评测结果显示，总分上Tele-FLM完成了对GPT-3.5-Turbo的超越。在分项得分中，Tele-FLM在总共的11个分项中有十项达到或超过GPT-3.5-Turbo水平。仅今年，中国电信人工智能研究院便...……更多

2024-04-30 20:00:00研究院,中国电信,研究,人工智能,中国,人工

中科大/华为诺亚出手！芯片性能≠布局评分，EDA设计框架全面

...专家先验知识。因此，许多设计自动化方法，尤其是基于人工智能的算法，被开发出来以实现这一过程的自动化。然而，由于芯片设计的工作流程较长，对这些算法的评估通常集中在易于计算的中间代理指标上（例如半周长线...……更多

2024-08-13 09:40:00诺亚,华为,布局,框架,芯片,评分

page 1/3334 首页上一页 12 3 4 5 6 下一页末页

更多关于科技的资讯：

华为：12月新品多款代号曝光，两款新手机还有入门平板

我要与大家分享的，是根据@看山的叔叔最新爆料的华为的消息——12月，华为将有多款新品亮相，其中包括两款新手机和一款入门平板

2024-12-10 10:21:00

华为专属“微泵液冷”手机壳：视窗显示，智能温控，售价不便宜

今天，12月4日，不仅华为Mate70系列四款新机开售！还有华为 Mate70/X6系列微泵液冷手机壳今日10:08也正式开售

2024-12-10 10:21:00

X表示其新的图像生成器Aurora将在一周内面向所有用户推出

X 是埃隆-马斯克（Elon Musk）旗下的社交网络，其前身是 Twitter，上周六悄然在其Grok 助手中添加了一个新的图片生成器

2024-12-10 13:32:00

Windows 11 任务栏系统托盘新增功能提醒插入符号与

您知道 Windows 11 有一项功能可让您在任何文本字段中插入表情符号吗？事实上，该功能在某些游戏中也能使用。您可以使用键盘快捷键（Win +"

2024-12-10 13:33:00

OpenAI正式推出AI视频生成模型Sora：ChatGPT

快科技12月10日消息，在首次公布10个月之后，OpenAI宣布正式向用户开放人工智能(AI)视频生成模型版本Sora

2024-12-10 13:35:00

共赴照明科技盛宴洞悉行业趋势

□ 本报记者王薛淄随着科技与设计的深度融合，照明行业正迎来前所未有的变革与机遇。中国照明电器协会与上海博华国际展览有限公司强强联手

2024-12-10 10:49:00

跨境电商南京交流会共探品牌出海新航迹

江南时报讯 12月7日，“跨境电商三城高峰论坛暨沿海实战跨境大咖讲堂”于南京市玄武区盛大举行。玄武区副区长唐承武、商务局局长吕梦旦

2024-12-10 10:51:00

青花汾酒开启高品质生活

本文转自：人民日报1998年，青花汾酒30正式上市，至今年已是第26年。近日，汾酒集团正式宣布全球首发“青花汾酒26·复兴”

2024-12-10 11:09:00

蚂蚁集团官宣总裁韩歆毅将接任CEO 曾任国泰财险董事长

12月8日，蚂蚁集团董事长兼CEO井贤栋通过全员信宣布，总裁韩歆毅将从2025年3月1日起正式接任蚂蚁集团CEO一职，全面负责蚂蚁的各项业务及日常管理工作

2024-12-10 11:12:00

小米YU7来了，车身“证件照”亮相！网友：颜值不如SU7？

12月9日晚，小米汽车官方微博发布称，介绍小米汽车的新成员：小米YU7，这款SUV新车，预计于明年六七月正式上市。微博还配上了新车的前后照片

2024-12-10 11:13:00

小米汽车精英驾驶培训正式上线！9999元/人买车免费送

快科技12月10日消息，小米汽车今日宣布，旗下的小米精英驾驶培训课程正式上线。据悉，此次活动时间定于12月16日至12月27日

2024-12-10 11:13:00

树莓派推出Raspberry Pi 500键盘PC：内置四核

快科技12月10日消息，树莓派最近提出了Raspberry Pi 500一体式键盘PC，与一体机之间就差一个屏幕，定价90美元（约合人民币655元）

2024-12-10 11:13:00

涉嫌违反中国反垄断法被调查！英伟达回应：乐意回答监管机构任何

快科技12月10日消息，日前国家市场监督管理总局发布消息称，因英伟达公司涉嫌违反《中华人民共和国反垄断法》及相关审查决定公告

2024-12-10 11:13:00

尊界S800核心参数曝光：增程版配63度高能电池、纯电331

快科技12月10日消息，由华为和江淮打造的百万级豪华D+级轿车尊界S800登上工信部申报名录，该车将提供纯电和增程两种动力版本

2024-12-10 11:13:00

小米YU7商标被一公司抢注！对方申请多枚SU7商标

12月9日晚，小米汽车在官方微博上宣布：其第二款新车——小米YU7预计将在明年六七月正式与大家见面。不过，“小米YU7”这个商标已经被抢先注册了

2024-12-10 11:13:00

头条订阅服务