模型,自查,工作,评估,模型,人工头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

Meta发布新AI模型：可自查和审查其他AI模型工作

...期由其研究部门宣布推出了一系列创新的人工智能（AI）模型，其中尤为引人注目的是一款具有划时代意义的自学评估器。这款工具旨在大幅减少AI系统开发过程中对人类参与的依赖。这款自学评估器采用了先进的思维链技术，...……更多

2024-10-21 09:52:00模型,自查,工作,评估,模型,人工

全球AI安全评估测试有了新基准

本文转自：科技日报大模型安全领域两项国际标准发布全球AI安全评估测试有了新基准随着人工智能系统，特别是大语言模型成为社会各方面不可或缺的一部分，以一个全面的标准来解决它们的安全挑战变得至关重要。◎本报记...……更多

2024-04-25 04:00:00基准,评估,测试,安全,全球,人工智能

欧盟拟分三级监管生成式人工智能，模型越强大规则越严

第一级将包括所有基础模型；第二级针对“非常强大”的基础模型，将通过用于训练其大型语言模型的算力来区分；第三级被称为大规模通用目的人工智能系统，将包括最流行的人工智能工具，并以用户总数来衡量。欧盟正在...……更多

2023-10-18 17:03:00人工智能,监管,人工,生成,模型,规则

清华领衔发布多模态评估MultiTrust：GPT-4可信度

...专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型（MLLMs）因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手，还逐渐渗透到自动驾驶、医学诊断等各大应用领域，掀...……更多

2024-07-25 09:31:00模态,清华,可信度,领衔,可信,几何

深度剖析：谷歌、微软等AI巨头承诺的“自愿监管”做到了吗？

...达到最泡沫”之际做出的，各家公司都在竞相推出自己的模型，并使其比竞争对手的模型更大、更好。与此同时，我们也开始看到围绕版权和深度伪造等问题的争论。Geoffrey Hinton 等有影响力的科技人士组成的游说团也提出了人...……更多

2024-07-25 14:30:00微软,巨头,剖析,监管,深度,人工智能

迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测

...这是该团队在继 PMC-LLaMA 后，在持续构建开源医疗语言大模型的最新进展。该项目受到科创 2030—“新一代人工智能” 重大项目支持。在医疗领域中，大语言模型已经有了广泛的研究。然而，这些进展主要依赖于英语的基座模型...……更多

2024-09-30 09:51:00多语,大规,模型,语料,基准,大规模

国际组织WDTA首次就大模型安全发布国际标准，蚂蚁集团、Op

...，包括《生成式人工智能应用安全测试标准》和《大语言模型安全测试方法》两项国际标准。这是国际组织首次就大模型安全领域发布国际标准，代表全球人工智能安全评估和测试进入新的基准。据了解，这两项国际标准是由Ope...……更多

2024-04-17 13:40:00讯飞,国际,国际组织,国际标准,蚂蚁,模型

史上最严中文真实性评估：OpenAI o1第1豆包第2，其它

新的大语言模型（LLM）评估基准对于跟上大语言模型的快速发展至关重要。近日，淘宝天猫集团的研究者们提出了中文简短问答（Chinese SimpleQA），这是首个全面的中文基准，具有“中文、多样性、高质量、静态、易于评估”五...……更多

2024-11-22 09:51:00豆包,中文,真实性,评估,模型,中文

下载次数破39万！CMU、Meta联合发布VQAScore文

【新智元导读】VQAScore是一个利用视觉问答模型来评估由文本提示生成的图像质量的新方法；GenAI-Bench是一个包含复杂文本提示的基准测试集，用于挑战和提升现有的图像生成模型。两个工具可以帮助研究人员自动评估AI模型的...……更多

2024-11-07 09:53:00文生,次数,联合,方案,模型,文生

2023 AI现状报告：GPT-4仍最强，监管方向缺乏全球共

...越来越困难。由于基准变得不那么明确，用于评估大语言模型的“基于氛围”的方法在业界越来越普遍。·人工智能安全在2023年首次占据舞台中心。但人工智能界内部存在深刻分歧，世界各国政府采取的做法相互矛盾。挑战性在...……更多

2023-10-12 15:21:00共识,监管,现状,方向,报告,全球

空间智能版ImageNet来了！李飞飞吴佳俊团队出品

...斯坦福李飞飞吴佳俊团队！HourVideo，一个用于评估多模态模型对长达一小时视频理解能力的基准数据集，包含多种任务。通过与现有模型对比，揭示当前模型在长视频理解上与人类水平的差距。2009年，李飞飞团队在CVPR上首次对...……更多

2024-11-11 13:31:00团队,智能,空间,视频,模态,模型

智能澎湃！浩鲸科技再次登榜 “人工智能领军企业”

ChatGPT引爆2023，基于AI大模型的创新产品及应用竞相涌现。近日，国内AI专业科技媒体机器之心重磅揭晓了「AI 中国」2023 年度榜单，浩鲸科技凭借在AI、算法、算力方面的前瞻性探索和长期深耕，通过在行业大模型的优异实践，...……更多

2024-01-03 14:00:00智能,人工智能,人工,再次,科技,企业

以人工智能助力涉外法治建设

...检察机关主动将分析式、生成式人工智能技术应用到监督模型创建、案件线索挖掘、法律（案例）检索、文书自动生成等方面，全方位推进数字检察战略，助力提升法律监督质效。一是创建大语言平台应用，深挖模型监督点。将...……更多

2024-06-03 02:34:00人工智能,涉外,法治,人工,智能,建设

商汤联合发布白皮书，首次提出新一代AI基础设施评估体系

...AI基础设施成为AI2.0时代“新基建”数据显示,过去四年,大模型参数量以年均400%复合增长,AI算力需求增长超过15万倍,远超摩尔定律。以CPU为中心的传统计算基础设施已无法满足大模型、生成式AI的新要求。大模型训练对数据质量和...……更多

2024-01-02 21:30:00商汤,白皮,白皮书,基础设施,新一代,评估

数字安全研讨会举行人工智能治理模型如何“可信赖”？

...应对这些风险，毕马威中国提出“可信赖的人工智能治理模型”。该模型旨在通过公平性、透明性、可解释性、隐私保护、安全性等维度，评估人工智能在业务应用中的潜在风险，为人工智能赋能企业提供助力。此次研讨会上，...……更多

2024-05-23 22:24:00人工智能,可信,研讨会,研讨,人工,模型

数字员工、超级个体、具身智能，AI Agent未来发展十大研

...为第二大趋势。该报告认为，通用人工智能渐行渐近，大模型走向多模态，AI智能体（Agent）有望成为下一代平台；端侧大模型加速部署，或将成为未来交互新入口。AI在数学推理、新药研发、材料发现、蛋白质合成等领域大显身...……更多

2024-02-02 17:00:00研究方向,个体,方向,员工,数字,智能

联合国报告：生成式人工智能加剧性别偏见

...节前夕，联合国教科文组织7日发布研究报告称，大语言模型存在性别偏见、种族刻板印象等倾向。该组织呼吁各国政府制定监管框架，同时私营企业应对偏见问题持续监测和评估。大语言模型是一种用于支持时下流行的生成式...……更多

2024-03-08 21:46:00联合国,人工智能,偏见,人工,生成,性别

北京经开区：加快打造AI原生产业创新高地，每年发放1亿元..

...人工智能产业生态。培育性能达到国际先进水平的通用大模型，打造人工智能标杆应用场景10个，集聚人工智能产业链企业100家，实现园区营业收入1000亿元，建成人工智能算力10000 PFlops。二、政策措施（一）推动算力赋能产业发...……更多

2024-03-29 16:42:00开区,高地,北京,产业,人工智能,智能

87.8%准确率赶超GPT-4o登顶！谷歌DeepMind发

【新智元导读】谷歌DeepMind推出LLM自动评估模型FLAMe系列，FLAMe-RM-24B模型在RewardBench上表现卓越，以87.8%准确率领先GPT-4o。大语言模型都卷起来了，模型越做越大，token越来越多，输出越来越长。那么问题来了，如何有效地评估大...……更多

2024-08-05 09:37:00准确率,模型,评估,评估,模型,数据

对话国投智能滕达：将聚焦大模型技术应用、生成式人工智能和人工

财联社6月4日讯（记者郭松峤）“‘破’是指用大模型技术解决人工智能安全问题，确保人工智能产业良性发展。‘立’则是人工智能赋能数字福建的具体实践，重构数字产业，拓展新机会。”近日，国投智能董事长滕达在数字...……更多

2024-06-05 00:24:00人工智能,智能,滕达,人工,技术应用,生成

无一大模型及格！北大/通研院提出超难基准，评估长文本理解生

在长文本理解能力这块，竟然没有一个大模型及格！北大联合北京通用人工智能研究院提出了一个新基准数据集：LooGLE，专门用于测试和评估大语言模型（LLMs）长上下文理解能力。该数据集既能够评估LLMs对长文本的处理和检索...……更多

2024-08-08 09:39:00基准,北大,生成,模型,文本,评估

五大数字员工已上岗！讯飞星火让每个岗位都用上大模型

...岗。▲MWC科大讯飞展区讯飞星火V4.0作为科大讯飞加速大模型应用落地的底座，已经将其融入到企业的各项业务流程中，既有面向服务、线下营销场景，还有更为细分的企业合同处理、招投标文件评估等各项环节，甚至还为企业...……更多

2024-07-01 09:24:00讯飞,星火,模型,岗位,员工,数字

欧盟《人工智能法案》如何影响开源模型监管？

...某些条款将在今年内适用。值得注意的是，免费、开源的模型的确获得了《法案》中的某些豁免。但如果它们被认为构成“系统性风险“，开源并不能成为其免于遵守规定的理由，这表明更强大的开源模型仍将面临监管。清华大...……更多

2024-03-16 13:06:00人工智能,法案,监管,人工,模型,影响

360集团携手中国信通院共促人工智能安全发展

本文转自：法治日报随着人工智能技术的迅猛发展，大模型在各个领域的应用日益广泛。为全力筑牢人工智能安全防线，进一步提高大模型技术的安全风险防范能力，今年2月，中国信息通信研究院（以下简称中国信通院）联合3...……更多

2024-04-09 01:58:00信通,人工智能,中国,人工,智能,集团

openai概述gpt-4o模型系统卡准备框架

8月10日消息，OpenAI公司于8月8日发布报告，概述了GPT-4o模型的系统卡（SystemCard），介绍了包括外部红队（模拟敌人攻击）、准备框架（PreparednessFramework）在内的诸多细节。OpenAI表示GPT-4o模型的核心就是准备框架（PreparednessFram……更多

2024-08-11 03:20:00框架,模型,准备,系统,红队,模型