• 我的订阅
  • 头条热搜
Meta发布新AI模型:可自查和审查其他AI模型工作
...期由其研究部门宣布推出了一系列创新的人工智能(AI)模型,其中尤为引人注目的是一款具有划时代意义的自学评估器。这款工具旨在大幅减少AI系统开发过程中对人类参与的依赖。这款自学评估器采用了先进的思维链技术,...……更多
...责任落实。如不得设置诱导用户沉迷、过度消费等的算法模型;不得利用算法干预信息呈现,实施影响网络舆论或者规避监督管理行为;定期审核、评估、验证算法机制机理、模型、数据和应用结果等,常态化开展算法安全自评...……更多
全球AI安全评估测试有了新基准
本文转自:科技日报大模型安全领域两项国际标准发布全球AI安全评估测试有了新基准随着人工智能系统,特别是大语言模型成为社会各方面不可或缺的一部分,以一个全面的标准来解决它们的安全挑战变得至关重要。◎本报记...……更多
...及时检测修复代码安全漏洞和算法逻辑缺陷,定期对算法模型的可用性、可控性、可解释性以及数据处理、模型训练、部署运行等环节开展安全评估。二、工作目标1.算法导向正确。健全完善正能量优质内容池,优化算法推荐服...……更多
第一级将包括所有基础模型;第二级针对“非常强大”的基础模型,将通过用于训练其大型语言模型的算力来区分;第三级被称为大规模通用目的人工智能系统,将包括最流行的人工智能工具,并以用户总数来衡量。欧盟正在...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型(MLLMs)因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应用领域,掀...……更多
深度剖析:谷歌、微软等AI巨头承诺的“自愿监管”做到了吗?
...达到最泡沫”之际做出的,各家公司都在竞相推出自己的模型,并使其比竞争对手的模型更大、更好。与此同时,我们也开始看到围绕版权和深度伪造等问题的争论。Geoffrey Hinton 等有影响力的科技人士组成的游说团也提出了人...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...这是该团队在继 PMC-LLaMA 后,在持续构建开源医疗语言大模型的最新进展。该项目受到科创 2030—“新一代人工智能” 重大项目支持。在医疗领域中,大语言模型已经有了广泛的研究。然而,这些进展主要依赖于英语的基座模型...……更多
国际组织WDTA首次就大模型安全发布国际标准,蚂蚁集团、OpenAI、科大讯飞等参编
...,包括《生成式人工智能应用安全测试标准》和《大语言模型安全测试方法》两项国际标准。这是国际组织首次就大模型安全领域发布国际标准,代表全球人工智能安全评估和测试进入新的基准。据了解,这两项国际标准是由Ope...……更多
史上最严中文真实性评估:OpenAI o1第1豆包第2,其它全部不及格
新的大语言模型(LLM)评估基准对于跟上大语言模型的快速发展至关重要。近日,淘宝天猫集团的研究者们提出了中文简短问答(Chinese SimpleQA),这是首个全面的中文基准,具有“中文、多样性、高质量、静态、易于评估”五...……更多
下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用
【新智元导读】VQAScore是一个利用视觉问答模型来评估由文本提示生成的图像质量的新方法;GenAI-Bench是一个包含复杂文本提示的基准测试集,用于挑战和提升现有的图像生成模型。两个工具可以帮助研究人员自动评估AI模型的...……更多
关于LLM-as-a-judge范式,终于有综述讲明白了
...往无法判断精妙的属性并提供令人满意的结果。大型语言模型 (LLM) 的最新进展启发了 “LLM-as-a-judge” 范式,其中 LLM 被用于在各种任务和应用程序中执行评分、排名或选择。本文对基于 LLM 的判断和评估进行了全面的调查,为推...……更多
2023 AI现状报告:GPT-4仍最强,监管方向缺乏全球共识
...越来越困难。由于基准变得不那么明确,用于评估大语言模型的“基于氛围”的方法在业界越来越普遍。·人工智能安全在2023年首次占据舞台中心。但人工智能界内部存在深刻分歧,世界各国政府采取的做法相互矛盾。挑战性在...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...斯坦福李飞飞吴佳俊团队!HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。2009年,李飞飞团队在CVPR上首次对...……更多
智能澎湃!浩鲸科技再次登榜 “人工智能领军企业”
ChatGPT引爆2023,基于AI大模型的创新产品及应用竞相涌现。近日,国内AI专业科技媒体机器之心重磅揭晓了「AI 中国」2023 年度榜单,浩鲸科技凭借在AI、算法、算力方面的前瞻性探索和长期深耕,通过在行业大模型的优异实践,...……更多
法管家大模型通过国家网信办“大模型”备案 成为国内首个完成“双备案”的法律大模型
...计算与认知智能教育部工程研究中心联合研发的法管家大模型,成功通过了“生成式人工智能服务备案”,成为业界焦点。值得注意的是,早在今年4月,法管家大模型算法便已率先通过国家互联网信息办公室的“境内深度合成...……更多
以人工智能助力涉外法治建设
...检察机关主动将分析式、生成式人工智能技术应用到监督模型创建、案件线索挖掘、法律(案例)检索、文书自动生成等方面,全方位推进数字检察战略,助力提升法律监督质效。一是创建大语言平台应用,深挖模型监督点。将...……更多
一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等
...【新智元导读】Meta最近开源了多个AI项目,包括图像分割模型SAM 2.1、多模态语言模型Spirit LM、自学评估器和改进的跨语言句子编码器Mexma等,提升了AI在图像处理和语音识别领域的能力,进一步推动了AI研究的进展。开源绝对是AI...……更多
商汤联合发布白皮书,首次提出新一代AI基础设施评估体系
...AI基础设施成为AI2.0时代“新基建”数据显示,过去四年,大模型参数量以年均400%复合增长,AI算力需求增长超过15万倍,远超摩尔定律。以CPU为中心的传统计算基础设施已无法满足大模型、生成式AI的新要求。大模型训练对数据质量和...……更多
...应对这些风险,毕马威中国提出“可信赖的人工智能治理模型”。该模型旨在通过公平性、透明性、可解释性、隐私保护、安全性等维度,评估人工智能在业务应用中的潜在风险,为人工智能赋能企业提供助力。此次研讨会上,...……更多
数字员工、超级个体、具身智能,AI Agent未来发展十大研究方向
...为第二大趋势。该报告认为,通用人工智能渐行渐近,大模型走向多模态,AI智能体(Agent)有望成为下一代平台;端侧大模型加速部署,或将成为未来交互新入口。AI在数学推理、新药研发、材料发现、蛋白质合成等领域大显身...……更多
联合国报告:生成式人工智能加剧性别偏见
...节前夕,联合国教科文组织7日发布研究报告称,大语言模型存在性别偏见、种族刻板印象等倾向。该组织呼吁各国政府制定监管框架,同时私营企业应对偏见问题持续监测和评估。大语言模型是一种用于支持时下流行的生成式...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
【新智元导读】谷歌DeepMind推出LLM自动评估模型FLAMe系列,FLAMe-RM-24B模型在RewardBench上表现卓越,以87.8%准确率领先GPT-4o。大语言模型都卷起来了,模型越做越大,token越来越多,输出越来越长。那么问题来了,如何有效地评估大...……更多
北京经开区:加快打造AI原生产业创新高地,每年发放1亿元...
...人工智能产业生态。培育性能达到国际先进水平的通用大模型,打造人工智能标杆应用场景10个,集聚人工智能产业链企业100家,实现园区营业收入1000亿元,建成人工智能算力10000 PFlops。二、政策措施(一)推动算力赋能产业发...……更多
财联社6月4日讯(记者郭松峤)“‘破’是指用大模型技术解决人工智能安全问题,确保人工智能产业良性发展。‘立’则是人工智能赋能数字福建的具体实践,重构数字产业,拓展新机会。”近日,国投智能董事长滕达在数字...……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
在长文本理解能力这块,竟然没有一个大模型及格!北大联合北京通用人工智能研究院提出了一个新基准数据集:LooGLE,专门用于测试和评估大语言模型(LLMs)长上下文理解能力。该数据集既能够评估LLMs对长文本的处理和检索...……更多
五大数字员工已上岗!讯飞星火让每个岗位都用上大模型
...岗。▲MWC科大讯飞展区讯飞星火V4.0作为科大讯飞加速大模型应用落地的底座,已经将其融入到企业的各项业务流程中,既有面向服务、线下营销场景,还有更为细分的企业合同处理、招投标文件评估等各项环节,甚至还为企业...……更多
欧盟《人工智能法案》如何影响开源模型监管?
...某些条款将在今年内适用。值得注意的是,免费、开源的模型的确获得了《法案》中的某些豁免。但如果它们被认为构成“系统性风险“,开源并不能成为其免于遵守规定的理由,这表明更强大的开源模型仍将面临监管。清华大...……更多
本文转自:法治日报随着人工智能技术的迅猛发展,大模型在各个领域的应用日益广泛。为全力筑牢人工智能安全防线,进一步提高大模型技术的安全风险防范能力,今年2月,中国信息通信研究院(以下简称中国信通院)联合3...……更多
openai概述gpt-4o模型系统卡准备框架
8月10日消息,OpenAI公司于8月8日发布报告,概述了GPT-4o模型的系统卡(SystemCard),介绍了包括外部红队(模拟敌人攻击)、准备框架(PreparednessFramework)在内的诸多细节。OpenAI表示GPT-4o模型的核心就是准备框架(PreparednessFram……更多
更多关于科技的资讯:
创新服务企业模式,为数字资产保护提供新的解决方案河北开具首张数据知识产权公证存储证明河北日报讯(记者马彦铭)7月28日
2025-08-02 08:54:00
石家庄食草堂文化饰品有限公司总经理牛睿仪:“选择一行,就要脚踏实地干下去”7月,牛睿仪又打卡了三个城市。作为石家庄食草堂文化饰品有限公司总经理
2025-08-02 09:01:00
厦门网讯 (厦门日报记者 张珺)夏日鹭岛,骄阳似火。比气候更炽热的,是厦门企业在数字化转型浪潮中,对人工智能(AI)应用的破釜沉舟与积极探索
2025-08-02 09:10:00
在7月29日召开的市委十三届九次全会上,杭州市提出将加快建设人工智能创新高地作为首要任务。三天后的8月1日,杭州高新区(滨江)召开人工智能产业创新高地建设推进大会
2025-08-02 09:15:00
杭州也有黄金回收智能机了!自助回收,当天变现,你会尝试吗?
“没想到杭州也有黄金回收智能机了!”近日,杭州市民朱女士向潮新闻记者分享了她体验黄金自助回收的新鲜经历。近年来,国际金价高歌猛进
2025-08-02 10:47:00
大众网记者 张亚茹 德州报道
2025-08-02 09:55:00
●张珺“未来没有AI企业,只有用AI的企业。”这是国投智能董事长滕达在采访中留下的一句话,也成为众多厦门企业数智化升级的共识
2025-08-02 09:09:00
折叠屏拐点,始于「0.1mm」的战争
推翻折叠屏行业的“不可能三角”。 折叠屏赛道,已然开启“百花齐放”的时代。当智能手机的形态创新打破了旧有的天花板桎梏
2025-08-02 00:17:00
向“新”发力,为企业高质量发展注入强劲动能
盛夏时节,走进位于鱼台县清河镇的济宁政大新材料科技有限公司(政大篷布)生产车间,机器轰鸣声不绝于耳,生产线满负荷运转,装载叉车来回穿梭
2025-08-02 00:14:00
新发路观察+|“文化+”背后的吉林机遇
盛夏,7月下旬。第五届中国新电商大会如约而至。中国吉林网注意到,在本届中国新电商大会上,很多来自文化产业的从业者汇聚而至
2025-08-01 14:29:00
纳美科学电动双管双组份牙膏推动行业进入技术性革命
据中国口腔清洁护理用品工业协会《2024年中国口腔护理行业白皮书》显示:中国美白牙膏市场规模达217.3亿元,占牙膏总市场54
2025-08-01 14:43:00
跨界破圈迎增长,30周年重磅献礼 开启家居产业新纪元
——2025浦东家具家居双展9月启幕,规模逆势扩张,看点多元升级在当下挑战与机遇并存的全球经贸环境下,由中国家具协会与上海博华展览有限公司举办的中国国际家具展览会迎来了30周年的荣耀时刻
2025-08-01 14:43:00
为持续提升柜面服务效率与客户体验,锻造一支业务精湛、服务高效的运营队伍,近日,南京银行连云港分行举办了2025年度运营条线业务技能竞赛的首阶段竞技活动——汉字录入与数字录入项目现场测评
2025-08-01 14:52:00
WAIC 2025:开普勒大黄蜂挑战8小时直播圆满收官,引领具身智能商业化新征程
7月26日-29日,2025世界人工智能大会暨人工智能全球治理高级别会议(简称"WAIC 2025")在上海举行。大会聚焦人工智能发展的关键命题
2025-08-01 15:13:00
不少消费者都接到过各种营销电话,有的营销电话还是用普通电话号码打过来的,让人防不胜防。为落实“信息通信暖心服务实事”,解决用户反映突出的通信业务电话营销虚假宣传
2025-08-01 15:33:00