• 我的订阅
  • 头条热搜
Meta发布新AI模型:可自查和审查其他AI模型工作
...期由其研究部门宣布推出了一系列创新的人工智能(AI)模型,其中尤为引人注目的是一款具有划时代意义的自学评估器。这款工具旨在大幅减少AI系统开发过程中对人类参与的依赖。这款自学评估器采用了先进的思维链技术,...……更多
全球AI安全评估测试有了新基准
本文转自:科技日报大模型安全领域两项国际标准发布全球AI安全评估测试有了新基准随着人工智能系统,特别是大语言模型成为社会各方面不可或缺的一部分,以一个全面的标准来解决它们的安全挑战变得至关重要。◎本报记...……更多
第一级将包括所有基础模型;第二级针对“非常强大”的基础模型,将通过用于训练其大型语言模型的算力来区分;第三级被称为大规模通用目的人工智能系统,将包括最流行的人工智能工具,并以用户总数来衡量。欧盟正在...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型(MLLMs)因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应用领域,掀...……更多
深度剖析:谷歌、微软等AI巨头承诺的“自愿监管”做到了吗?
...达到最泡沫”之际做出的,各家公司都在竞相推出自己的模型,并使其比竞争对手的模型更大、更好。与此同时,我们也开始看到围绕版权和深度伪造等问题的争论。Geoffrey Hinton 等有影响力的科技人士组成的游说团也提出了人...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...这是该团队在继 PMC-LLaMA 后,在持续构建开源医疗语言大模型的最新进展。该项目受到科创 2030—“新一代人工智能” 重大项目支持。在医疗领域中,大语言模型已经有了广泛的研究。然而,这些进展主要依赖于英语的基座模型...……更多
国际组织WDTA首次就大模型安全发布国际标准,蚂蚁集团、OpenAI、科大讯飞等参编
...,包括《生成式人工智能应用安全测试标准》和《大语言模型安全测试方法》两项国际标准。这是国际组织首次就大模型安全领域发布国际标准,代表全球人工智能安全评估和测试进入新的基准。据了解,这两项国际标准是由Ope...……更多
史上最严中文真实性评估:OpenAI o1第1豆包第2,其它全部不及格
新的大语言模型(LLM)评估基准对于跟上大语言模型的快速发展至关重要。近日,淘宝天猫集团的研究者们提出了中文简短问答(Chinese SimpleQA),这是首个全面的中文基准,具有“中文、多样性、高质量、静态、易于评估”五...……更多
下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用
【新智元导读】VQAScore是一个利用视觉问答模型来评估由文本提示生成的图像质量的新方法;GenAI-Bench是一个包含复杂文本提示的基准测试集,用于挑战和提升现有的图像生成模型。两个工具可以帮助研究人员自动评估AI模型的...……更多
2023 AI现状报告:GPT-4仍最强,监管方向缺乏全球共识
...越来越困难。由于基准变得不那么明确,用于评估大语言模型的“基于氛围”的方法在业界越来越普遍。·人工智能安全在2023年首次占据舞台中心。但人工智能界内部存在深刻分歧,世界各国政府采取的做法相互矛盾。挑战性在...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...斯坦福李飞飞吴佳俊团队!HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。2009年,李飞飞团队在CVPR上首次对...……更多
智能澎湃!浩鲸科技再次登榜 “人工智能领军企业”
ChatGPT引爆2023,基于AI大模型的创新产品及应用竞相涌现。近日,国内AI专业科技媒体机器之心重磅揭晓了「AI 中国」2023 年度榜单,浩鲸科技凭借在AI、算法、算力方面的前瞻性探索和长期深耕,通过在行业大模型的优异实践,...……更多
以人工智能助力涉外法治建设
...检察机关主动将分析式、生成式人工智能技术应用到监督模型创建、案件线索挖掘、法律(案例)检索、文书自动生成等方面,全方位推进数字检察战略,助力提升法律监督质效。一是创建大语言平台应用,深挖模型监督点。将...……更多
商汤联合发布白皮书,首次提出新一代AI基础设施评估体系
...AI基础设施成为AI2.0时代“新基建”数据显示,过去四年,大模型参数量以年均400%复合增长,AI算力需求增长超过15万倍,远超摩尔定律。以CPU为中心的传统计算基础设施已无法满足大模型、生成式AI的新要求。大模型训练对数据质量和...……更多
...应对这些风险,毕马威中国提出“可信赖的人工智能治理模型”。该模型旨在通过公平性、透明性、可解释性、隐私保护、安全性等维度,评估人工智能在业务应用中的潜在风险,为人工智能赋能企业提供助力。此次研讨会上,...……更多
数字员工、超级个体、具身智能,AI Agent未来发展十大研究方向
...为第二大趋势。该报告认为,通用人工智能渐行渐近,大模型走向多模态,AI智能体(Agent)有望成为下一代平台;端侧大模型加速部署,或将成为未来交互新入口。AI在数学推理、新药研发、材料发现、蛋白质合成等领域大显身...……更多
联合国报告:生成式人工智能加剧性别偏见
...节前夕,联合国教科文组织7日发布研究报告称,大语言模型存在性别偏见、种族刻板印象等倾向。该组织呼吁各国政府制定监管框架,同时私营企业应对偏见问题持续监测和评估。大语言模型是一种用于支持时下流行的生成式...……更多
北京经开区:加快打造AI原生产业创新高地,每年发放1亿元...
...人工智能产业生态。培育性能达到国际先进水平的通用大模型,打造人工智能标杆应用场景10个,集聚人工智能产业链企业100家,实现园区营业收入1000亿元,建成人工智能算力10000 PFlops。二、政策措施(一)推动算力赋能产业发...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
【新智元导读】谷歌DeepMind推出LLM自动评估模型FLAMe系列,FLAMe-RM-24B模型在RewardBench上表现卓越,以87.8%准确率领先GPT-4o。大语言模型都卷起来了,模型越做越大,token越来越多,输出越来越长。那么问题来了,如何有效地评估大...……更多
财联社6月4日讯(记者郭松峤)“‘破’是指用大模型技术解决人工智能安全问题,确保人工智能产业良性发展。‘立’则是人工智能赋能数字福建的具体实践,重构数字产业,拓展新机会。”近日,国投智能董事长滕达在数字...……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
在长文本理解能力这块,竟然没有一个大模型及格!北大联合北京通用人工智能研究院提出了一个新基准数据集:LooGLE,专门用于测试和评估大语言模型(LLMs)长上下文理解能力。该数据集既能够评估LLMs对长文本的处理和检索...……更多
五大数字员工已上岗!讯飞星火让每个岗位都用上大模型
...岗。▲MWC科大讯飞展区讯飞星火V4.0作为科大讯飞加速大模型应用落地的底座,已经将其融入到企业的各项业务流程中,既有面向服务、线下营销场景,还有更为细分的企业合同处理、招投标文件评估等各项环节,甚至还为企业...……更多
欧盟《人工智能法案》如何影响开源模型监管?
...某些条款将在今年内适用。值得注意的是,免费、开源的模型的确获得了《法案》中的某些豁免。但如果它们被认为构成“系统性风险“,开源并不能成为其免于遵守规定的理由,这表明更强大的开源模型仍将面临监管。清华大...……更多
本文转自:法治日报随着人工智能技术的迅猛发展,大模型在各个领域的应用日益广泛。为全力筑牢人工智能安全防线,进一步提高大模型技术的安全风险防范能力,今年2月,中国信息通信研究院(以下简称中国信通院)联合3...……更多
openai概述gpt-4o模型系统卡准备框架
8月10日消息,OpenAI公司于8月8日发布报告,概述了GPT-4o模型的系统卡(SystemCard),介绍了包括外部红队(模拟敌人攻击)、准备框架(PreparednessFramework)在内的诸多细节。OpenAI表示GPT-4o模型的核心就是准备框架(PreparednessFram……更多
智慧芽垂直领域大模型通过国家网信办“双备案”
...公布最新一批生成式人工智能服务已备案信息,智慧芽大模型成功通过备案(备案号:Jiangsu-YaZai-202407030003)。今年2月,“智慧芽文本生成大模型算法”已成功通过第四批境内深度合成服务算法备案。至此,智慧芽成为业内率先...……更多
...策略。我们深入研究了统计学在AI算法开发、数据分析和模型优化方面的作用。通过采用统计学方法,可以提高AI系统的性能、准确性和稳定性,从而更好地满足不同应用领域的需求。此外,我们还探讨了在AI系统中应用统计学方...……更多
openai推出最新o1模型引发业界关注
...理性成为企业面临的重要挑战。近期,OpenAI推出的最新o1模型再次引发了业界对AI安全问题的关注。一些专家指出,该模型虽然在推理能力上有显著提升,但同时也表现出更高的欺骗能力,引发了对潜在风险的担忧。据报道,OpenA...……更多
还在人工炼丹?自动提示工程指南来了,还带从头实现
...APE)是指自动生成和优化 LLM 提示词的技术,目标是提升模型在特定任务上的性能。其基于提示词工程的思路,即编写多个不同的提示词并对其进行测试,只不过是让整个过程自动化。后面我们会看到,这个过程非常类似于传统...……更多
...特点、在技术创新上居于国际前列的人工智能教育行业大模型。涌现数个引领性教育领域人工智能专精特新企业及大模型智能体,全市大中小学深入开展人工智能场景应用。《方案》提出,将建设“人工智能+教育”示范应用基...……更多
更多关于科技的资讯:
搞定这三个问题,投标高效又精准!
第一个问题,高效查找项目。很多朋友都习惯于去某搜索引擎查找标讯,搜出来的广告居多,而且信息来源还不可溯源查证,甚至有时候跑到官方的发布平台去搜也搜不到
2025-01-11 17:39:00
2024火蝠电商年度盘点:电商代运营为核心,多领域服务并进
2024年,国内电商市场在“国补”政策刺激与电商平台“互联互通”等积极因素推动下,展现出蓬勃的发展活力。权威数据表明,1到11月全国网上零售额达14万亿元
2025-01-11 17:58:00
各类的招标网的信息的来源主要会从政府采购网站、公共资源交易平台、招标代理机构授权、采购商自行在该网站上发布的招标信息来获取招标信息
2025-01-11 18:00:00
咱们得明确,劳保用品的采购商类型很多,需求也各不相同。大致可以分为以下几类:1.大型企业和工厂:这是劳保用品的最大买家
2025-01-11 18:01:00
造价35万元的E-bike被老外追捧,这个卷疯了的赛道仍有机会|硬氪直击CES
作者 | 张子怡编辑 | 袁斯来一年一度的科技界春晚CES 2025即将落幕,不同于去年展会上备受关注、新品频出的E-bike
2025-01-12 04:34:00
男子钓到“金蟾抱鲤”果断放生:钓了20多年鱼第一次遇到
快科技1月11日消息,近日,云南一名男子在钓鱼时遇到了令人惊叹的一幕:一条鲤鱼被一只金蟾紧紧抱住。他拍摄的视频显示,这只蟾蜍将两只前爪伸入鲤鱼的眼睛中
2025-01-11 19:51:00
招标项目可以提前知道吗?投标老鸟的实战经验分享
在招投标的战场上,能提前获取招标项目信息吗?当然可以。这就好比是手握“先知卷轴”,能让你在众多竞争者中抢占先机,为中标铺就坦途
2025-01-11 20:11:00
从风云浙商榜单看2024年浙江经济拼图
岁回律转,时光倏然。一年的时间,不过是两次年度风云浙商登台亮相的间隙。2024年度风云浙商昨天(1月10日)揭开谜底,这10位(组)最后当选的浙商面孔
2025-01-11 20:31:00
占地1万平方米,全国首家!京东奥莱线下店落户临沂
近日,临沂和谐广场与京东奥莱正式达成战略合作,双方将携手在和谐广场开设京东奥莱店。据了解,该店占地面积1万平方米,是全国首家万平米京东奥莱店
2025-01-11 20:55:00
首先,可以访问“全国建筑市场监管公共服务平台”,也就是我们常说的“四库一平台”,这里提供丰富的工程项目信息。第二,中国政府采购网
2025-01-11 21:07:00
女子考研失败后到北大当保安:以一种特殊方式来到梦想之地
1月11日消息,据媒体报道,2023年,赵予宁考研失败,这时她的同学向她推荐了北大安保岗位,赵予宁决定抓住这次机会,以一种特殊的方式来到自己梦想的地方
2025-01-11 21:21:00
固态硬盘的M.2/PCIe/NVMe有何含义 一文读懂
在选择固态硬盘的时候,我们经常会看到M.2/PCIe/NVMe这样的字眼,虽然他们经常一起出现,但是有时候会出现支持一个但是不支持另一个的情况
2025-01-11 21:21:00
业内首个!京东发布“AI京医”大模型:准确率达99.5%
快科技1月11日消息,2025京东健康年度医生盛典和数智医疗大会今天在京举行,京东健康发布了基于其线上全域场景的大模型全系产品“AI京医”
2025-01-11 21:21:00
史上首个BO9冠军!成都AG超玩会夺得2024年挑战者杯冠军
快科技1月11日消息,在今晚的比赛中,成都AG超玩会以5:3比分战胜重庆狼队,成为2024年王者荣耀挑战者杯冠军。成都AG超玩会捧起队史第五座冠军奖杯
2025-01-11 21:21:00
李子柒穿了自己缝的螺钿披风:美若天仙
1月11日消息,据媒体报道,李子柒现身微博之夜红毯,她穿着亲手缝的非遗螺钿披风。有网友表示,李子柒就像误入凡尘的仙子。公开报道显示
2025-01-11 21:21:00