• 我的订阅
  • 头条热搜
Meta发布新AI模型:可自查和审查其他AI模型工作
...期由其研究部门宣布推出了一系列创新的人工智能(AI)模型,其中尤为引人注目的是一款具有划时代意义的自学评估器。这款工具旨在大幅减少AI系统开发过程中对人类参与的依赖。这款自学评估器采用了先进的思维链技术,...……更多
全球AI安全评估测试有了新基准
本文转自:科技日报大模型安全领域两项国际标准发布全球AI安全评估测试有了新基准随着人工智能系统,特别是大语言模型成为社会各方面不可或缺的一部分,以一个全面的标准来解决它们的安全挑战变得至关重要。◎本报记...……更多
第一级将包括所有基础模型;第二级针对“非常强大”的基础模型,将通过用于训练其大型语言模型的算力来区分;第三级被称为大规模通用目的人工智能系统,将包括最流行的人工智能工具,并以用户总数来衡量。欧盟正在...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型(MLLMs)因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应用领域,掀...……更多
深度剖析:谷歌、微软等AI巨头承诺的“自愿监管”做到了吗?
...达到最泡沫”之际做出的,各家公司都在竞相推出自己的模型,并使其比竞争对手的模型更大、更好。与此同时,我们也开始看到围绕版权和深度伪造等问题的争论。Geoffrey Hinton 等有影响力的科技人士组成的游说团也提出了人...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...这是该团队在继 PMC-LLaMA 后,在持续构建开源医疗语言大模型的最新进展。该项目受到科创 2030—“新一代人工智能” 重大项目支持。在医疗领域中,大语言模型已经有了广泛的研究。然而,这些进展主要依赖于英语的基座模型...……更多
国际组织WDTA首次就大模型安全发布国际标准,蚂蚁集团、OpenAI、科大讯飞等参编
...,包括《生成式人工智能应用安全测试标准》和《大语言模型安全测试方法》两项国际标准。这是国际组织首次就大模型安全领域发布国际标准,代表全球人工智能安全评估和测试进入新的基准。据了解,这两项国际标准是由Ope...……更多
史上最严中文真实性评估:OpenAI o1第1豆包第2,其它全部不及格
新的大语言模型(LLM)评估基准对于跟上大语言模型的快速发展至关重要。近日,淘宝天猫集团的研究者们提出了中文简短问答(Chinese SimpleQA),这是首个全面的中文基准,具有“中文、多样性、高质量、静态、易于评估”五...……更多
下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用
【新智元导读】VQAScore是一个利用视觉问答模型来评估由文本提示生成的图像质量的新方法;GenAI-Bench是一个包含复杂文本提示的基准测试集,用于挑战和提升现有的图像生成模型。两个工具可以帮助研究人员自动评估AI模型的...……更多
2023 AI现状报告:GPT-4仍最强,监管方向缺乏全球共识
...越来越困难。由于基准变得不那么明确,用于评估大语言模型的“基于氛围”的方法在业界越来越普遍。·人工智能安全在2023年首次占据舞台中心。但人工智能界内部存在深刻分歧,世界各国政府采取的做法相互矛盾。挑战性在...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...斯坦福李飞飞吴佳俊团队!HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。2009年,李飞飞团队在CVPR上首次对...……更多
智能澎湃!浩鲸科技再次登榜 “人工智能领军企业”
ChatGPT引爆2023,基于AI大模型的创新产品及应用竞相涌现。近日,国内AI专业科技媒体机器之心重磅揭晓了「AI 中国」2023 年度榜单,浩鲸科技凭借在AI、算法、算力方面的前瞻性探索和长期深耕,通过在行业大模型的优异实践,...……更多
以人工智能助力涉外法治建设
...检察机关主动将分析式、生成式人工智能技术应用到监督模型创建、案件线索挖掘、法律(案例)检索、文书自动生成等方面,全方位推进数字检察战略,助力提升法律监督质效。一是创建大语言平台应用,深挖模型监督点。将...……更多
商汤联合发布白皮书,首次提出新一代AI基础设施评估体系
...AI基础设施成为AI2.0时代“新基建”数据显示,过去四年,大模型参数量以年均400%复合增长,AI算力需求增长超过15万倍,远超摩尔定律。以CPU为中心的传统计算基础设施已无法满足大模型、生成式AI的新要求。大模型训练对数据质量和...……更多
...应对这些风险,毕马威中国提出“可信赖的人工智能治理模型”。该模型旨在通过公平性、透明性、可解释性、隐私保护、安全性等维度,评估人工智能在业务应用中的潜在风险,为人工智能赋能企业提供助力。此次研讨会上,...……更多
数字员工、超级个体、具身智能,AI Agent未来发展十大研究方向
...为第二大趋势。该报告认为,通用人工智能渐行渐近,大模型走向多模态,AI智能体(Agent)有望成为下一代平台;端侧大模型加速部署,或将成为未来交互新入口。AI在数学推理、新药研发、材料发现、蛋白质合成等领域大显身...……更多
联合国报告:生成式人工智能加剧性别偏见
...节前夕,联合国教科文组织7日发布研究报告称,大语言模型存在性别偏见、种族刻板印象等倾向。该组织呼吁各国政府制定监管框架,同时私营企业应对偏见问题持续监测和评估。大语言模型是一种用于支持时下流行的生成式...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
【新智元导读】谷歌DeepMind推出LLM自动评估模型FLAMe系列,FLAMe-RM-24B模型在RewardBench上表现卓越,以87.8%准确率领先GPT-4o。大语言模型都卷起来了,模型越做越大,token越来越多,输出越来越长。那么问题来了,如何有效地评估大...……更多
北京经开区:加快打造AI原生产业创新高地,每年发放1亿元...
...人工智能产业生态。培育性能达到国际先进水平的通用大模型,打造人工智能标杆应用场景10个,集聚人工智能产业链企业100家,实现园区营业收入1000亿元,建成人工智能算力10000 PFlops。二、政策措施(一)推动算力赋能产业发...……更多
财联社6月4日讯(记者郭松峤)“‘破’是指用大模型技术解决人工智能安全问题,确保人工智能产业良性发展。‘立’则是人工智能赋能数字福建的具体实践,重构数字产业,拓展新机会。”近日,国投智能董事长滕达在数字...……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
在长文本理解能力这块,竟然没有一个大模型及格!北大联合北京通用人工智能研究院提出了一个新基准数据集:LooGLE,专门用于测试和评估大语言模型(LLMs)长上下文理解能力。该数据集既能够评估LLMs对长文本的处理和检索...……更多
五大数字员工已上岗!讯飞星火让每个岗位都用上大模型
...岗。▲MWC科大讯飞展区讯飞星火V4.0作为科大讯飞加速大模型应用落地的底座,已经将其融入到企业的各项业务流程中,既有面向服务、线下营销场景,还有更为细分的企业合同处理、招投标文件评估等各项环节,甚至还为企业...……更多
欧盟《人工智能法案》如何影响开源模型监管?
...某些条款将在今年内适用。值得注意的是,免费、开源的模型的确获得了《法案》中的某些豁免。但如果它们被认为构成“系统性风险“,开源并不能成为其免于遵守规定的理由,这表明更强大的开源模型仍将面临监管。清华大...……更多
本文转自:法治日报随着人工智能技术的迅猛发展,大模型在各个领域的应用日益广泛。为全力筑牢人工智能安全防线,进一步提高大模型技术的安全风险防范能力,今年2月,中国信息通信研究院(以下简称中国信通院)联合3...……更多
openai概述gpt-4o模型系统卡准备框架
8月10日消息,OpenAI公司于8月8日发布报告,概述了GPT-4o模型的系统卡(SystemCard),介绍了包括外部红队(模拟敌人攻击)、准备框架(PreparednessFramework)在内的诸多细节。OpenAI表示GPT-4o模型的核心就是准备框架(PreparednessFram……更多
智慧芽垂直领域大模型通过国家网信办“双备案”
...公布最新一批生成式人工智能服务已备案信息,智慧芽大模型成功通过备案(备案号:Jiangsu-YaZai-202407030003)。今年2月,“智慧芽文本生成大模型算法”已成功通过第四批境内深度合成服务算法备案。至此,智慧芽成为业内率先...……更多
还在人工炼丹?自动提示工程指南来了,还带从头实现
...APE)是指自动生成和优化 LLM 提示词的技术,目标是提升模型在特定任务上的性能。其基于提示词工程的思路,即编写多个不同的提示词并对其进行测试,只不过是让整个过程自动化。后面我们会看到,这个过程非常类似于传统...……更多
openai推出最新o1模型引发业界关注
...理性成为企业面临的重要挑战。近期,OpenAI推出的最新o1模型再次引发了业界对AI安全问题的关注。一些专家指出,该模型虽然在推理能力上有显著提升,但同时也表现出更高的欺骗能力,引发了对潜在风险的担忧。据报道,OpenA...……更多
...策略。我们深入研究了统计学在AI算法开发、数据分析和模型优化方面的作用。通过采用统计学方法,可以提高AI系统的性能、准确性和稳定性,从而更好地满足不同应用领域的需求。此外,我们还探讨了在AI系统中应用统计学方...……更多
...特点、在技术创新上居于国际前列的人工智能教育行业大模型。涌现数个引领性教育领域人工智能专精特新企业及大模型智能体,全市大中小学深入开展人工智能场景应用。《方案》提出,将建设“人工智能+教育”示范应用基...……更多
更多关于科技的资讯:
出口转内销 好物进商超
近日,世纪联华超市杭州庆春店的生鲜区开辟了外贸优品专区,以优惠价格销售外贸企业的出口转内销海鲜产品,受到不少消费者的青睐
2025-04-25 08:39:00
汉王友基联合SIA、西部国版共建创意数字版权平台
4月21日,在2025年陕西省知识产权宣传周版权宣传主场活动中,由西部国家版权交易中心、深圳市插画协会(SIA)、汉王友基联合打造的“创意数字版权平台(简称CDCP)测试版”正式亮相
2025-04-25 08:45:00
插件技术作为现代计算机软件开发中的一种重要架构设计,因其灵活性和可扩展性而广泛应用于多种软件系统中。本文旨在探讨插件技术的基本概念
2025-04-25 08:54:00
中国人寿肥城市支公司开展柜面开放日活动
鲁网4月24日讯为进一步加强与客户的沟通交流,提升服务质量,中国人寿肥城支公司客户体验中心于4月24日举办柜面开放日活动
2025-04-25 08:56:00
问界M8闹市街头离车泊入:丝滑躲人躲车 车主连呼牛X
快科技4月25日消息,华为ADS已是国内驾驶辅助系统第一梯队,一般的泊车车位也很难拿捏住华为ADS。为此,有问界M8车主在云南丽江闹市街头
2025-04-25 09:02:00
英特尔新CEO陈立武铁腕改革:裁员万人叠加每周四天到岗令
快科技4月25日消息,据报道,面临持续亏损的英特尔迎来新任华裔CEO陈立武的"铁腕"改革。在英特尔刚发布2025财年第一季度财报显示净亏损同比扩大115%至8亿美元后
2025-04-25 09:02:00
《爱情死亡机器人》第四季正式预告:5月15日上线
快科技4月25日消息,爱死机第四季终于来了!奈飞正式发布《爱情死亡机器人》第四季的正式预告,宣布这部备受瞩目的剧集将于5月15日正式上线
2025-04-25 09:02:00
目前,在国内头部电商平台上搜索“外骨骼”关键词,会得到从百元级、千元级到万元级不等的众多推荐,其中不少被贴上“登山神器”“爬楼搬运”“膝盖助力”“减压助力”等标签
2025-04-25 09:10:00
当前,“外骨骼+”模式正加速技术落地,覆盖养老、康复、工业、户外等多元场景。从助力残障人士重新站立、引导脑瘫儿童学习走路
2025-04-25 09:10:00
KGS全球管理层访华 深化本土化战略
近日,全球知名商业消防解决方案提供商Kidde Global Solutions(以下简称"KGS")集团首席执行官Dan Thompson率核心管理团队来华考察
2025-04-25 09:22:00
近日,在湖南省推进“智赋万企”、加速培育新质生产力的行动中,全省“数字新基建”100个标志性项目名单(2025年)正式发布
2025-04-25 09:22:00
喝酒骑车重罚!日本新规:骑自行车戴耳机、玩手机、带人最高罚600元
快科技4月25日消息,日本公布了最新的自行车骑行时的新规,喝酒骑车属于恶意或危险的违规行为。日本将于2026年4月1日起
2025-04-25 09:32:00
别崇洋媚外了!专家:中国经济已超美国 汽车产量甩后者3倍
4月25日消息,全球化智库(CCG)副主任高志凯近日公开表示,按PPP计价中国经济已超美国。按照高志凯的说法,美国将中国视为"步步紧逼的敌人"源于认知错位
2025-04-25 09:32:00
索尼Xperia 1 VII真机首曝:手机行业唯一清流设计
快科技4月25日消息,据爆料,索尼Xperia 1 VII渲染图将在5月发布,目前已经现身认证列表,真机首次亮相。可以看到
2025-04-25 09:32:00
从健康到节能,海信新风空调X3Pro系列如何以AI定义舒适新标准?
在智能家居深度渗透生活的时代背景下,用户对智能生活的品质追求已从“尝鲜体验”进阶为“刚需配置”。AI空调凭借多维度环境感知
2025-04-25 09:32:00