• 我的订阅
  • 科技

openai发布多语言大规模多任务语言理解

类别:科技 发布时间:2024-09-24 22:07:00 来源:浅语科技

9月24日消息,科技媒体marktechpost昨日(9月23日)发布博文,报道称OpenAI在HuggingFace上发布了多语言大规模多任务语言理解(MMMLU)数据集。

背景

随着语言模型日益强大,评估其在不同语言、认知和文化背景下的能力已成为当务之急。

OpenAI决定推出MMMLU数据集,通过提供强大的多语言和多任务数据集,来评估大型语言模型(LLMs)在各种任务中的性能,从而应对这一挑战。

MMMLU数据集简介

MMMLU数据集包含一系列问题,涵盖各种主题、学科领域和语言。其结构旨在评估模型在不同研究领域中需要常识、推理、解决问题和理解能力的任务中的表现。

openai发布多语言大规模多任务语言理解

MMMLU的创建反映了OpenAI对测量模型实际能力的关注,尤其是在NLP研究中代表性不足的语言,纳入多种语言可确保模型在使用英语时有效,并能胜任全球使用的其他语言。

MMMLU数据集核心

涵盖范围广

MMMLU数据集是同类基准中最广泛的基准之一,涵盖了从高中问题到高级专业和学术知识的多种任务。

研究人员和开发人员在利用MMMLU数据集过程中,可以调用不同难度的问题,测试大预言模型在人文、科学和技术主题下的表现。

更考验深层认知

这些问题都经过精心策划,以确保对模型的测试不局限于表面理解,而是深入研究更深层次的认知能力,包括批判性推理、解释和跨领域解决问题的能力。

多语言支持

MMMLU数据集的另一个值得注意的特点是它的多语言范围,支持简体中文。该数据集支持多种语言,可以进行跨语言的综合评估。

openai发布多语言大规模多任务语言理解

然而,以英语数据训练的模型在使用其他语言时往往需要帮助来保持准确性和连贯性。MMMLU数据集提供了一个框架,用于测试传统上在NLP研究中代表性不足的语言模型,从而弥补了这一差距。

MMMLU数据集意义

MMMLU的发布解决了人工智能界的几个相关挑战。它提供了一种更具多样性和文化包容性的方法来评估模型,确保它们在高资源和低资源语言中都能表现出色。

MMMLU的多任务特性突破了现有基准的界限,它可以评估同一模型在不同任务中的表现,从类似琐事的事实回忆到复杂的推理和问题解决。这样就能更细致地了解模型在不同领域的优缺点。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-09-25 00:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
... MMedC 上进⼀步预训练使模型性能相⽐于基线显著提升。大规模多语医疗语料(MMedC)构建在构建数据集方面,研究团队收集了一份多语言医疗语料库
2024-09-30 09:51:00
Meta推出“AI翻译官”!能翻译和转录近百种语言,已开源
...100种语言语音翻译的需求。因此,Meta为200种语言构建了大规模多语言和模态文本嵌入空间SONAR,能快速搜索具有相似性的多种语言
2023-08-24 11:03:00
腾讯ailab发现了chatgpt的又一个短板
...性:ChatGPT是基于GPT-3开发的模型,GPT-3在涵盖各种领域的大规模数据集进行上训练,因此,在特定领域的表现
2023-02-14 15:51:00
AI翻译界杀手诞生!阿里国际翻译大模型吊打谷歌和GPT-4
...种识别、多维度数据质量评估,由此,就获得了高质量、大规模多语言数据。与此同时,通过利用多语言MoE、参数扩展方法,从而保证主导语言(如中英)性能不下降的情况下,提升了其他语种
2024-10-17 09:49:00
“百模大战”,国产 GPT 大全
...yan.baidu.com/welcome通义千问“通义千问”是阿里云推出的超大规模的语言模型,功能包括多轮对话、文案创作
2023-05-07 20:34:00
...其中,北京大学王选计算机研究所建成了中华精品字库。大规模构建语言资源体系。建成了世界最大规模语言资源库和中国语言资源知识图谱,多模态集成120多种语言和方言资源。大领域布局大
2025-03-31 17:51:00
多样任务真实数据,大模型在线购物基准Shopping MMLU开源
...于“亮剑”——联合香港科技大学、圣母大学构建了一个大规模、多任务评测基准Shopping MMLU,用以评估大语言模型在在线购物领域的能力与潜力。一直以来,想要完整建模在线购
2024-11-21 09:45:00
...监事会成员。 36氪了解到,reInventAI已经开始训练第一个大规模的语言模型,预计在2024年年初发布。reInventAI相信
2023-07-13 12:59:00
最新美国国家人工智能科学院院士介绍
...来自牛津大学,专注于机器学习和数据挖掘,尤其在处理大规模数据集方面取得了显著成果。 SophiaWang,来自哈佛大学,致力于自然语言处理与机器翻译的研究,提高了多语言之间
2024-03-24 08:39:00
更多关于科技的资讯:
9月20日从太原市房产管理局获悉,日前该局向全市房地产开发企业发出《关于规范售楼场所人脸识别设备使用的通知》(以下简称《通知》)
2025-09-21 18:32:00
世界制造业大会人气旺,市民沉浸式感受“智造”魅力
大皖新闻讯 9月20日,2025世界制造业大会在安徽合肥滨湖国际会展中心开幕,并首次增设智能机器人展区,观众沉浸式感受“智造”魅力
2025-09-21 16:03:00
十堰广电讯(全媒体记者 耿吉国)据2025新能源汽车零部件交易会组委会最新消息,9月21日10:30,本届交易会将在十堰国际会展中心的交易会活动现场
2025-09-21 08:54:00
9月20日,2025太原人形机器人欢乐跑比赛在晋阳湖公园举行。这是我市第一次举办人形机器人“跑步”比赛。本次比赛,共有来自省城高校
2025-09-21 06:42:00
混成全网公敌的“流水线式造假”,终于被整顿
一家三口站在某所知名小学校门前,松弛地拍了一张合照。照片发到小红书上,下方评论区都在问询:“这么优秀的娃,究竟该怎么培养
2025-09-20 22:18:00
家庭观影进入IMAX时代!海信发布全球最大150英寸激光电视
鲁网9月19日讯9月19日,以“无界”为主题的“2025激光显示技术与产业发展大会”隆重举行。作为全球激光显示领域的领军企业
2025-09-20 08:56:00
我国脑机接口技术取得重大突破 厦门大学研究人员参与
放大镜视野下的“神经蠕虫”电极。(受访者 供图)厦门网讯(厦门日报 佘峥 通讯员 戴佩琪)我国脑机接口技术有重大突破——近日
2025-09-20 09:18:00
厦门“屏实力”再添新动能 天马发布高端OLED技术品牌“天工屏”
图为天马“天工屏”发布会现场。(厦门日报记者 卢剑豪 摄)厦门网讯(厦门日报记者 林露虹 通讯员 雷飏 李舜)随着人们日常使用手机时长持续攀升
2025-09-20 09:18:00
“赢在南京”海外人才创业大赛总决赛落幕逐鹿未来机“慧” 四海英才“论剑”南报网讯(记者余梦娇)9月19日,2025年“赢在南京”海外人才创业大赛总决赛在紫金山科技城圆满落幕
2025-09-20 09:54:00
过节送福礼,就送波尼亚!老字号中秋礼盒,青岛人都认这口
鲁网9月20日讯中秋将至,岛城的节日氛围日渐浓厚,走亲访友、阖家团聚的时刻,一份饱含心意的礼品总能传递温暖。作为扎根青岛的老字号肉食品牌
2025-09-20 10:08:00
机器人“总动员”!2025世界制造业大会上演智造奇观
大皖新闻讯 机械臂在空中划出优美弧线,人形机器人灵活抓取糖果,机器狗稳步行走在模拟街区内……2025世界制造业大会的智能机器人展区仿佛穿越至未来世界
2025-09-20 13:25:00
茶话弄九周年,这款经典单品即将迎来“家族式”升级
9月的西安,金桂飘香。2016年创立于西安的国风新中式茶饮品牌茶话弄,也将于近期启动以“桂花”为主题元素的品牌九周年庆典系列活动
2025-09-20 15:33:00
了不起的河南制造丨汉威科技:唤醒机器人“感知”世界的能力
大河网讯 2025世界制造业大会9月20日至23日在安徽省合肥市举办,大会以“智造世界·创造美好”为主题,举办开幕式暨主旨演讲
2025-09-20 16:14:00
了不起的河南制造丨2025世界制造业大会举行,河南“工业机器人”现场秀签名
大河网讯 9月20日,2025世界制造业大会开幕式暨主旨演讲在合肥市举行。河南省作为主宾省参会,30家制造业企业“重装上阵”
2025-09-20 16:45:00
2026届校园招聘大战启幕 科技企业派机器狗进高校抢人
近期,2026届校园招聘在全国多所高校陆续启动,一场围绕科技人才的“抢人大战”正式拉开帷幕。与往年相比,今年众多科技企业积极创新招聘形式
2025-09-20 17:55:00