多语,大规,大规模,任务,语言,语言头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

openai发布多语言大规模多任务语言理解

...23日）发布博文，报道称OpenAI在HuggingFace上发布了多语言大规模多任务语言理解（MMMLU）数据集。背景随着语言模型日益强大，评估其在不同语言、认知和文化背景下的能力已成为当务之急。OpenAI决定推出MMMLU数据集，通过提供强...……更多

2024-09-24 22:07:00多语,大规,大规模,任务,语言,语言

迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测

... MMedC 上进⼀步预训练使模型性能相⽐于基线显著提升。大规模多语医疗语料（MMedC）构建在构建数据集方面，研究团队收集了一份多语言医疗语料库，命名为 MMedC。该数据集包含 255 亿 tokens，其内容来自于四个来源：1. 通过启发...……更多

2024-09-30 09:51:00多语,大规,模型,语料,基准,大规模

最新美国国家人工智能科学院院士介绍

...来自牛津大学，专注于机器学习和数据挖掘，尤其在处理大规模数据集方面取得了显著成果。 SophiaWang，来自哈佛大学，致力于自然语言处理与机器翻译的研究，提高了多语言之间的转换准确率。EthanLee，来自加州大学圣地亚哥...……更多

2024-03-24 08:39:00人工智能,美国,院士,科学院,人工,智能

o1核心作者分享：激励AI自我学习，比试图教会AI每一项任务

...以下一个token预测为例，说明了这种弱激励结构如何通过大规模多任务学习，鼓励模型学习解决数万亿个任务的通用技能，而不是单独解决每个任务。他观察到：如果尝试以尽可能少的努力解决数十个任务，那么单独模式识别每...……更多

2024-09-21 09:36:00教会,核心,任务,作者,学习,模型

讯飞听见，中关村论坛年会的“五届元老”非它莫属

...论坛、第45届IAA世界广告大会、2023金融街论坛年会、日本大规模人工智能科技公司展会“AI EXPO TOKYO”、2023世界制造业大会、第31届世界大学生运动会、世界人工智能大会、2023全球人工智能技术大会、澳门BEYOND国际创新博览会等...……更多

2024-05-01 12:00:00中关,讯飞,中关村,元老,年会,论坛

阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源

...旋转位置嵌入只能捕捉一维序列的位置信息，M-ROPE 使得大规模语言模型能够同时捕捉和整合一维文本序列、二维视觉图像以及三维视频的位置信息，赋予了语言模型强大的多模态处理和推理能力，能让模型更好地理解和建模复...……更多

2024-09-03 09:45:00二代,通义,阿里,模型,视觉,语言

Meta首款多模态Llama 3.2开源！1B羊驼宝宝，跑在

...预训练的Llama 3.1文本模型添加图像适配器和编码器，并在大规模噪声图像-文本对数据上进行预训练。然后，在中等规模的高质量领域内和知识增强的图像-文本对数据上，再次进行训练。接着，在后训练阶段采用与文本模型类...……更多

2024-09-27 13:39:00模态,宝宝,模型,图像,训练,文本

刚刚，Llama 3.2 来了！支持图像推理，还有可在手机上

...文本模型开始，首先，添加图像适应器和编码器，然后在大规模有噪声的成对 (图像，文本) 数据上进行预训练。接下来，在中等规模的高质量域内和经过知识增强的 (图像，文本) 对数据上进行训练。在后训练阶段，再使用与文...……更多

2024-09-27 13:42:00推理,可在,图像,运行,版本,支持

清华提出时间序列大模型：面向通用时序分析的生成式Transf

...于起步阶段。近期，清华大学的研究团队基于Transformer在大规模时间序列上进行生成式预训练，获得了任务通用的时序分析模型，展现出大模型特有的泛化性与可扩展性时间序列提供了数据随时间变化的视角，对于理解复杂系统...……更多

2024-07-22 09:44:00时间序列,时序,清华,序列,生成,模型

阿里CEO吴泳铭：生成式AI让世界有了一个统一的语言——To

...然在理论和实验室环境中展现了巨大的潜力，但将其推向大规模商用并非易事。一个显著的挑战就是其高昂的计算和处理成本。Token的处理，涉及海量的数据分割、编码、解码以及跨模态的信息融合。这些操作需要强大的计算能...……更多

2024-09-20 09:51:00阿里,生成,统一,语言,世界,模态

综合RLHF、DPO、KTO优势，统一对齐框架UNA来了

...专注于 LLM Alignment。3. 黄灿：厦门大学数学系副教授随着大规模语言模型的快速发展，如 GPT、Claude 等，LLM 通过预训练海量的文本数据展现了惊人的语言生成能力。然而，即便如此，LLM 仍然存在生成不当或偏离预期的结果。这种...……更多

2024-10-10 09:56:00框架,优势,统一,综合,模型,奖励

谷歌推“双子座” 号称最强AI模型

...、音频和编程代码，具备更强的理解和推理能力，还在“大规模多任务语言理解”测试中首次超越人类专家。谷歌公司称，“双子座”将推出三种版本：Ultra版本功能最强大，适用于高度复杂的任务，预计2024年初发布；Nano版本...……更多

2023-12-08 06:04:00双子座,双子,模型,双子座,双子,人工智能

谷歌公司发布人工智能模型“双子座”

...企业客户开放。据介绍，“双子座”Ultra版本是首个在“大规模多任务语言理解”（MMLU）领域超越人类专家的模型。“大规模多任务语言理解”结合了数学、物理、历史、法律、医学和伦理学等57个学科来测试人工智能掌握知识...……更多

2023-12-08 07:31:00人工智能,双子座,双子,人工,模型,智能

AI识别方言困难！专家探索用算法度量方言差距，提议构建统一框

...方言识别准确率。方言底层逻辑+大模型今年5月，Meta推出大规模多语言语音（MMS）模型，将文本转语音和语音转文本技术从大约100种语言扩展到1100多种，还可以识别4000多种口头语言。在国内，抖音上线了地方方言自动翻译功...……更多

2023-10-26 18:05:00方言,算法,框架,差距,困难,统一

共赢生成式AI时代

...模型获得更准确的回答。最后一种是微调(FineTuning),指在大规模预训练的基础上,使用与目标任务相关的数据进行进一步训练。通过微调,企业可以把通用模型与部分业务数据相结合,让大语言模型快速获得对业务的理解。微调的门...……更多

2024-04-11 16:48:00生成,时代,陈晓,亚马,生成,亚马逊

日本发布大规模语言模型

...公司等近日宣布，利用超级计算机“富岳”，他们开发的大规模语言模型“Fugaku-LLM”正式发布。“Fugaku-LLM”是首个完全由日本国产技术构建的AI语言模型，其在处理日语及相关文化内容上表现卓越。模型特别擅长基于日语敬语...……更多

2024-05-15 02:03:00大规,日本,大规模,模型,语言,模型

影视译制：不仅是语言翻译，更是文化诠释

...足受众的消费需求，为填补电视台播出的时间空缺，中国大规模引进影视作品，影视译制迎来发展黄金期。《血疑》引发全民追看，主演登上《大众电影》的杂志封面。《追捕》在中国观影人次数以亿计，有观众在电影院看了几...……更多

2024-05-29 05:57:00语言,影视,文化,作品,影视,中国

终于来了！OpenAI开放GPT-4o高级语音，还用中文说「

...了上新高级语音模式，近日，OpenAI 还发布了一个多语言大规模多任务语言理解（Multilingual Massive Multitask Language Understanding，MMMLU）数据集，测试集提供了 14 种语言，包括阿拉伯语，德语，西班牙语等，涵盖 57 个不同类别的……更多

2024-09-26 13:35:00中文,语音,开放,语音,用户,声音

CMU&清华：让LLM自己合成数据来学习，特定任务性能同样大

...本科毕业生赵晨阳，卡内基梅隆大学硕士生贾雪莹。虽然大规模语言模型（LLM）在许多自然语言处理任务中表现优异，但在具体任务中的效果却不尽如人意。为了提升模型在特定自然语言任务上的表现，现有的方法主要依赖于高...……更多

2024-08-02 09:40:00清华,性能,任务,数据,学习,生成

谷歌推出其最先进AI模型Gemini，希望击败GPT-4

...间或使处理器过热。据介绍，Gemini Ultra是第一个在MMLU（大规模多任务语言理解）方面超越人类专家的模型，该模型综合使用数学、物理、历史、法律、医学和伦理学等57个科目来测试世界知识和解决问题的能力，谷歌在一篇博客...……更多

2023-12-07 10:21:00最先,模型,比斯,模型,哈萨,人工智能

87.8%准确率赶超GPT-4o登顶！谷歌DeepMind发

...论文地址：https://arxiv.org/abs/2407.10817模型本身在经历多轮大规模指令任务调整后，可以遵循一套新的指令，使它们适合用作模型输出的自动评估器。一方面，为了使LLM自动评分更加合理、准确并与人类偏好保持一致，对人类判断...……更多

2024-08-05 09:37:00准确率,模型,评估,评估,模型,数据

通义千问系列AI开源模型升至Qwen2：5个尺寸，最高 12

...和显存占用降低的优势。模型评测相比 Qwen1.5，Qwen2 在大规模模型实现了非常大幅度的效果提升。我们对 Qwen2-72B 进行了全方位的评测。在针对预训练语言模型的评估中，对比当前最优的开源模型，Qwen2-72B 在包括自然语言理解...……更多

2024-06-07 09:32:00通义,模型,尺寸,模型,训练,上下文

浪潮AI 人工智能“小源” 破“杀猪盘”诈骗套路

日前，由浪潮AI研究院研发的大规模中文语言模型“源1.0”在某次反诈行动中发挥出了出色的实效。期间，在“源1.0”的基础上，开发者开发了一个能够无障碍进行微信聊天的人工智能“小源”，并在与骗子的真实对话场景中进...……更多

2023-01-19 12:00:00小源,人工智能,套路,浪潮,诈骗,人工

GPT-4最强对手出现！Claude-3 AI模型发布

...PT(GenerativePre-trainedTransformer)技术的大型语言模型，通过在大规模文本数据上的预训练,学会了自然语言理解和生成的能力。亚马逊于今日宣布使用Claude3来优化其商业逻辑该系列包含三款各具特色的型号：Claude3Haiku、Claude3Sonnet以……更多

2024-03-10 18:27:00模型,对手,模型,处理,能力,前代

AI，未来也许只是一种办公软件

...统和应用增强人类工作的关键机理在于其通过深度学习和大规模训练，具备了处理复杂数据、理解自然语言和模拟人类思维过程的能力，可以在没有人类干预的情况下自动化执行任务。倚仗庞大的数据集和算力资源，LLMs能够提...……更多

2023-10-21 17:35:00办公软件,只是,办公,软件,工作,白皮

击败GPT-4o的开源模型如何炼成?关于Llama 3.1

... 和 8B 模型这些较小模型的质量。3、为了支持 405B 模型的大规模生产推理，Meta 将 16 位 (BF16) 量化为 8 位 (FP8)，从而降低了计算要求，并使模型能够在单个服务器节点上运行。 4、在 15.6T token（3.8x10²⁵ FLOPs）上预训练 405B 是一……更多

2024-07-25 09:32:00模型,论文,模型,训练,论文,开发

混合架构赋予AI人类推理能力

...研究的霍金斯还说，以往的类似研究计算成本太高，难以大规模应用。科学家们说，三个资料库框架都使用神经符号方法——一种结合神经网络的人工智能结构。神经网络就是采用经典的类似程序的逻辑方法，模仿人类大脑结构...……更多

2024-06-12 18:15:00推理,架构,混合,人类,能力,语言