多语,大规,模型,语料,基准,大规模头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

... MMedC 上进⼀步预训练使模型性能相⽐于基线显著提升。大规模多语医疗语料（MMedC）构建在构建数据集方面，研究团队收集了一份多语言医疗语料库，命名为 MMedC。该数据集包含 255 亿 tokens，其内容来自于四个来源：1. 通过启发...……更多

2024-09-30 09:51:00多语,大规,模型,语料,基准,大规模

openai发布多语言大规模多任务语言理解

...23日）发布博文，报道称OpenAI在HuggingFace上发布了多语言大规模多任务语言理解（MMMLU）数据集。背景随着语言模型日益强大，评估其在不同语言、认知和文化背景下的能力已成为当务之急。OpenAI决定推出MMMLU数据集，通过提供强...……更多

2024-09-24 22:07:00多语,大规,大规模,任务,语言,语言

击败GPT-4o的开源模型如何炼成?关于Llama 3.1

... 和 8B 模型这些较小模型的质量。3、为了支持 405B 模型的大规模生产推理，Meta 将 16 位 (BF16) 量化为 8 位 (FP8)，从而降低了计算要求，并使模型能够在单个服务器节点上运行。 4、在 15.6T token（3.8x10²⁵ FLOPs）上预训练 405B 是一……更多

2024-07-25 09:32:00模型,论文,模型,训练,论文,开发

昆仑万维发布开源13B高质量商用大模型领先Llama2和B

...Skywork-13B-Base模型是Skywork-13B的基础模型，其经由3.2万亿个多语言高质量数据训练，在CEVAL, CMMLU, MMLU, GSM8K等评测与基准测试上都展现了同等规模模型的最佳效果。 Skywork-13B-Math模型经过专门的数学能力强化训练，在GSM8K……更多

2023-10-30 15:35:00万维,昆仑,商用,高质量,模型,领先

多样任务真实数据，大模型在线购物基准Shopping MML

...于“亮剑”——联合香港科技大学、圣母大学构建了一个大规模、多任务评测基准Shopping MMLU，用以评估大语言模型在在线购物领域的能力与潜力。一直以来，想要完整建模在线购物相当复杂，主要痛点是：多任务性：在线购物...……更多

2024-11-21 09:45:00在线购物,基准,模型,任务,购物,数据

NeurIPS | 消除多对多问题，清华大规模细粒度视频片段

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报...……更多

2024-10-29 09:55:00大规,粒度,范式,清华,片段,大规模

50余家单位共同发起“语料生态服务大模型可持续发展倡议”

...-上海频道人民网上海7月6日电（记者唐小丽）高质量、大规模、安全可信的语料数据资源是AI时代的重要基石。7月6日上午，2024世界人工智能大会语料主题论坛在上海世博中心举办。本次论坛以“语料筑基，智生时代”为主题，...……更多

2024-07-06 17:50:00余家,语料,可持续发展,模型,生态,单位

中国初步建成大规模藏语数据资源库

...室已初步建成600TF算力的智算平台和面向多领域多用途的大规模藏语数据资源库。青海师范大学省部共建藏语智能信息处理及应用国家重点实验室2021年2月经中国科技部批准建设，是中国唯一的藏语信息处理领域国家重点实验室...……更多

2024-05-25 20:39:00藏语,大规,资源库,中国,大规模,数据

AI识别方言困难！专家探索用算法度量方言差距，提议构建统一框

...方言识别准确率。方言底层逻辑+大模型今年5月，Meta推出大规模多语言语音（MMS）模型，将文本转语音和语音转文本技术从大约100种语言扩展到1100多种，还可以识别4000多种口头语言。在国内，抖音上线了地方方言自动翻译功...……更多

2023-10-26 18:05:00方言,算法,框架,差距,困难,统一

AI翻译界杀手诞生！阿里国际翻译大模型吊打谷歌和GPT-4

...种识别、多维度数据质量评估，由此，就获得了高质量、大规模多语言数据。与此同时，通过利用多语言MoE、参数扩展方法，从而保证主导语言（如中英）性能不下降的情况下，提升了其他语种的性能。微调阶段，基于多语言大...……更多

2024-10-17 09:49:00阿里,模型,杀手,国际,电商,模型

千行百业加速拥抱大模型（AI前沿观察）

...学校长刘元春认为，中国作为世界第二大经济体，拥有超大规模市场和数字资源优势，为大模型提供了更深入、更丰富的落地场景以及能够持续训练的环境。“当前，大模型‘基础设施—底层技术—基础通用—垂直应用’的发展...……更多

2023-12-22 03:26:00百业,模型,观察,模型,语料,数据

87.8%准确率赶超GPT-4o登顶！谷歌DeepMind发

...论文地址：https://arxiv.org/abs/2407.10817模型本身在经历多轮大规模指令任务调整后，可以遵循一套新的指令，使它们适合用作模型输出的自动评估器。一方面，为了使LLM自动评分更加合理、准确并与人类偏好保持一致，对人类判断...……更多

2024-08-05 09:37:00准确率,模型,评估,评估,模型,数据

“2024语料风云榜”发布，10家企业上榜！

2024-07-06 17:50:00语料,风云榜,风云,企业,语料,上海

阿里通义开源模型Qwen2.5力压Claude3.5、GPT

...上做出了重大突破。它采用了更先进的预训练技术，通过大规模语料库的学习，使得模型在理解和生成文本的能力上达到了新的高度。此外，Qwen2.5还特别注重多语言支持和跨文化适应性，这使得它在全球化应用方面具有独特的...……更多

2024-10-31 09:47:00通义,模型,阿里,顶级,模型,技术

“弱智吧”成最佳中文AI语料库，究竟什么算优质数据？

...准确的预测和分类。此外，在多模态大模型构建过程中，大规模也经常需要具有语义对齐的多模态数据，对模型的构建也是非常重要的。这些数据能够使大模型学习到不同模态（如图片和文字）之间的映射关系，从而能够实现“...……更多

2024-04-15 17:00:00语料库,语料,中文,数据,数据,模型

首个语料库建设导则面世！近二十家企业共同发布

2024-07-06 17:50:00十家,语料库,语料,建设,企业,语料

语料运营平台1.0在沪上线，首批十大高质量语料产品发布

2024-07-06 17:50:00语料,高质量,运营,产品,平台,语料

字节开源全栈AI编程基准，不小心曝光豆包代码大模型

...大模型评估基准FullStack Bench。这是一个专注于全栈编程和多语言编程的代码评估数据集，它首次囊括了编程全栈技术中超过11类真实场景，覆盖16种编程语言，包含3374个问题。FullStack Bench的应用领域抽取自全球最大的程序员技术...……更多

2024-12-06 09:50:00豆包,基准,字节,模型,编程,代码

AI数据之战：大模型的“燃料”还能烧多久？

...大会（WAIC2024）上，如何有效供给高质语料数据，以支持大规模AI模型的产业应用，成为业界内外专家热烈讨论的核心议题之一。面对数据稀缺与模型旺盛需求之间的矛盾，学界与业界正在探索可持续的解决方案，以确保AI健康发...……更多

2024-07-09 17:41:00燃料,模型,数据,数据,模型,语料

指令跟随大比拼！Meta发布多轮多语言基准Multi-IF：

...、4501个三轮对话任务，全面揭示了当前LLM在复杂多轮、多语言场景中的挑战。所有模型在多轮对话中表现显著衰减，表现最佳的o1-preview模型在三轮对话的准确率从87.7%下降到70.7%；在非拉丁文字语言上，所有模型的表现显著弱于...……更多

2024-11-26 09:51:00多语,大比,基准,指令,任务,语言

2024中国人工智能行业大模型企业竞争力100强报告发布

...、金融等特定行业，通过轻量化设计，在保持性能的同时大规模减少参数规模。如科大国创的星云大模型，通过构建大规模通用代码语料库和专用代码语料库，不仅增强了生成通用代码和形式规约的能力，而且在语言理解等方面...……更多

2024-07-05 17:51:00工智,能行,中国,模型,竞争力,中国人

通义千问系列AI开源模型升至Qwen2：5个尺寸，最高 12

...和显存占用降低的优势。模型评测相比 Qwen1.5，Qwen2 在大规模模型实现了非常大幅度的效果提升。我们对 Qwen2-72B 进行了全方位的评测。在针对预训练语言模型的评估中，对比当前最优的开源模型，Qwen2-72B 在包括自然语言理解...……更多

2024-06-07 09:32:00通义,模型,尺寸,模型,训练,上下文

阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源

...旋转位置嵌入只能捕捉一维序列的位置信息，M-ROPE 使得大规模语言模型能够同时捕捉和整合一维文本序列、二维视觉图像以及三维视频的位置信息，赋予了语言模型强大的多模态处理和推理能力，能让模型更好地理解和建模复...……更多

2024-09-03 09:45:00二代,通义,阿里,模型,视觉,语言

文本图格式大一统！首个大规模文本边基准TEG-DB发布 |

...提出了文本边图的数据集与基准，包括9个覆盖4个领域的大规模文本边图数据集，以及一套标准化的文本边图研究范式。该研究的发表极大促进了文本边图图表示学习的研究，有利于自然语言处理与图数据挖掘领域的深度合作。...……更多

2024-11-09 13:34:00大规,本图,基准,大规模,文本,格式

AI产业的灰色暗面：OpenAI、谷歌、META如何搞训练语

...互联网上所有可靠的英文文本资源，而他们需要更多、更大规模的数据来训练更强大的模型。为了处理这个问题，OpenAI的Whisper语音识别工具诞生了——用来转录谷歌旗下视频平台Youtube的视频音频，生成大量的对话文本。报道称...……更多

2024-04-07 22:22:00语料,灰色,训练,产业,数据,训练

支付宝在AI大模型时代

...国科技巨头不断取得突破性进展。不过，AI技术能力和AI大规模落地应用的可行性是两回事。两者之间，隔着成本可控、可持续性等必须解决的难题。在AI规模化落地应用的可行性上，中国互联网公司正在积极探索和验证各种解决...……更多

2024-02-21 18:20:00模型,支付,时代,五福,支付,技术

美欧亚三洲开发者联手,全球首个组团训练的大模型,全流程开源

...究，INTELLECT-1 实现了 10 倍的规模提升。这一突破证明，大规模模型训练已不再是大公司的专利，通过去中心化的、社区驱动的方式同样可以实现。他们的下一步计划是将模型进一步扩展到前沿规模，最终目标是实现开源 AGI。这...……更多

2024-12-03 13:34:00三洲,欧亚,开发者,模型,流程,训练

北京国企为人工智能产业添动能

...数据的“中央厨房”。目前，交易所正在持续推动建设更大规模的大模型训练语料库，推动非公开数据集和算力进场交易，为北京AI原生产业发展提供支撑保障。就在近期，交易所刚刚发布北京100个人工智能大模型高质量训练数...……更多

2024-04-07 04:15:00动能,人工智能,北京,人工,智能,产业

GPT-4最强对手出现！Claude-3 AI模型发布

...PT(GenerativePre-trainedTransformer)技术的大型语言模型，通过在大规模文本数据上的预训练,学会了自然语言理解和生成的能力。亚马逊于今日宣布使用Claude3来优化其商业逻辑该系列包含三款各具特色的型号：Claude3Haiku、Claude3Sonnet以……更多

2024-03-10 18:27:00模型,对手,模型,处理,能力,前代