多语,大规,模型,语料,基准,大规模头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

谷歌推“双子座” 号称最强AI模型

...、音频和编程代码，具备更强的理解和推理能力，还在“大规模多任务语言理解”测试中首次超越人类专家。谷歌公司称，“双子座”将推出三种版本：Ultra版本功能最强大，适用于高度复杂的任务，预计2024年初发布；Nano版本...……更多

2023-12-08 06:04:00双子座,双子,模型,双子座,双子,人工智能

谷歌推出其最先进AI模型Gemini，希望击败GPT-4

...间或使处理器过热。据介绍，Gemini Ultra是第一个在MMLU（大规模多任务语言理解）方面超越人类专家的模型，该模型综合使用数学、物理、历史、法律、医学和伦理学等57个科目来测试世界知识和解决问题的能力，谷歌在一篇博客...……更多

2023-12-07 10:21:00最先,模型,比斯,模型,哈萨,人工智能

GPT-4o的识图能力有多牛？四大维度深度体验

...通常会提到“预训练”、“后训练”等术语。预训练常在大规模的数据集上进行（通常是让模仿互联网上的内容），目标是通过在较大的任务上训练模型，使得模型学习到通用的特征。而后训练指的是专注针对特定行为优化模型...……更多

2024-05-19 14:21:00维度,深度,能力,体验,模型,训练

“唤醒”甲骨文厦大团队尝试用AI破译古老文字

...体字转换，史晓东收集了很多古文字资料，之后，他采用大规模古籍语料+人工智能办法，编写了一本异体字字典，收字接近9万字，应该是目前大陆最详尽的异体字字典。在此之前，台湾也有一本异体字字典，100多位语言学家花...……更多

2024-12-11 08:17:00甲骨,甲骨文,尝试,团队,文字,甲骨

检索总结能力超博士后，首个大模型科研智能体PaperQA2开

...生和博士后。将 PaperQA2 应用于矛盾检测任务让我们能够大规模识别生物学论文中的矛盾。例如，ZNF804A rs1344706 等位基因对精神分裂症患者的大脑结构有积极影响的说法与后来发表的研究相矛盾，该研究发现 rs1344706 对大脑皮质厚...……更多

2024-09-13 13:33:00博士后,模型,科研,博士,检索,能力

清华郑纬民院士：AI for Science的出现，让高性能

...性原则、AI基准设计四大目标以及如何通过并行方法加速大规模预训练模型。为了完整体现郑纬民院士的分享及思考，在不改变原意的基础上，量子位对他的演讲内容进行了编辑整理。关于MEET 智能未来大会：MEET大会是由量子位...……更多

2023-01-11 05:00:00清华,院士,高性能,人工智能,模型,智能

Mamba再次挑战霸主Transformer！首个通用Mam

...计算机视觉、音频处理以及估计和预测等任务。首个通用大规模Mamba模型上面提到，基于注意力机制的Transformer是当今所有最强大语言模型中占主导地位的架构。然而，由于计算和内存成本随着序列长度的增加而增加，注意力机...……更多

2024-08-14 09:43:00一鸣,霸主,模型,再次,模型,序列

精准狙击Llama 3.1？Mistral AI开源Larg

...均长度：语言多样性当今大量的商业化应用场景涉及处理多语言文档。Mistral Large 2 在大量多语言数据上进行了训练，特别是在英语、法语、德语、西班牙语、意大利语、葡萄牙语、荷兰语、俄语、中文、日语、韩语、阿拉伯语...……更多

2024-07-26 09:36:00模型,基准,多语,测试,性能,生成

刚刚，Llama 3.2 来了！支持图像推理，还有可在手机上

...文本模型开始，首先，添加图像适应器和编码器，然后在大规模有噪声的成对 (图像，文本) 数据上进行预训练。接下来，在中等规模的高质量域内和经过知识增强的 (图像，文本) 对数据上进行训练。在后训练阶段，再使用与文...……更多

2024-09-27 13:42:00推理,可在,图像,运行,版本,支持

清华教授唐杰：Scaling Laws虽被质疑，但至今仍是提

...，先后出现了基于Transformer的BERT、GPT/GPT-2/GPT-3、T5等基于大规模无标注数据自监督学习的大规模预训练算法。这些算法模型均在大数据支持下拥有较大规模模型参数，具备较强的通用能力，可完成多场景任务，显著降低学习成本...……更多

2024-06-05 18:36:00清华,模型,教授,性能,方法,模型

恒生电子：金融大模型技术升级，国内AI芯片危机互现

...标注和深度学习，这些是传统行业的特征。而AI大模型是大规模预训练的，也就是说是大数据一次性灌到参数里，再经过一些精调，它可以同时适用于多个应用领域和多项AI任务。这些应用领域不需要再做大规模数据标注，只需...……更多

2023-10-22 15:30:00恒生,芯片,模型,危机,升级,金融

NeurIPS 2024 | FaceChain团队新作，开

...功已经表明了数据结构在提升模型泛化能力中的重要性。大规模人脸识别数据集中天然地蕴含着丰富的数据结构信息，然而，在人脸识别任务中，目前还没有研究探索过如何挖掘并利用大规模数据集中所蕴含的结构信息来提升人...……更多

2024-10-18 09:46:00人脸,拓扑,新作,模型,团队,人脸

自动化、可复现，基于大语言模型群体智能的多维评估基准

...anding Paper Award）。研究者们已经并陆续构建了成千上万的大规模语言模型（LLM），这些模型的各项能力（如推理和生成）也越来越强。因此，在多样的应用场景中对其进行性能基准测试已成为了一项重大挑战。目前最受欢迎的基...……更多

2024-10-23 12:03:00多维,基准,群体,模型,自动化,评估

神仙打架！谷歌新款大模型Gemini 和GPT-4谁能笑到最

...级处理能力的任务。据介绍，Gemini Ultra是第一个在MMLU（大规模多任务语言理解）方面超越人类专家的模型，该模型综合使用数学、物理、历史、法律、医学和伦理学等57个科目来测试世界知识和解决问题的能力。Gemini Pro专为多...……更多

2023-12-07 16:15:00神仙,模型,观察,科技,模型,任务

国内首个官方“大模型标准符合性评测”公布

...榜单。据腾讯方面介绍，腾讯混元大模型符合《人工智能大规模与训练模型第2部分：测评指标与方法》语言大模型的相关技术要求。该模型号称拥有超千亿参数规模、预训练语料超2万亿tokens。同时，阿里云、腾讯云分别以技术...……更多

2023-12-23 15:09:00符合性,模型,评测,标准,官方,模型

英伟达h100gpu在mlperf基准测试创造6项新记录

...6月报道，3584 个H100GPU群在短短11分钟内完成了基于GPT-3的大规模基准测试。MLPerfLLM基准测试是基于OpenAI的GPT-3模型进行的，包含1750亿个参数。LambdaLabs估计，训练这样一个大模型需要大约3.14E23FLOPS的计算量。英伟达最新的EosAI超级……更多

2023-11-10 02:18:00英伟,新记录,基准,测试,英伟,基准