大规,本图,基准,大规模,文本,格式头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

文本图格式大一统！首个大规模文本边基准TEG-DB发布 |

...提出了文本边图的数据集与基准，包括9个覆盖4个领域的大规模文本边图数据集，以及一套标准化的文本边图研究范式。该研究的发表极大促进了文本边图图表示学习的研究，有利于自然语言处理与图数据挖掘领域的深度合作。...……更多

2024-11-09 13:34:00大规,本图,基准,大规模,文本,格式

MMMU华人团队更新Pro版！多模态基准升至史诗级难度：过滤

...以提高性能。MMMU-Pro：更健壮的MMMU重新审视MMMU基准测试大规模多学科多模态理解和推理（MMMU）基准测试是一个综合性的数据集，能够评估多模态人工智能模型在需要特定学科知识和深思熟虑推理的大学水平任务上的表现。MMMU由...……更多

2024-09-18 13:31:00模态,史诗,基准,难度,问答,文本

Mamba再次挑战霸主Transformer！首个通用Mam

...计算机视觉、音频处理以及估计和预测等任务。首个通用大规模Mamba模型上面提到，基于注意力机制的Transformer是当今所有最强大语言模型中占主导地位的架构。然而，由于计算和内存成本随着序列长度的增加而增加，注意力机...……更多

2024-08-14 09:43:00一鸣,霸主,模型,再次,模型,序列

Meta提出“可持续思维链”，让大模型在连续潜空间中推理

...但他们利用视频作为通用监督的可扩展来源。UniReal 可从大规模视频中学习世界动态，在处理阴影、反射、姿态变化和物体交互方面展示了先进的能力，同时还为新型应用展示了新兴能力。论文链接： https://arxiv.org/abs/2412.07774项...……更多

2024-12-13 09:19:00推理,模型,思维,空间,模型,生成

NeurIPS | 消除多对多问题，清华大规模细粒度视频片段

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报...……更多

2024-10-29 09:55:00大规,粒度,范式,清华,片段,大规模

多模态竞技场对标90B Llama 3.2！Pixtral

...了哪些工作。模型结构Pixtral 12B整体为Transformer架构，在大规模交错图像和文本文档上进行了预训练，具备多轮、多图像对话的能力。多模态解码器Pixtral的大语言模型主干选择了自家的Mistral Nemo 12B，decoder-only架构。内部维度14336...……更多

2024-11-20 09:43:00模态,竞技场,竞技,报告,技术,模态

87.8%准确率赶超GPT-4o登顶！谷歌DeepMind发

...论文地址：https://arxiv.org/abs/2407.10817模型本身在经历多轮大规模指令任务调整后，可以遵循一套新的指令，使它们适合用作模型输出的自动评估器。一方面，为了使LLM自动评分更加合理、准确并与人类偏好保持一致，对人类判断...……更多

2024-08-05 09:37:00准确率,模型,评估,评估,模型,数据

百万鲁棒数据训练，3D场景大语言模型新SOTA！IIT等发布

...元导读】Robin3D通过鲁棒指令数据生成引擎（RIG）生成的大规模数据进行训练，以提高模型在3D场景理解中的鲁棒性和泛化能力，在多个3D多模态学习基准测试中取得了优异的性能，超越了以往的方法，且无需针对特定任务的微调...……更多

2024-10-16 13:35:00模型,场景,训练,语言,数据,物体

鄂维南院士领衔新作：大模型不止有RAG、参数存储，还有第3种

...一个具有 2.4B 非嵌入参数的 Memory3 模型，其性能超过了更大规模的 SOTA 模型。它还比 RAG 具有更好的性能和更快的推理速度；此外，Memory3 提高了事实性并减轻了幻觉，并能够快速适应专业任务。方法介绍记忆电路理论有助于确...……更多

2024-07-11 09:33:00维南,领衔,院士,新作,模型,存储

GPT-4最强对手出现！Claude-3 AI模型发布

...PT(GenerativePre-trainedTransformer)技术的大型语言模型，通过在大规模文本数据上的预训练,学会了自然语言理解和生成的能力。亚马逊于今日宣布使用Claude3来优化其商业逻辑该系列包含三款各具特色的型号：Claude3Haiku、Claude3Sonnet以……更多

2024-03-10 18:27:00模型,对手,模型,处理,能力,前代

总说具身智能的数据太贵，鹏城实验室开源百万规模标准化数据集

...的具身智能领域学术成果 ——ARIO（All Robots In One）具身大规模数据集，旨在解决当前具身智能领域所面临的数据获取难题。论文题目：All Robots in One: A New Standard and Unified Dataset for Versatile……更多

2024-08-24 09:32:00太贵,数据,标准化,实验室,规模,实验

pixelmatorpro新增pdf文本编辑、文本图层轮廓

...前官方为PixelmatorPro推出了3.5.8版本，新增PDF文本编辑、文本图层轮廓、“便当网格”模版等内容。IT之家整理主要更新点如下：PDF中的可编辑文本图层您现在可以将矢量PDF中的文本元素作为常规文本图层导入，然后使用各种文件...……更多

2024-04-13 01:34:00本图,轮廓,文本,本图,轮廓,网格

Jina AI 推出全球首个开源 8K 文本嵌入模型

...品，在功能和性能上与OpenAI的text-embedding-ada-002类似。在大规模文本嵌入基准(MTEB)排行榜方面，IT之家发现，官方进行如下解释：与OpenAI的8K模型text-embedding-ada-002进行比较，jina-embedding-v2在分类平均值、重排平均……更多

2023-10-26 20:28:00模型,文本,全球,平均值,分析,上下文

谷歌推“双子座” 号称最强AI模型

...、音频和编程代码，具备更强的理解和推理能力，还在“大规模多任务语言理解”测试中首次超越人类专家。谷歌公司称，“双子座”将推出三种版本：Ultra版本功能最强大，适用于高度复杂的任务，预计2024年初发布；Nano版本...……更多

2023-12-08 06:04:00双子座,双子,模型,双子座,双子,人工智能

神仙打架！谷歌新款大模型Gemini 和GPT-4谁能笑到最

...级处理能力的任务。据介绍，Gemini Ultra是第一个在MMLU（大规模多任务语言理解）方面超越人类专家的模型，该模型综合使用数学、物理、历史、法律、医学和伦理学等57个科目来测试世界知识和解决问题的能力。Gemini Pro专为多...……更多

2023-12-07 16:15:00神仙,模型,观察,科技,模型,任务

迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测

... MMedC 上进⼀步预训练使模型性能相⽐于基线显著提升。大规模多语医疗语料（MMedC）构建在构建数据集方面，研究团队收集了一份多语言医疗语料库，命名为 MMedC。该数据集包含 255 亿 tokens，其内容来自于四个来源：1. 通过启发...……更多

2024-09-30 09:51:00多语,大规,模型,语料,基准,大规模

位列第一梯队，腾讯混元再度领跑国内大模型

...腾讯联合北京大学、北京科技大学共同完成的研究《面向大规模数据的Angel机器学习平台关键技术及应用》，也斩获2023中国电子学会科学技术奖一等奖，体现了腾讯深厚的自研技术积累。在应用上，腾讯混元大模型已经支持了腾...……更多

2024-05-06 16:52:00腾讯,梯队,模型,腾讯,模型,能力

谷歌推出其最先进AI模型Gemini，希望击败GPT-4

...间或使处理器过热。据介绍，Gemini Ultra是第一个在MMLU（大规模多任务语言理解）方面超越人类专家的模型，该模型综合使用数学、物理、历史、法律、医学和伦理学等57个科目来测试世界知识和解决问题的能力，谷歌在一篇博客...……更多

2023-12-07 10:21:00最先,模型,比斯,模型,哈萨,人工智能

多样任务真实数据，大模型在线购物基准Shopping MML

...于“亮剑”——联合香港科技大学、圣母大学构建了一个大规模、多任务评测基准Shopping MMLU，用以评估大语言模型在在线购物领域的能力与潜力。一直以来，想要完整建模在线购物相当复杂，主要痛点是：多任务性：在线购物...……更多

2024-11-21 09:45:00在线购物,基准,模型,任务,购物,数据

新扩散模型OmniGen一统图像生成，架构还高度简化、易用

...所示：为实现强大的通用和泛化能力，研究人员需要基于大规模和多样化的数据集训练模型。然而，在图像生成领域，尚无一个可用的通用数据集。为此，我们构建了首个大规模且多样化的统一图像生成数据集 X2I，意为「Anything...……更多

2024-10-30 09:53:00易用,架构,生成,模型,图像,高度

谷歌和微软两位“印度老乡”CEO，正面硬刚

...从Pixel 8 Pro设备开始支持。Gemini中最大Size的Ultra仍在完成大规模信任和安全检查的过程中，尚未全面公开发布。在其完善过程中，Ultra将向部分客户、开发者、合作伙伴以及安全和责任专家，以供相应人员进行早期试验、提供反...……更多

2023-12-08 16:29:00印度,微软,老乡,正面,模型,微软

清华提出时间序列大模型：面向通用时序分析的生成式Transf

...于起步阶段。近期，清华大学的研究团队基于Transformer在大规模时间序列上进行生成式预训练，获得了任务通用的时序分析模型，展现出大模型特有的泛化性与可扩展性时间序列提供了数据随时间变化的视角，对于理解复杂系统...……更多

2024-07-22 09:44:00时间序列,时序,清华,序列,生成,模型

AI一本正经地胡说八道有种办法可以识破它

...措辞得当，也基本符合官方通报的格式，导致了错误信息大规模传播。美国科技新闻网站 CNET 在三个月之内上线了 70 多篇用 AI 技术生成的新闻报道，却被发现其中存在大量基础性错误，包括计算错误、金融概念误解等，不得不...……更多

2024-12-23 17:03:00八道,一本,办法,水印,生成,文本

下载次数破39万！CMU、Meta联合发布VQAScore文

...valuation）来提升结果的准确性，但这种方式成本高、难以大规模应用，而且缺乏可复现性。在图片生成领域，已有多种方法使用模型来自动评估（Automated Evaluation）生成图像的表现，其中常见的指标包括CLIPScore、FID、LPIPS、PickSc...……更多

2024-11-07 09:53:00文生,次数,联合,方案,模型,文生

国产chatgpt何时能出？百度站出来了最快3月评分全球第一

...被国际顶级学术会议AAAI、IJCAI收录。ERNIE在工业界得到了大规模应用，如搜索引擎、新闻推荐、广告系统、语音交互、智能客服等。 ……更多

2023-02-07 22:57:00时能,评分,国产,全球,语义,全球

Llama 4训练已开启！Meta科学家最新采访，揭秘Lla

...到了一个有合适推理效率的平衡点。之所以做到405B这么大规模，其实原因很简单——我们想做出最好的模型，一个真正与GPT-4比肩的开源模型。（现在是GPT-4o了）虽然目前还没有完全达到目标，但差距正在逐渐缩小。正如小扎之...……更多

2024-07-29 09:33:00科学家,训练,科学,模型,训练,基准

疯狂一夜！美国AMD、谷歌纷纷亮出大杀器，人类迎来巨变前夜？

...，Gemini Ultra模型超越了现有最先进的GPT-4。其中，在MMLU（大规模多任务语言理解）测试中，Gemini Ultra以90.0%的成绩首次超过了人类专家，这一测试综合了数学、物理、历史等57个科目；此外在UltraMMMU多模态测试中也取得59.4%高分；...……更多

2023-12-07 13:02:00美国,人类,疯狂,焦点,媒体,英伟

关于LLM-as-a-judge范式，终于有综述讲明白了

...where to judge）。最后，我们归纳了评估 LLM 作为评判者的基准数据集，并强调了关键挑战和有希望的方向，旨在提供有价值的见解并启发这一有希望的研究领域的未来研究。论文链接：https://arxiv.org/abs/2411.16594 网站链接：https://llm...……更多

2024-12-04 09:49:00范式,模型,基准,偏见,数据,评估