性能,模型,模态,训练,数据,卷上头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

文档处理效能飙升！浩鲸科技“文档大模型”核心技术揭秘！

...卓越的多模态处理能力、广泛的文档格式兼容性和极致的性能优化，成为企业文档处理领域的得力助手。智能提取，精准高效：集成前沿 NLP 算法与模型，实现文档处理速度与精度的双重飞跃。抽取精度高达 98%，问答响应准确率...……更多

2024-09-26 13:36:00文档,效能,模型,核心,处理,技术

背水一战狙击GPT-4，谷歌最强大模型Gemini终发布，听

...员也都发文祝贺谷歌：△来源：X听说读写样样行，多项性能超越GPT-4，有任务首次超越人类 “Gemini，从第一天起就是多模态大模型——跨越文本、图像、视频、音频和代码的无缝推理。”谷歌官网上，这是介绍Gemini的第一句...……更多

2023-12-07 08:18:00全能,选手,模型,焦点,分析,模型

科学家打造多模态模型，7B和1.3B小模型均开源，可部署手机

... 1.3B 的小模型。研究人员表示：“DeepSeek-VL 1.3B 小模型的性能同样强悍，在部分指标上超越了 7B 模型。” 这些小模型可以满足算力缺乏型开发者使用，也更方便在手机等移动终端上部署。日前，相关论文以《DeepSeek-VL：面向真...……更多

2024-04-10 10:25:00模型,模态,终端,科学家,科学,手机

多模态模型评测框架lmms-eval发布！全面覆盖，低成本，

...CPM、InternVL 等开源领域模型也展现出了越来越接近闭源的性能。在这个「亩产八万斤」，「10 天一个 SoTA」的时代，简单易用、标准透明、可复现的多模态评估框架变得越来越重要，而这并非易事。为解决以上问题，来自南洋理...……更多

2024-08-22 09:50:00模态,框架,模型,评测,污染,成本

击败Gemini-1.5-Pro、GPT-4V，从容大模型多

...算资源，保证在处理大规模多模态数据时仍能保持较高的性能和响应速度，使得模型的训练过程更加高效，收敛速度更快，性能更稳定。同时也得益于云从科技长期在视觉、语言领域的深厚积累和不断创新。图 4：从容大模型 - 2...……更多

2024-06-29 09:36:00模态,从容,模型,能力,全球,模态

科学家开发多模态音乐理解和生成大模型，兼具理解和创作音乐能力

...，并解决版权和标注数据质量的问题，就能完成对该模型性能和表现的更进一步迭代。”Sun Chenshuo 表示。在后续研究中，他们将继续迭代优化模型性能，提升模型泛化性，以更好地适应国内用户的需求。参考资料：1.S., Liu, A., Hu...……更多

2024-04-09 10:25:00模态,音乐,科学家,生成,模型,创作

百万鲁棒数据训练，3D场景大语言模型新SOTA！IIT等发布

...泛化能力，在多个3D多模态学习基准测试中取得了优异的性能，超越了以往的方法，且无需针对特定任务的微调。多模态大语言模型（Multi-modal Large Language Models, MLLMs）以文本模态为基础，将其它各种模态对齐至语言模型的语义空...……更多

2024-10-16 13:35:00模型,场景,训练,语言,数据,物体

一文看尽Meta开源大礼包！全面覆盖图像分割、语音、文本、表

...。本次Meta更新了Meta Segment Anything Model 2.1 (SAM 2.1)权重，性能更强。开源链接：https://github.com/facebookresearch/sam2相比SAM2，研究人员引入了额外的数据增强技术来模拟视觉相似物体和小物体，并且通过……更多

2024-11-28 12:02:00一文,大礼包,大礼,安全性,语音,图像

大模型新趋势之MoE：现状、挑战及研究方向

...已成谷歌、OpenAI、阿里、腾讯等企业控制成本、提升模型性能、应对大模型“价格战”的新方向。MoE的内涵、优势、发展历程及主要玩家MoE（MixtureofExperts，混合专家模型）是一种用于提升深度学习模型性能和效率的技术架构。...……更多

2024-11-04 16:00:00研究方向,模型,现状,方向,趋势,研究

Gemini 开启大模型路线之争，新战场将“数流成河”

...变了大模型领域ChatGPT独领风骚的局面。Gemini 不仅在很多性能上超过了ChatGPT 4，它同时带来了另一种可能性：具有原生数据优势的互联网巨头，可能在多模态大模型竞争中占据优势。这意味着，谷歌、马斯克、Meta以及中国的腾讯...……更多

2023-12-15 10:02:00成河,战场,模型,路线,马斯,马斯克

阿里云CTO周靖人：全面投入升级AI大基建

...让数据中心成为一台超级计算机，为每个AI和应用提供高性能、高效的算力服务。大会现场，通义大模型迎来了年度重磅发布，基础模型升级，性能媲美GPT-4o，发布最强开源模型Qwen2.5系列，同时上架语言、音频、视觉等100多款全...……更多

2024-09-19 15:53:00阿里,基建,投入,升级,模型,通义

AI大模型行业报告：大模型发展迈入爆发期，开启AI新纪元（附

...展普遍呈现“规模定律”（Scaling Law）特征，即：模型的性能与模型的规模、数据集大小和训练用的计算量之间存在幂律关系，性能会随着这三个因素的指数增加而线性提高。大模型的参数规模远大于传统深度学习模型，传统模...……更多

2024-10-21 10:03:00模型,行业报告,新纪元,报告,发展,行业

苹果300亿参数大模型首亮相，还买了家AI公司｜焦点分析

...果更好的主要因素有：图像分辨率和图像标记数量对模型性能影响较大，比如更高清的图像，标注的细节越多，模型的效果就更好。视觉语言连接器对模型的影响较小，视觉语言连接器指的是可以将图像和文本结合起来，进行信...……更多

2024-03-16 18:14:00模型,苹果,参数,焦点,分析,公司

亚马逊连甩6款大模型！推出3nm AI训练芯片，最强AI服务

...Micro、Lite和Pro的价格至少比Amazon Bedrock中各自智能类别中性能最佳的模型便宜75%。它们也是Amazon Bedrock中各自智能类别中速度最快的模型。AWS称到2025年初，某些Nova模型的上下文窗口将扩展以支持超过200万个token。在基准测试中，M...……更多

2024-12-05 09:47:00亚马,亚马逊,芯片,模型,训练,服务器

清华团队提出大模型“密度定律”；足球领域首个视觉语言基础模型

...io/清华团队提出大模型“密度定律”大语言模型（LLM）的性能可随着模型规模的扩大而提高。然而，这种扩展给训练和推理效率带来了巨大挑战，特别是在资源有限的环境中部署 LLM 时，这种扩展趋势正变得越来越不可持续。在...……更多

2024-12-10 09:53:00模型,语言基础,清华,定律,密度,团队

零成本突破多模态大模型瓶颈！多所美国顶尖高校华人团队，联合推

...这说明模型所输出的负样本倾向于正样本，模型的误差和性能下界提升。通过可视化attention可以看到，CSR能使得LVLM更加偏重于视觉模型，同时能缓解文本attention中存在的上下文依赖问题。 ……更多

2024-06-21 09:21:00模态,美国,瓶颈,顶尖,模型,团队

联汇科技荣获2024人工智能隐形冠军企业标杆Top10

...及异构计算资源的整合，可以为企业级应用提供稳定、高性能的向量检索、聚类和分析等服务。多模态预训练大模型(OmModel)基于大规模自监督学习的多模态人工智能算法，融合语言和视觉模态理解，实现下一代认知域人工智能应...……更多

2024-07-18 14:19:00联汇,标杆,人工智能,人工,冠军,智能

度小满联合哈工大推出自适应剪枝算法实现多模态大模型高效优化

...SmartTrim。凭借精细化的剪枝策略，SmartTrim能够在保持模型性能的同时，大幅提升计算效率。自适应剪枝能力，智能识别并剪除不必要的计算负担在视觉语言大模型（VLM）的研究和应用中，高计算成本一直是制约其广泛部署的主要...……更多

2024-05-17 13:00:00模态,算法,模型,联合,模态,模型

腾讯开源最大MoE大语言模型！3D大模型同时支持文/图生成，

...thub等技术社区直接下载，免费可商用。腾讯云TI平台和高性能应用服务HAI也开放接入这两个模型，为模型的精调、API调用及私有化部署提供一站式服务。混元Large Hugging Face地址：https://huggingface.co/tencent/Tencent-Hunyuan-La……更多

2024-11-06 09:41:00模型,腾讯,全家,生成,同时,语言

苹果的封闭生态为大模型打开！发布开源多模态大模型、每天为 A

...对现有多模态大模型进行了基准测试，发现 Ferret 的平均性能较最出色的原有大模型高 20.4%，而且在物体识别的幻觉方面也有所减轻。概括来讲，Ferret 项目论文的贡献主要为以下三个方面：结束语很明显，苹果正在努力追赶这...……更多

2023-12-26 14:06:00模型,生态,模态,零碎,苹果,模型

Mistral放大招！124B多模态巨无霸登场，免费版Cha

...中，研究人员总结了Pixtral Large的5大亮点： SOTA的多模态性能在MathVista、DocVQA、VQAv2等任务上达到SOTA水平在不影响文本处理性能的前提下对Mistral Large 2进行扩展1230亿参数的多模态解码器，10亿参数的视觉编码器128K上下文窗口长度.……更多

2024-11-20 09:43:00巨无霸,免费版,模态,突袭,模型,生成

刚刚，我们感受了一波最「像人」的国产AI，模型还是开源的

...件。在 Phone Use 和 Web Browser Use 上，AutoGLM 都取得了大幅的性能提升。在 AndroidLab 评测基准上，AutoGLM 就显著超越了 GPT-4o 和 Claude-3.5-Sonnet 的表现。在 WebArena-Lite 评测基准中……更多

2024-10-26 09:49:00一波,模型,国产,还是,语音,模型

BEV“超融合”感知部署轻舟智航迈出量产从0到1的关键一步

...云大模型和车端BEV检测模型的输出结果，可快速发现模型性能问题，诸如车辆分类错误、行人漏检等，由此可以进行针对性的解决。同时，轻舟智航还提出了一种高效的跨模态知识蒸馏方法，可利用离线模型提升车端线上基于BEV...……更多

2023-11-01 20:27:00轻舟,关键,轻舟,模型,场景,数据

迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测

...h 上的准确率，图 d 展⽰了在 MMedC 上进⼀步预训练使模型性能相⽐于基线显著提升。大规模多语医疗语料（MMedC）构建在构建数据集方面，研究团队收集了一份多语言医疗语料库，命名为 MMedC。该数据集包含 255 亿 tokens，其内容...……更多

2024-09-30 09:51:00多语,大规,模型,语料,基准,大规模

多模态竞技场对标90B Llama 3.2！Pixtral

...lai首先，许多开源模型一般有个问题，就是为了多模态的性能而牺牲了本身的自然语言性能，之前英伟达的NVLM 1.0也谈到了这点。Pixtral本次也是成功避开了这个缺陷，单单比较文本模型的性能，也在同等尺寸的模型中居于前列。...……更多

2024-11-20 09:43:00模态,竞技场,竞技,报告,技术,模态

阿里国际发布最新开源多模态模型Ovis，多模态能力再升级

...著提升多模态问答、指令跟随等任务表现。4、卓越模型性能：Ovis展现出了优异的榜单表现。在多模态权威综合评测Opencompass上，Ovis1.6-Gemma2-9B在30B参数以下的模型中取得了综合排名第一，超过了Qwen2-VL-7B、MiniCPM-V-2.6等模型。尤其...……更多

2024-09-20 13:35:00模态,阿里,模型,能力,升级,国际

5项重大更新，NVIDIA助力人形机器人研发迈入新阶段

...rmer 引擎，其变压器引擎可提供 800 teraflops 的 8 位浮点 AI 性能，运行带宽达 100GB/s，AI 计算性能达 800TFLOPs，多层次规划能力卓越，以运行 GR00T 等多模式生成式 AI 模型。凭借集成的功能安全处理器、高性能 CPU 集群和 100GB 以太网……更多

2024-05-16 15:10:00人形,机器人,机器,阶段,更新,机器人