性能,模型,模态,训练,数据,卷上头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

llava-1.6与gpt-4vmp面硬刚的性能，一起来看看

...ro和阿里的Qwen-VL-Plus，与GPT-4V正面硬刚，这个有着SOTA级别性能的多模态大模型真正做到了“人无我有，人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后，2024年1月31日，微软研究院又联合威斯康星大学麦迪逊分校和哥...……更多

2024-02-10 21:04:00性能,模型,模态,训练,数据,卷上

英伟达开源NVLM 1.0屠榜多模态！纯文本性能不降反升

...达到了与GPT-4o和其他开源模型相媲美的水平，其在纯文本性能甚至超过了LLM骨干模型，特别是在文本数学和编码基准测试中，平均准确率提高了4.3个百分点。文本大模型经过多年的发展，逐渐发展成了统一的纯解码器Transformer架...……更多

2024-09-24 13:36:00英伟,模态,文本,性能,模态,模型

首个多模态连续学习综述，港中文、清华、UIC联合发布

...顺序训练时，新的任务训练会严重干扰之前学习的任务的性能，因为不受约束的微调会使参数远离旧任务的最优状态。尽管连续学习取得了重大进展，但大多数工作都集中在单一数据模态上，如视觉，语言，图，或音频等。这种...……更多

2024-11-14 09:46:00模态,清华,中文,联合,学习,模态

首个可保留情感的音频LLM！Meta重磅开源7B-Spiri

...据和任务上的泛化能力十分有限。在大型语言模型（LLM）性能不断提升的情况下，一个常用的方法是先用ASR模型将语音转录成文本，然后用文本模型来生成新的文本，最后再用TTS模型将文本转换成语音，这种流程的一个显著缺陷...……更多

2024-11-23 09:43:00音频,模态,重磅,文本,任务,情感

反击OpenAI，谷歌放出最强悍大模型Gemini

...示视频结果看，市面上现有的全部多模态大模型与Gemini的性能表现都有代际差，包括Meta 5月开源的跨6个模态的AI模型ImageBind以及GPT-4。图源：谷歌今年4月开始，随着多模态技术不断升级，以及叠加模型调用成本等性能的优化，GPT...……更多

2023-12-07 10:31:00强悍,模型,模态,模型,训练,能力

对比学习滥用隐私数据！中科院等发布「多步误差最小化」方法 |

...充分探索。本文首通过评估现有方法在图像-标题对上的性能来探索这一背景，由于在该场景中缺乏标签，之前的无法有效地推广到多模态数据，并且在建立捷径方面的效果有限。在本文中提出了多步误差最小化（MEM），这是一...……更多

2024-08-02 09:55:00误差,中科院,隐私,方法,数据,学习

迎战GPT-4V！谷歌PaLI-3视觉语言模型问世，更小、更

...基于 SigLIP 的 PaLI 在各种多模态基准测试中表现出卓越的性能，特别是在定位和文本理解方面。相关研究论文以“PaLI-3 Vision Language Models: Smaller, Faster, Stronger”为题，已发表到预印本网站 arXiv 上。研究团队认为，仅有 ……更多

2023-10-17 16:31:00更快,模型,视觉,语言,训练,模型

苹果公司公布“mm1”多模态大模型

...关键因素。研究表明，图像分辨率和图像标记数量对模型性能影响较大，视觉语言连接器对模型的影响较小，不同类型的预训练数据对模型的性能有不同的影响。据介绍，研究团队首先在模型架构决策和预训练数据上进行小规模...……更多

2024-03-16 18:48:00苹果公司,模态,模型,苹果,公司,模型

支持1024帧、准确率近100％，英伟达「LongVILA」

...，实验结果表明该研究在 VideoMME 和长视频字幕任务上的性能持续提高（图 2）。在 1024 帧上训练的 LongVILA 模型在 1400 帧的大海捞针实验中实现了 99.5% 的准确率，相当于 274k 个 token 的上下文长度。此外， MM-SP 系统可以有效地将...……更多

2024-08-22 09:51:00英伟,准确率,支持,视频,序列,训练

多模态模型免微调接入互联网，即插即用新框架，效果超闭源方案

...对搜索引擎的返回内容进行二次筛选。Gemini Pro 1.5(LC）的性能高于内嵌互联网检索增强的GPT-4V和GPT-4o，但是长上下文会引入额外的计算消耗，并引入一些不必要的信息对模型造成误导。经过SearchLVLMs的分层过滤模型进行二次筛选...……更多

2024-11-11 13:34:00模态,接入,框架,模型,效果,互联网

Meta首款多模态Llama 3.2开源！1B羊驼宝宝，跑在

...些查询留在设备上，哪些可能需要由云端的更大模型处理性能评估结果显示，Llama 3.2视觉模型在图像识别等任务上，与Claude 3 Haiku和GPT-4o mini不相上下。3B模型在遵循指令、总结、提示词重写和工具使用等任务上，表现优于Gemma 2 2...……更多

2024-09-27 13:39:00模态,宝宝,模型,图像,训练,文本

别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩

...的关键在于通过改进半监督学习技术来提高模型情感识别性能，比如预测情绪类别的准确率。自 5 月大赛启动起，两个月时间，来自全球近百支参赛队伍展开了角逐，既不乏知名高校也有创企新势力。其中Semi 赛道第一名由社交...……更多

2024-08-01 09:34:00模态,拟人,玩家,模态,情感,模型

林达华谈大模型发展之路：未来会有更高效的模型结构出现

...良好训练的MoE可取得比同等激活参数量的稠密模型更好的性能。“但这仅仅是一个起点，未来还会有更加高效的稀疏模型结构出现。”林达华表示，这些架构现在还停留在学术研究阶段，但随着验证的逐渐成功，它们会慢慢进入...……更多

2024-03-25 10:53:00林达,模型,之路,结构,发展,模型

美国东北大学提出视频数据增强方法，能让视频模型学到更好的表征

...察到了完全相反的现象，即这种操作能让视频理解模型的性能和泛化性得到提升。通过进一步地分析其在不同模态数据下（图像/视频）表现差异的原因，他们发现对于视频理解来说，被识别对象的静态外观并不是很重要，有时...……更多

2024-05-07 10:12:00东北大学,视频,美国,模型,方法,数据

比ChatGPT省电10倍 Google研训练AI模型新方法

...emma 2等模型表明，更少但高品质的数据可以实现更强大的性能。若要筛选出高品质的数据，关键是需创建有效的数据渠道。现在大致分为手动管理和基于模型的数据管理方法，但前者成本高且难以扩展，而后者则有望为多模态大...……更多

2024-07-09 17:41:00模型,训练,方法,数据,模型,人工智能

北大推出全新机器人多模态大模型！面向通用和机器人场景的高效推

...识任务和机器人相关任务的推理能力，并都取得了先进的性能表现。同时，本文发现当 RoboMamba 具备强大的推理能力后，我们可以通过极低的训练成本使得 RoboMamba 掌握多种操纵位姿预测能力。论文：RoboMamba: Multimodal State Space Mo...……更多

2024-06-21 09:52:00机器,模态,人多,机器人,推理,北大

全模态对齐框架align-anything来啦：实现跨模态指

...态的全面评估和改进。全模态大模型与全模态对齐大模型性能的最后一块拼图人类在日常生活中接收到的信息往往是全模态的，不同的感官渠道能够互相补充，帮助我们更全面地理解和表达复杂的概念。这种全模态的信息流对...……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据

科学家研发自动驾驶新模块，让自动驾驶场景理解更接近人类认知

...驶基于黑盒化的深度学习模型，因此如何提高模型的驾驶性能、以及提高模型的可解释性，是一个急需解决的问题和痛点。现有的大量方法都是端到端自动驾驶，徐冬阳和所在团队详细分析模型结构之后发现，此前人们并没有很...……更多

2024-04-11 10:53:00驾驶,认知,科学家,模块,场景,人类

清华教授唐杰：Scaling Laws虽被质疑，但至今仍是提

...也是备受关注的问题。唐杰认为，缩放定律描述了大模型性能与其参数量、数据规模、计算量之间的关系。虽然备受质疑，但直到今天，可能高质量的缩放仍然是提高大模型性能的重要方法。“一方面，这几个因素相互关联，参...……更多

2024-06-05 18:36:00清华,模型,教授,性能,方法,模型

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构

...过了GPT-4V和Claude-3-Sonnet（表2）。虽然模型在微调后出现性能提升属于正常现象，但这种微调效率可以侧面证明合成数据的潜力，尤其是在质量、有效性和多样性方面。除了在原基准上有所进步，微调后的模型在ChatQA、MathVista这...……更多

2024-08-08 16:23:00模态,领衔,基准,推理,视觉,能力

“智算融合共创未来”——开普云AI战略暨新产品发布会召开

...环境。推理一体机：该款一体机聚焦于为客户提供高性能全场景推理算力，产品预置了完备的大模型推理工具集，可大幅提高部署运维大模型推理应用的便利性，通过重构算子等一系列深度优化，极大提升推理算力效率，释...……更多

2024-04-11 10:30:00新产,开普,共创,共创未来,发布会,新产品

浪潮信息推出as13000g7-n系列

...达到极致，减少不必要的资源浪费，训练阶段的数据读写性能成为重中之重。而想要提升算力利用率、降低模型训练成本，必须要在数据存储性能上进行创新。AS13000G7-N系列具备强大的端到端性能优化能力，这也是模型训练阶段...……更多

2024-06-16 10:27:00浪潮信息,浪潮,信息,模型,数据,训练

大模型重构生命科学！最大基础模型面世，解锁DNA超长序列

...泛化能力，因此在各种关键问题和任务的解决上有更强的性能和准确性。换句话说，大模型时代Scaling Laws，其实在生命科学领域也同样奏效。截至目前，xTrimo基础大模型平台在200个任务模型达到SOTA水平，并利用这些任务模型实...……更多

2024-11-07 09:50:00模型,重构,生命科学,序列,生命,基础

vivo发布自研大模型，为用户和开发者带来诸多惊喜

...对全模态大模型端侧化，vivo从算法模型设计，到量化、性能瓶颈分析工具建设，再到底层运行时异构方案设计和业务框架层灵活的多业务部署架构建设，提供了完整的解决方案。通过软硬件协同，充分挖掘芯片潜力，确保大模...……更多

2024-10-14 01:53:00开发者,模型,惊喜,用户,开发,模型

奥林匹克竞赛里选最聪明的AI：Claude-3.5-Sonn

...牌数量对模型进行排序，如果金牌数量相同，则按照整体性能分数来排序。实验结果表明：Claude-3.5-Sonnet在整体表现上与GPT-4o相比极具竞争力，甚至在一些科目上超过了GPT-4o（比如在物理、化学和生物学上）。 Gemini-1.5-Pro和GPT-4V...……更多

2024-06-25 09:45:00奥林,奥林匹克,竞赛,模型,推理,能力

面壁智能发布2B模型：适配主流手机，推理成本仅为GPT-4的

...型的Scaling Law（规模定律）已指出，参数规模是决定模型性能的最关键因素。如何用更小的参数规模，达到比肩大模型的性能，是需要解决的难题。“以小博大”的励志故事，2023年9月发生在法国AI独角兽Mistral上。其发布的开源...……更多

2024-02-03 16:03:00适配,推理,模型,主流,成本,智能

文档处理效能飙升！浩鲸科技“文档大模型”核心技术揭秘！

...卓越的多模态处理能力、广泛的文档格式兼容性和极致的性能优化，成为企业文档处理领域的得力助手。智能提取，精准高效：集成前沿 NLP 算法与模型，实现文档处理速度与精度的双重飞跃。抽取精度高达 98%，问答响应准确率...……更多

2024-09-26 13:36:00文档,效能,模型,核心,处理,技术

背水一战狙击GPT-4，谷歌最强大模型Gemini终发布，听

...员也都发文祝贺谷歌：△来源：X听说读写样样行，多项性能超越GPT-4，有任务首次超越人类 “Gemini，从第一天起就是多模态大模型——跨越文本、图像、视频、音频和代码的无缝推理。”谷歌官网上，这是介绍Gemini的第一句...……更多

2023-12-07 08:18:00全能,选手,模型,焦点,分析,模型

科学家打造多模态模型，7B和1.3B小模型均开源，可部署手机

... 1.3B 的小模型。研究人员表示：“DeepSeek-VL 1.3B 小模型的性能同样强悍，在部分指标上超越了 7B 模型。” 这些小模型可以满足算力缺乏型开发者使用，也更方便在手机等移动终端上部署。日前，相关论文以《DeepSeek-VL：面向真...……更多

2024-04-10 10:25:00模型,模态,终端,科学家,科学,手机

多模态模型评测框架lmms-eval发布！全面覆盖，低成本，

...CPM、InternVL 等开源领域模型也展现出了越来越接近闭源的性能。在这个「亩产八万斤」，「10 天一个 SoTA」的时代，简单易用、标准透明、可复现的多模态评估框架变得越来越重要，而这并非易事。为解决以上问题，来自南洋理...……更多

2024-08-22 09:50:00模态,框架,模型,评测,污染,成本

page 1/2667 首页上一页 12 3 4 5 6 下一页末页

更多关于科技的资讯：

微视频｜白石山云端徒步！悬崖咖啡厅打卡绝了

走到白石山巅的尽头，这家建在悬崖边的“云端咖啡厅”绝对让你惊呼。

2025-10-03 11:37:00

“泰康百万药无忧”重磅上市完善院外购药健康防护网

泰康人寿发布新品“泰康百万药无忧（庆典版）医疗保险”（以下‬简称“百万药无忧”），以广覆盖、易投保、强保障、低费率为优势

2025-10-03 09:17:00

厦门市一体化数字资产管理平台获数据治理最佳实践奖

厦门网讯（厦门日报记者翁华鸿通讯员林雨新）在近日举行的2025全球数据管理峰会“数据要素分论坛暨大数据统计与人工智能技术创新管理研讨会”上

2025-10-03 08:38:00

兴趣-实践-视野：达芬奇金奖少年带来的教育启示录

摘要：2025“你是达芬奇”全球青少年科学与艺术创新赛圆满落幕，其中金奖获奖少年的亲身实践告诉我们，在AI赋能的新时代

2025-10-02 16:22:00

单日调用近1万亿次，高德助力北斗规模化民用跨入新量级

2025年10月1日，随着国庆长假首日出行高峰的到来，高德基于北斗卫星导航系统的定位数量接近1万亿次，支撑导航总里程数超90亿公里

2025-10-02 22:31:00

铬铁镍铁利用突破太钢实现降本6800万元

10月1日，从太钢获悉，今年以来，太钢不锈进料加工团队以“精准备案、高效协同”为核心，在进料铬铁镍铁资源利用方面取得突破性进展

2025-10-02 17:39:00

打开“鼓浪屿元宇宙”微信小程序 AI导游带您畅游鼓浪屿

厦门网讯（厦门日报记者林露虹）记者昨日从中国移动咪咕公司获悉，该公司打造的“鼓浪屿AI伴游”服务已正式上线。市民和游客只需打开“鼓浪屿元宇宙”微信小程序

2025-10-02 08:57:00

“中国脑机谷”落户新奥新智感知产业园政企研协同构建脑机接口

河北新闻网讯（张新）9月26日，脑机接口产业联盟首届“脑机接口50人论坛”暨天津脑机接口产业创新发展推进会举办。会上，由新奥集团旗下的天津新智感知科技有限公司

2025-10-01 08:40:00

国网三明供电公司：守护灯火庆华诞主动运维显担当

国网三明供电公司检修人员及时更换损坏器件并调整传动系统并完成设备修复及全套试验。（纪长添摄）东南网10月1日讯 9月28日

2025-10-01 09:19:00

第三届“星瀚杯”法律课公益大赛启动腾讯云提供智能体开发平台

9月26日，由华东政法大学与上海星瀚律师事务所联合主办的第三届“星瀚杯”走进企业的法律课公益大赛正式启动。腾讯云作为大赛的技术支持单位

2025-10-01 09:56:00

平望实小承办吴江区骨干教师（数学）讲学团活动

为进一步发挥吴江区骨干教师的示范和辐射作用，推进课堂教学改革，有效提升教师教学业务能力。2025年9月24日，由苏州市吴江区教师发展中心主办的2025年吴江区骨干教师（数学）讲学团活动在平望实验小学举行

2025-10-01 09:58:00

AI技术让抗战文物“活起来”，人民日报数字传播联合百度推抗战

9月30日，由人民日报数字传播与中国国家博物馆、中国人民大学、百度文心大模型、百度百科联合出品的《80年，80件》智能体和3D文物词条正式上线

2025-10-01 10:00:00

新时达2025工博会圆满落幕 | STEP 2.0战略引领智

2025年9月23日至27日，第二十五届中国国际工业博览会在国家会展中心（上海）盛大举行。新时达以"智拓无界共创未来"为主题

2025-10-01 10:00:00

从课堂到产线，河北工大学子开展智慧物流与“地狼”系统自动化技

河北新闻网讯（胡广涛）组装调试机器人、体验智慧仓储系统、探索自动化技术前沿……近日，河北工业大学人工智能与数据科学学院2022级自动化专业全体学生在廊坊分校

2025-10-01 11:12:00

数字技术活化传统音乐明代魏氏乐虚拟乐器音源全球首发

中国青年报客户端讯（中青报·中青网记者夏瑾）9月30日，由湖州师范学院音乐学院、湖州市音声数据挖掘与智能服务重点实验室主办的“1617系列明代魏氏乐虚拟乐器音源”全球发布会在浙江省杭州市举办

2025-10-01 14:11:00

头条订阅服务