强悍,模型,模态,模型,训练,能力头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

反击OpenAI，谷歌放出最强悍大模型Gemini

...之久的GPT4真正竞品，也是目前谷歌能拿出手的功能最为强悍、适配最为灵活的大模型，包括三种不同套件，分别是Gemini Ultra, Gemini Pro和Gemini Nano。其中Ultra的能力最强，复杂度最高，能够处理最为困难的多模态任务；Pro能力稍弱...……更多

2023-12-07 10:31:00强悍,模型,模态,模型,训练,能力

科学家打造多模态模型，7B和1.3B小模型均开源，可部署手机

...模型。研究人员表示：“DeepSeek-VL 1.3B 小模型的性能同样强悍，在部分指标上超越了 7B 模型。” 这些小模型可以满足算力缺乏型开发者使用，也更方便在手机等移动终端上部署。日前，相关论文以《DeepSeek-VL：面向真实世界的...……更多

2024-04-10 10:25:00模型,模态,终端,科学家,科学,手机

背水一战狙击GPT-4，谷歌最强大模型Gemini终发布，听

...其进行微调，以进一步提升其能力。在性能上，Gemini相当强悍。Google放出了一系列测试结果，从自然图像、音频和视频理解到数学推理，在大型语言模型 (LLM) 研发中使用的32个广泛使用的学术基准上，Gemini Ultra的性能在30项上都...……更多

2023-12-07 08:18:00全能,选手,模型,焦点,分析,模型

中国也有Sora同款训练架构公司，清华班底，智谱也投了 |

...雨编辑 | 邓咏仪全球首家发布Sora同款底层架构的清华系模型公司，近期完成了新一轮融资。投资名单中，也出现了大模型独角兽智谱AI的身影。36氪获悉，近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明...……更多

2024-03-14 15:12:00清华,班底,中国,架构,训练,公司

让大模型能听会说,国内机构开源首个端到端语音对话模型Mini

...非与启元世界多模态负责人吴昌桥，研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。随着多类型大模型的飞速发展，全球 AI 已经进入到了多模交互时代。2024 年 5 月，OpenAI 推出了全新的多模...……更多

2024-09-07 09:44:00模型,语音,对话,机构,语音,文本

“智算融合共创未来”——开普云AI战略暨新产品发布会召开

...展示了在AI领域的综合实力。开普云已构建从数据治理、模型训练、产品研发到运维服务的全流程能力体系，开发出多款大模型平台级产品及AI智能应用类产品，并以全系列AI一体机产品，为大模型应用客户和大型智算中心客户提...……更多

2024-04-11 10:30:00新产,开普,共创,共创未来,发布会,新产品

手机上能跑的「GPT-4V」来啦！多图、视频理解首次上端！面

...步骤，还能根据说明书和工具箱帮你找到合适的工具。2. 强悍的多图复杂推理能力，竟能读懂你的梗！得益于强大的多图复杂推理能力，MiniCPM-V 2.6 不仅能联合识别多张图片的表面信息，还能「读懂」梗图背后的槽点。比如让模...……更多

2024-08-07 09:42:00多图,小钢炮,模态,上端,手机,视频

北大推出全新机器人多模态大模型！面向通用和机器人场景的高效推

...为刘家铭博士，研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真，研究方向为视觉基础模型与机器人操纵。指导老师为仉尚航，北京大学计算机学院研究员、博士生导师、博雅青年学者...……更多

2024-06-21 09:52:00机器,模态,人多,机器人,推理,北大

别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩

...利用少量有标签和大量无标签数据视频数据来训练自己的模型，并对模型在无标签数据集上的表现和泛化能力进行评估。该赛道获胜的关键在于通过改进半监督学习技术来提高模型情感识别性能，比如预测情绪类别的准确率。自...……更多

2024-08-01 09:34:00模态,拟人,玩家,模态,情感,模型

llava-1.6与gpt-4vmp面硬刚的性能，一起来看看

...-Plus，与GPT-4V正面硬刚，这个有着SOTA级别性能的多模态大模型真正做到了“人无我有，人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后，2024年1月31日，微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大学的研...……更多

2024-02-10 21:04:00性能,模型,模态,训练,数据,卷上

CybotStar——大模型一站式应用开发平台

...的基础层由CPU、GPU、TPU等算力系统组成，为整个体系提供强悍的算力支撑，支撑企业级API高强度的算力调用；中间层内置了机器学习自动部署平台，集成了国内外多个基础型大模型，支持模型全流程高效的训练和部署；上层则是...……更多

2024-08-30 14:57:00应用开发,模型,应用,开发,平台,模型

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构

...的关注，但最近浙大、中科院等机构的学者们提出，先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准，并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型，似乎都很难完成更抽象层...……更多

2024-08-08 16:23:00模态,领衔,基准,推理,视觉,能力

迎战GPT-4V！谷歌PaLI-3视觉语言模型问世，更小、更

...况，这一举动引起了业界的广泛关注。然而，在视觉语言模型的角逐中，谷歌也不甘示弱。近日，Google Research、Google DeepMind 和 Google Cloud 共同推出了一个更小、更快、更强大的视觉语言模型（VLM）——PaLI-3，该模型与相似的体...……更多

2023-10-17 16:31:00更快,模型,视觉,语言,训练,模型

北京人工智能数据运营平台发布

...工智能研究院理事长、北京大学教授黄铁军表示，构建大模型生态首先要建立数据流通机制，推动从数据到智能的正反馈。汇聚数据超700万亿字节“如果没有开源数据集，很难想象人工智能怎样才能实现如此快速的迭代，然而，...……更多

2024-06-16 04:14:00人工智能,北京,人工,运营,智能,数据

科学家开发多模态音乐理解和生成大模型，兼具理解和创作音乐能力

“同行们认为我们用大模型把音乐理解和生成结合在一起的想法比较新颖，论文也是多模态大模型领域的先期工作之一。并且，除了大模型本身，我们提出的针对模型训练的数据集制作流程和整理的数据集，对学术界也具有较...……更多

2024-04-09 10:25:00模态,音乐,科学家,生成,模型,创作

度小满联合哈工大推出自适应剪枝算法实现多模态大模型高效优化

多模态大模型是当下很火的一种创新技术，加快对多模态大模型技术的布局，可进一步提高金融服务效率，缓解行业发展困境。为了攻克创新技术领域的难题，度小满联合哈尔滨工业大学共同研发出一种创新的自适应剪枝算法...……更多

2024-05-17 13:00:00模态,算法,模型,联合,模态,模型

智谱AI发布视频生成大模型，B站参与研发，亦庄提供算力｜甲子

视频大模型进入百模大战。今年是“视频生成”大模型爆发元年。在过去两个月，我们看到了快手可灵、商汤Vimi、Luma AI、爱诗科技Pixverse、Runway Gen-3等等视频大模型的你追我赶。但上半年的视频生成大模型公司，往往只聚焦在...……更多

2024-07-27 09:30:00亦庄,甲子,生成,模型,视频,模型

林达华谈大模型发展之路：未来会有更高效的模型结构出现

大模型的上下文长度快速增长，超长上下文解锁新应用，但推理计算代价高昂，上下文本身对于信息不会进行压缩，不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年，人工智能领域风起...……更多

2024-03-25 10:53:00林达,模型,之路,结构,发展,模型

支持1024帧、准确率近100％，英伟达「LongVILA」

现在，长上下文视觉语言模型（VLM）有了新的全栈解决方案 ——LongVILA，它集系统、模型训练与数据集开发于一体。现阶段，将模型的多模态理解与长上下文能力相结合是非常重要的，支持更多模态的基础模型可以接受更灵活...……更多

2024-08-22 09:51:00英伟,准确率,支持,视频,序列,训练

科学家研发自动驾驶新模块，让自动驾驶场景理解更接近人类认知

...，可以迅速地定位在关键区域。为了提高端到端自动驾驶模型的可解释性，该团队首次引入人类驾驶员的注意力机制。通过预测当前上下文中的驾驶员注意区域，他们将其作为一个掩码来调整原始图像的权重，从而使自动驾驶车...……更多

2024-04-11 10:53:00驾驶,认知,科学家,模块,场景,人类

清华领衔发布多模态评估MultiTrust：GPT-4可信度

...专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型（MLLMs）因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手，还逐渐渗透到自动驾驶、医学诊断等各大应用领域，掀...……更多

2024-07-25 09:31:00模态,清华,可信度,领衔,可信,几何

深数所发布500个行业多模态算料集

...“深数所”）发布了500个垂直行业多模态算料集，按照大模型应用的不同阶段（训练、推理、调优），有的放矢地提供数据源，让国产大模型厂商“寻数有路”。此次深数所发布的首批500个人工智能大模型高质量训练数据集，由...……更多

2024-04-13 01:58:00模态,行业,数据,模型,模态,人工智能

苹果公司公布“mm1”多模态大模型

...dalLLMPre-training》的论文，其中介绍了一款“MM1”多模态大模型，该模型提供30亿、70亿、300亿三种参数规模，拥有图像识别和自然语言推理能力。IT之家注意到，苹果研究团队相关论文主要是利用MM1模型做实验，通过控制各种变量...……更多

2024-03-16 18:48:00苹果公司,模态,模型,苹果,公司,模型

零成本突破多模态大模型瓶颈！多所美国顶尖高校华人团队，联合推

新智元报道编辑：LRST【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题，传统偏好学习方法依赖可能不适配的外源数据，存在成本和质量问题。Calibrated Self-Rewarding（CSR）框架通过自我增强学...……更多

2024-06-21 09:21:00模态,美国,瓶颈,顶尖,模型,团队

给机器人装上大模型大脑，「若愚科技」获超5000万天使轮融资

文｜武静静编辑｜邓咏仪36氪获悉，多模态大模型公司「若愚科技」完成超5000万天使轮融资，本轮融资由东方精工领投，昆仲跟投，源合资本担任独家融资顾问。公司称，资金将主要用于产品研发，业务拓展以及团队搭建等方...……更多

2024-03-21 05:19:00机器人,融资,大脑,模型,机器,天使

银河通用王鹤：用三维视觉小模型+基础大模型实现具身智能

...但很可能永远都达不到；有专家认为，大家对大数据和大模型关注度太高了，现在的人形机器人应该更多关注机器人本体。而关于具身智能，身为北京大学计算机学院前沿计算研究中心（CFCS）助理教授、博士生导师，同时又是...……更多

2024-04-15 10:13:00模型,三维,银河,视觉,智能,基础

清华教授唐杰：Scaling Laws虽被质疑，但至今仍是提

清华大学计算机系讲席教授、人工智能研究院基础模型研究中心主任唐杰出品｜搜狐科技作者｜郑松毅2024年已过半，大模型之争热度不减，通往AGI的路究竟该怎么走？近日，清华大学计算机系讲席教授、人工智能研究院基础模...……更多

2024-06-05 18:36:00清华,模型,教授,性能,方法,模型

奥林匹克竞赛里选最聪明的AI：Claude-3.5-Sonn

...工智能实验室 (GAIR Lab) 的研究团队，主要研究方向是：大模型训练、对齐与评估。团队主页：https://plms.ai/AI技术日新月异，近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立...……更多

2024-06-25 09:45:00奥林,奥林匹克,竞赛,模型,推理,能力

最强国产多模态刚刚易主！腾讯混元把GPT-4/Claude-

国产大模型，多模态能力都开始超越GPT-4-Turbo了？？权威榜单，中文多模态大模型测评基准SuperCLUE-V，新鲜出炉：特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B，分别成为国内闭源和开源界两大领跑者，甚至超过Claude-3.5-Sonnet..……更多

2024-08-09 09:38:00模态,腾讯,国产,模态,腾讯,元宝