性能,模型,模态,训练,数据,卷上头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...表示，在此次生成式视频模型的研发中，坚信大模型最终性能主要与计算量、模型参数量和训练数据量相关的Scaling Law定律，继续在算法和数据两方面发挥作用。“我们积极在模型层面探索更高效的scaling方式。随着算法、数据不...……更多

2024-07-27 14:18:00视频,杜甫,生成,模型,模型,模态

感官协同配合的精细操纵，人大胡迪团队探索机器人模态时变性挑战

...所有设置上均优于所有基线方法。MS-Bot 在两个任务中的性能超过了使用自注意力（Self Attention）进行动态融合的 MULSA 基线，这表明 MS-Bot 通过在融合过程中基于对当前阶段的细粒度状态的理解更好地分配模态权重，而没有显示阶...……更多

2024-11-09 09:53:00胡迪,模态,感官,变性,机器人,团队

GPT-4o的识图能力有多牛？四大维度深度体验

...技播客主持人DwarkeshPatel采访时透露，后训练是提高模型性能的关键因素。GPT-4o的识图能力有多牛？四大维度深度体验基于图片类型，记者将识图功能的测评分为4大维度，分别为普通图像、特定专业领域的图像、数据图像和手写...……更多

2024-05-19 14:21:00维度,深度,能力,体验,模型,训练

清华全球最大双臂机器人扩散大模型RDT，懂调酒能遛狗，登顶热

...扩展性（scalability）。换言之，扩大模型的参数量，它的性能也要跟着一起涨。二是，在之前的研究中，尚没有一个公认的在多种机器人数据上训练的方案。这主要是因为不同机器人的硬件结构和传感器不同，进而导致数据的格...……更多

2024-10-21 09:55:00清华,双臂,机器人,模型,机器,全球

中国也有Sora同款训练架构公司，清华班底，智谱也投了 |

...雨编辑 | 邓咏仪全球首家发布Sora同款底层架构的清华系模型公司，近期完成了新一轮融资。投资名单中，也出现了大模型独角兽智谱AI的身影。36氪获悉，近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明...……更多

2024-03-14 15:12:00清华,班底,中国,架构,训练,公司

斯坦福AI团队抄袭国产大模型？连识别“清华简”都抄了！清华系

...只花500美元训练，就能实现在多个基准测试中比肩GPT-4的性能。但很快有人发现，该模型跟清华系大模型创企面壁智能5月发布的MiniCPM-Llama3-V 2.5模型有不少相似处，而且没有任何相关致谢或引用。一开始团队面对抄袭质疑还嘴硬...……更多

2024-06-04 14:35:00清华,斯坦,斯坦福,团队,模型,抄袭

手机上能跑的「GPT-4V」来啦！多图、视频理解首次上端！面

...凭借8B参数，已经取得单图、多图、视频理解三项SOTA ，性能全面对标GPT-4V。再次刷新端侧多模态天花板，面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新！仅8B参数，取得 20B 以下单图、多图、视频理解 3 SOTA 成绩，一举将端侧AI多模态...……更多

2024-08-07 09:42:00多图,小钢炮,模态,上端,手机,视频

MMMU华人团队更新Pro版！多模态基准升至史诗级难度：过滤

...更严格地评估模型的多模态理解能力；模型在新基准上的性能下降明显，表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型（MLLMs）在各个排行榜上展现的性能不断提升，例如GPT-4o在大学水平上的多学...……更多

2024-09-18 13:31:00模态,史诗,基准,难度,问答,文本

AI也会「刷抖音」！清华领衔发布短视频全模态理解新模型 |

...模态任务上表现优异，更在视听联合任务中展现了卓越的性能，证明了其全面性和准确性。想要看懂短视频，除了视觉内容外，语音和音频等听觉信息，如视频音乐、音效、语音内容等，也对短视频的理解起到关键作用。音视频...……更多

2024-08-01 09:45:00模态,清华,领衔,模型,视频,音视

深数所发布500个行业多模态算料集

...“深数所”）发布了500个垂直行业多模态算料集，按照大模型应用的不同阶段（训练、推理、调优），有的放矢地提供数据源，让国产大模型厂商“寻数有路”。此次深数所发布的首批500个人工智能大模型高质量训练数据集，由...……更多

2024-04-13 01:58:00模态,行业,数据,模型,模态,人工智能

吉利星睿AI大模型正式发布引领中国汽车进入全场景AI时代

...极端场景数据集ACDC（包含雨、雾、雪、夜等复杂场景）性能验证中，星睿AI DRIVE大模型均拿下实时排行榜第一名，位于国际领先水平。强大的AI大模型，自然离不开强大的算力底座。星睿AI大模型基于全球首个“云、数、智”一...……更多

2024-01-11 11:18:00吉利,中国,模型,场景,时代,汽车

【产业互联网周报】字节回应被曝秘密利用OpenAI；英特尔预

...PT”。据透露，该团队的任务是在今年年底前达到GPT-3.5的性能，在2024年年中达到GPT-4的性能。目前Seed大约有2000亿个参数。相比之下，GPT-3.5有1750亿个参数。阿里云首席商业官蔡英华离职阿里云首席商业官蔡英华（花名：华琰）...……更多

2023-12-18 22:02:00马斯,英特,英华,马斯克,英特尔,阿里

群核科技（酷家乐）陈卓：用多模态AI助理赋能设计产业，用合成

...常长，往往会耗费大量的时间和资源，但通过云端部署高性能计算的方式，通过GPU+AI，让设计渲染速度比传统软件快几十倍甚至上百倍，并实现所见即所得的实时渲染效果。在过去十几年的时间里，群核科技的算力和数据得到了...……更多

2024-05-28 09:06:00家乐,模态,生产力,助理,大会,产业

让机器人拥有人一样潜意识，英伟达1.5M小模型就能实现通用控

当机器人也有潜意识。大模型固然性能强大，但限制也颇多。如果想在端侧塞进 405B 这种级别的大模型，那真是小庙供不起大菩萨。近段时间，小模型正在逐渐赢得人们更多关注。这一趋势不仅出现在语言模型领域，也出现在...……更多

2024-11-01 09:28:00拥有人,英伟,潜意识,机器人,模型,机器

疯狂一夜！美国AMD、谷歌纷纷亮出大杀器，人类迎来巨变前夜？

...oud TPU v5p。谷歌表示，在六项基准测试中，大杯的Gemini Pro性能表现优于GPT-3.5；而在30项性能基准测试中，超大杯Gemini Ultra超越了目前最强模型GPT-4。甚至，Gemini Ultra在MMLU测试上得分高达90.0%，即数学、物理、法律等57个领域测试.……更多

2023-12-07 13:02:00美国,人类,疯狂,焦点,媒体,英伟

小红书技术副总裁王晓博：大模型让AI越来越像人，更懂小红书的

...行的高效率训练，同时自研了RLHF框架，相较于开源框架性能和收敛稳定性都有提升。推理上我们做了W4A8模型压缩，结合算子优化整体性能超过开源框架20%左右。“王晓博介绍道。最后，王晓博表示：“人工智能技术在多模态、A...……更多

2024-07-08 14:43:00小红,越来,副总,模型,越来越,内容

Kimi爆火背后：访问量仅次于文心一言和阿里通义，国内外大模

...模型等。这些方式虽然能提升上下文窗口长度，但对模型性能均有不同程度的损害，换言之都是通过牺牲模型其他方面的性能来换取更长的上下文窗口。因此，如何在提高上下文支持长度的同时，保证处理能力的提升是目前业界...……更多

2024-03-23 14:00:00卷上,通义,阿里,文心,下文,模型

阿里云发布通义千问2.5，性能赶超GPT-4 Turbo

...历史性时刻。5月9日，阿里云正式发布通义千问2.5，模型性能全面赶超GPT-4 Turbo，成为地表最强中文大模型。同时，通义千问1100亿参数开源模型在多个基准测评收获最佳成绩，超越Llama-3-70B，成为开源领域最强大模型。历经一年...……更多

2024-05-09 12:00:00通义,阿里,性能,通义,模型,阿里

大模型到了该「验收」的时候

...Turbo版本的混元大模型，定价仅为前一代Pro版本的一半。性能更强、价格更低，这是大模型是深入落地场景的前提。走进场景的第一步：找到场景解决问题的第一步是，定义问题，而落地场景的第一步是，明确场景。大模型的核...……更多

2024-09-19 10:07:00验收,模型,时候,模型,腾讯,知识

首届空天信息技术大会开幕，发布全球首个百亿级遥感解译基础模型

...热能扩散过程，从而使该架构有效突破了遥感模型推理的性能和速度瓶颈，计算速度较传统结构模型提升2.4倍以上。孙显表示，“目前传统的、用于处理遥感图像的基础模型架构（transformer结构）本质上是基于文本处理架构发展...……更多

2024-09-23 11:53:00空天,遥感,首届,模型,大会,基础

全球最强开源大模型Llama 3发布：使用15T数据预训练，

...表现。此外，Meta 也测试了 Llama 3 在真实世界场景中的性能。他们专门开发了一个新的高质量人类评估集，该评估集包含 1800 个提示，涵盖 12 种关键用例（征求建议、头脑风暴、分类、封闭式问题解答、编码、创意写作、提取...……更多

2024-04-20 11:03:00模型,训练,参数,数据,全球,模型

国产GPU万卡集群终于来了！摩尔线程CEO张建中：做难而正确

...，通用型算力才具备更强的抗风险能力。三是AI、3D、高性能计算（HPC）跨技术与跨领域融合加速，推动空间智能物理AI和AI for Science、世界模型等领域的边界拓展，使得大模型的训练和应用环境更加复杂多元。这些趋势对智算...……更多

2024-07-09 09:47:00摩尔,张建中,万卡,张建,集群,线程

Bengio团队提出多模态新基准，直指Claude 3.5和

...ini 1.5 Pro, GPT-4o, GPT-4 Turbo, Qwen-VL-Max, Reka Core 以及一些目前性能最好的开源模型。下图中展示了在 VCR-Wiki 中文的简单难度上各个模型的性能：红框测量指标包括代表包含了图像（VI）和图像中的文字（TEI）两部分作为上下文信息……更多

2024-06-29 09:37:00模态,基准,弱点,团队,模型,任务

突破视频多模态大模型瓶颈！「合成数据」立大功，项目已开源

...。我们对慢帧使用 pXp 池化，对快帧使用 2pX2p 池化。基准性能LLaVA-Video 的表现。对于 VideoDC 和 VideoChatGPT 的，我们使用 5 分制度打分，其他评测集结果以准确率打分。所有结果均为 0-shot 准确率。* 表示该评测集的训练集已在我们...……更多

2024-10-22 09:54:00模态,大功,瓶颈,模型,突破,项目