性能,模型,模态,训练,数据,卷上头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

多模态竞技场对标90B Llama 3.2！Pixtral

...lai首先，许多开源模型一般有个问题，就是为了多模态的性能而牺牲了本身的自然语言性能，之前英伟达的NVLM 1.0也谈到了这点。Pixtral本次也是成功避开了这个缺陷，单单比较文本模型的性能，也在同等尺寸的模型中居于前列。...……更多

2024-11-20 09:43:00模态,竞技场,竞技,报告,技术,模态

阿里国际发布最新开源多模态模型Ovis，多模态能力再升级

...著提升多模态问答、指令跟随等任务表现。4、卓越模型性能：Ovis展现出了优异的榜单表现。在多模态权威综合评测Opencompass上，Ovis1.6-Gemma2-9B在30B参数以下的模型中取得了综合排名第一，超过了Qwen2-VL-7B、MiniCPM-V-2.6等模型。尤其...……更多

2024-09-20 13:35:00模态,阿里,模型,能力,升级,国际

5项重大更新，NVIDIA助力人形机器人研发迈入新阶段

...rmer 引擎，其变压器引擎可提供 800 teraflops 的 8 位浮点 AI 性能，运行带宽达 100GB/s，AI 计算性能达 800TFLOPs，多层次规划能力卓越，以运行 GR00T 等多模式生成式 AI 模型。凭借集成的功能安全处理器、高性能 CPU 集群和 100GB 以太网……更多

2024-05-16 15:10:00人形,机器人,机器,阶段,更新,机器人

商汤科技sensetime推出“云端边”全栈大模型体系

...行），不断突破大模型能力边界。”“日日新SenseNova5.0”性能超越GPT-4 Turbo：文理双修能力大幅提升，新增多模态交互自去年4月首次发布，商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。基于超过10TBtokens训练、...……更多

2024-04-25 01:02:00商汤,云端,模型,体系,科技,商汤

小模型正在成为AI界的新宠

...理和学习的复杂性直接相关。模型容量越大，往往意味着性能越好。随着模型容量增加到数万亿个参数，大模型可以捕捉更复杂的模式，从而在自然语言处理、计算机视觉和其他任务上表现更好，具备更像人类的能力。另一方面...……更多

2024-06-24 09:42:00新宠,模型,正在,模型,参数,训练

2024WAIC热议大模型助力产业新趋势，可信应用成焦点

...模型，天生具有不可控的机理，AI 须具备可预测和稳定的性能；第三，面对大模型可能产生的信息幻觉，确保内容的准确性和真实性是一大挑战；最后，必须包括内容安全、数据保护和网络安全，才能满足用户对 AI 应用的整体...……更多

2024-07-10 10:26:00可信,模型,趋势,产业,焦点,应用

空间智能版ImageNet来了！李飞飞吴佳俊团队出品

...队比较了不同的多模态模型在零镜头设置下理解长视频的性能。主要评估了三类模型，所有这些模型都在一个通用函数下运行：盲LLM：指是指在评估过程中，不考虑视频内容，仅依靠自身预先训练的知识来回答问题的大型语言模...……更多

2024-11-11 13:31:00团队,智能,空间,视频,模态,模型

击败GPT-4o的开源模型如何炼成?关于Llama 3.1

...基础模型的能力上限，Meta 官方称，在一系列任务中，其性能可与最好的闭源模型相媲美。下表展示了当前 Llama 3 系列模型在关键基准测试上的性能。可以看出，405B 模型的性能与 GPT-4o 十分接近。与此同时，Meta 公布了《The Llama ...……更多

2024-07-25 09:32:00模型,论文,模型,训练,论文,开发

北大等发布多模态版o1！首个慢思考VLM将开源，视觉推理超闭

...多模态推理基准测试中，LLaVA-o1超越其基础模型8.9%，并在性能上超越了一众开闭源模型。新模型具体如何推理，直接上实例，比如问题是：减去所有的小亮球和紫色物体，剩下多少个物体？选项：A. 4，B. 8，C. 2，D. 6传统提示词...……更多

2024-11-20 09:42:00模态,推理,北大,视觉,模型,推理

自然语言处理：大模型理论与实践

...别等数据源，多模态数据集，以及数据处理方法和对模型性能的影响。还介绍预训练方法如语言建模和去噪自编码，优化参数设置和可扩展训练技术。- 微调：涵盖指令微调概念、构造指令实例的方法和数据集，指令微调任务中...……更多

2024-10-23 20:38:00自然语言,模型,实践,理论,自然,语言

智谱AI发布视频生成大模型，B站参与研发，亦庄提供算力｜甲子

...用场景示范、人才等全方位支持；清影的训练依托亦庄高性能算力集群，在北京亦庄算力集群诞生，未来也将应用于北京亦庄广阔的高精尖产业集群，形成大模型赋能实体经济的新业态。在生态合作上，bilibili作为合作伙伴也参...……更多

2024-07-27 09:30:00亦庄,甲子,生成,模型,视频,模型

蚂蚁数科能源电力时序大模型EnergyTS发布预测精度超谷

...发电环节，容易受到太阳辐照、风速、云量、温度、设备性能等多重因素影响，存在发电效率不稳定的问题，进而带来用电供需不平衡、电价波动剧烈、储能调度收益低等关联风险。用AI技术可加强发电量预测的准确性，对电站...……更多

2025-03-26 22:31:00亚马,亚马逊,时序,精度,蚂蚁,模型

谷歌在AI赛道加速

...声称，该研究将大大提高训练速度和能效，比其他方法的性能高出 13 倍，能效高出 10 倍。随着有关 AI 数据中心对环境影响的讨论日益升温，新的 JEST 训练方法的出现可谓恰逢其时。DeepMind 的方法被称为 JEST 或联合示例选择，它...……更多

2024-07-11 09:47:00赛道,训练,方法,数据,模型,学习

“杜甫很忙”梗图变视频！智谱AI生成视频模型上线

...表示，在此次生成式视频模型的研发中，坚信大模型最终性能主要与计算量、模型参数量和训练数据量相关的Scaling Law定律，继续在算法和数据两方面发挥作用。“我们积极在模型层面探索更高效的scaling方式。随着算法、数据不...……更多

2024-07-27 14:18:00视频,杜甫,生成,模型,模型,模态

感官协同配合的精细操纵，人大胡迪团队探索机器人模态时变性挑战

...所有设置上均优于所有基线方法。MS-Bot 在两个任务中的性能超过了使用自注意力（Self Attention）进行动态融合的 MULSA 基线，这表明 MS-Bot 通过在融合过程中基于对当前阶段的细粒度状态的理解更好地分配模态权重，而没有显示阶...……更多

2024-11-09 09:53:00胡迪,模态,感官,变性,机器人,团队

昆仑万维SkyReels团队正式发布并开源SkyReels-

...经开源，可以直接使用。在视频理解测试集上的模型综合性能比较中，SkyCaptioner-V1表现优异，超越了SOTA的模型。 2.针对运动的偏好优化现有的视频生成模型在运动质量上表现不佳，主要原因是优化目标未能充分考虑时序一致性...……更多

2025-04-21 13:53:00万维,昆仑,团队,生成,视频,模型

GPT-4o的识图能力有多牛？四大维度深度体验

...技播客主持人DwarkeshPatel采访时透露，后训练是提高模型性能的关键因素。GPT-4o的识图能力有多牛？四大维度深度体验基于图片类型，记者将识图功能的测评分为4大维度，分别为普通图像、特定专业领域的图像、数据图像和手写...……更多

2024-05-19 14:21:00维度,深度,能力,体验,模型,训练

清华全球最大双臂机器人扩散大模型RDT，懂调酒能遛狗，登顶热

...扩展性（scalability）。换言之，扩大模型的参数量，它的性能也要跟着一起涨。二是，在之前的研究中，尚没有一个公认的在多种机器人数据上训练的方案。这主要是因为不同机器人的硬件结构和传感器不同，进而导致数据的格...……更多

2024-10-21 09:55:00清华,双臂,机器人,模型,机器,全球

中国也有Sora同款训练架构公司，清华班底，智谱也投了 |

...雨编辑 | 邓咏仪全球首家发布Sora同款底层架构的清华系模型公司，近期完成了新一轮融资。投资名单中，也出现了大模型独角兽智谱AI的身影。36氪获悉，近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明...……更多

2024-03-14 15:12:00清华,班底,中国,架构,训练,公司

斯坦福AI团队抄袭国产大模型？连识别“清华简”都抄了！清华系

...只花500美元训练，就能实现在多个基准测试中比肩GPT-4的性能。但很快有人发现，该模型跟清华系大模型创企面壁智能5月发布的MiniCPM-Llama3-V 2.5模型有不少相似处，而且没有任何相关致谢或引用。一开始团队面对抄袭质疑还嘴硬...……更多

2024-06-04 14:35:00清华,斯坦,斯坦福,团队,模型,抄袭

手机上能跑的「GPT-4V」来啦！多图、视频理解首次上端！面

...凭借8B参数，已经取得单图、多图、视频理解三项SOTA ，性能全面对标GPT-4V。再次刷新端侧多模态天花板，面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新！仅8B参数，取得 20B 以下单图、多图、视频理解 3 SOTA 成绩，一举将端侧AI多模态...……更多

2024-08-07 09:42:00多图,小钢炮,模态,上端,手机,视频

MMMU华人团队更新Pro版！多模态基准升至史诗级难度：过滤

...更严格地评估模型的多模态理解能力；模型在新基准上的性能下降明显，表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型（MLLMs）在各个排行榜上展现的性能不断提升，例如GPT-4o在大学水平上的多学...……更多

2024-09-18 13:31:00模态,史诗,基准,难度,问答,文本

AI也会「刷抖音」！清华领衔发布短视频全模态理解新模型 |

...模态任务上表现优异，更在视听联合任务中展现了卓越的性能，证明了其全面性和准确性。想要看懂短视频，除了视觉内容外，语音和音频等听觉信息，如视频音乐、音效、语音内容等，也对短视频的理解起到关键作用。音视频...……更多

2024-08-01 09:45:00模态,清华,领衔,模型,视频,音视

深数所发布500个行业多模态算料集

...“深数所”）发布了500个垂直行业多模态算料集，按照大模型应用的不同阶段（训练、推理、调优），有的放矢地提供数据源，让国产大模型厂商“寻数有路”。此次深数所发布的首批500个人工智能大模型高质量训练数据集，由...……更多

2024-04-13 01:58:00模态,行业,数据,模型,模态,人工智能

吉利星睿AI大模型正式发布引领中国汽车进入全场景AI时代

...极端场景数据集ACDC（包含雨、雾、雪、夜等复杂场景）性能验证中，星睿AI DRIVE大模型均拿下实时排行榜第一名，位于国际领先水平。强大的AI大模型，自然离不开强大的算力底座。星睿AI大模型基于全球首个“云、数、智”一...……更多

2024-01-11 11:18:00吉利,中国,模型,场景,时代,汽车

【产业互联网周报】字节回应被曝秘密利用OpenAI；英特尔预

...PT”。据透露，该团队的任务是在今年年底前达到GPT-3.5的性能，在2024年年中达到GPT-4的性能。目前Seed大约有2000亿个参数。相比之下，GPT-3.5有1750亿个参数。阿里云首席商业官蔡英华离职阿里云首席商业官蔡英华（花名：华琰）...……更多

2023-12-18 22:02:00马斯,英特,英华,马斯克,英特尔,阿里

群核科技（酷家乐）陈卓：用多模态AI助理赋能设计产业，用合成

...常长，往往会耗费大量的时间和资源，但通过云端部署高性能计算的方式，通过GPU+AI，让设计渲染速度比传统软件快几十倍甚至上百倍，并实现所见即所得的实时渲染效果。在过去十几年的时间里，群核科技的算力和数据得到了...……更多

2024-05-28 09:06:00家乐,模态,生产力,助理,大会,产业

开源社区参数量最大的文生视频模型来了，腾讯版Sora免费使用

...型模型成为可能，并评估了我们的文本到视频基础模型的性能，与最先进的视频生成模型（包括开源和专有模型）进行了比较。最后，我们展示了基于预训练基础模型构建的各种应用，并附上相关的可视化效果。精细的数据处理...……更多

2024-12-04 09:48:00文生,腾讯,模型,参数,社区,视频

让机器人拥有人一样潜意识，英伟达1.5M小模型就能实现通用控

当机器人也有潜意识。大模型固然性能强大，但限制也颇多。如果想在端侧塞进 405B 这种级别的大模型，那真是小庙供不起大菩萨。近段时间，小模型正在逐渐赢得人们更多关注。这一趋势不仅出现在语言模型领域，也出现在...……更多

2024-11-01 09:28:00拥有人,英伟,潜意识,机器人,模型,机器

蚂蚁发布EnergyTS能源电力大模型预测精度远超谷歌、亚

...yTS的MAE（平均绝对误差）仅为0.0233，较谷歌（TimesFM-V2.0）性能提升约22.4%。在T+3天预测任务中， EnergyTS的性能较谷歌（TimesFM-V2.0）提升46.8%，较亚马逊（Chronos-Large）提升62.4%。业内人士指出，该成果有望打破欧美企业在能……更多

2025-03-26 18:34:00亚马,亚马逊,精度,蚂蚁,模型,能源