性能,模型,模态,训练,数据,卷上头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

GPT-4o的识图能力有多牛？四大维度深度体验

...技播客主持人DwarkeshPatel采访时透露，后训练是提高模型性能的关键因素。GPT-4o的识图能力有多牛？四大维度深度体验基于图片类型，记者将识图功能的测评分为4大维度，分别为普通图像、特定专业领域的图像、数据图像和手写...……更多

2024-05-19 14:21:00维度,深度,能力,体验,模型,训练

清华全球最大双臂机器人扩散大模型RDT，懂调酒能遛狗，登顶热

...扩展性（scalability）。换言之，扩大模型的参数量，它的性能也要跟着一起涨。二是，在之前的研究中，尚没有一个公认的在多种机器人数据上训练的方案。这主要是因为不同机器人的硬件结构和传感器不同，进而导致数据的格...……更多

2024-10-21 09:55:00清华,双臂,机器人,模型,机器,全球

中国也有Sora同款训练架构公司，清华班底，智谱也投了 |

...雨编辑 | 邓咏仪全球首家发布Sora同款底层架构的清华系模型公司，近期完成了新一轮融资。投资名单中，也出现了大模型独角兽智谱AI的身影。36氪获悉，近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明...……更多

2024-03-14 15:12:00清华,班底,中国,架构,训练,公司

斯坦福AI团队抄袭国产大模型？连识别“清华简”都抄了！清华系

...只花500美元训练，就能实现在多个基准测试中比肩GPT-4的性能。但很快有人发现，该模型跟清华系大模型创企面壁智能5月发布的MiniCPM-Llama3-V 2.5模型有不少相似处，而且没有任何相关致谢或引用。一开始团队面对抄袭质疑还嘴硬...……更多

2024-06-04 14:35:00清华,斯坦,斯坦福,团队,模型,抄袭

手机上能跑的「GPT-4V」来啦！多图、视频理解首次上端！面

...凭借8B参数，已经取得单图、多图、视频理解三项SOTA ，性能全面对标GPT-4V。再次刷新端侧多模态天花板，面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新！仅8B参数，取得 20B 以下单图、多图、视频理解 3 SOTA 成绩，一举将端侧AI多模态...……更多

2024-08-07 09:42:00多图,小钢炮,模态,上端,手机,视频

MMMU华人团队更新Pro版！多模态基准升至史诗级难度：过滤

...更严格地评估模型的多模态理解能力；模型在新基准上的性能下降明显，表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型（MLLMs）在各个排行榜上展现的性能不断提升，例如GPT-4o在大学水平上的多学...……更多

2024-09-18 13:31:00模态,史诗,基准,难度,问答,文本

AI也会「刷抖音」！清华领衔发布短视频全模态理解新模型 |

...模态任务上表现优异，更在视听联合任务中展现了卓越的性能，证明了其全面性和准确性。想要看懂短视频，除了视觉内容外，语音和音频等听觉信息，如视频音乐、音效、语音内容等，也对短视频的理解起到关键作用。音视频...……更多

2024-08-01 09:45:00模态,清华,领衔,模型,视频,音视

深数所发布500个行业多模态算料集

...“深数所”）发布了500个垂直行业多模态算料集，按照大模型应用的不同阶段（训练、推理、调优），有的放矢地提供数据源，让国产大模型厂商“寻数有路”。此次深数所发布的首批500个人工智能大模型高质量训练数据集，由...……更多

2024-04-13 01:58:00模态,行业,数据,模型,模态,人工智能

吉利星睿AI大模型正式发布引领中国汽车进入全场景AI时代

...极端场景数据集ACDC（包含雨、雾、雪、夜等复杂场景）性能验证中，星睿AI DRIVE大模型均拿下实时排行榜第一名，位于国际领先水平。强大的AI大模型，自然离不开强大的算力底座。星睿AI大模型基于全球首个“云、数、智”一...……更多

2024-01-11 11:18:00吉利,中国,模型,场景,时代,汽车

【产业互联网周报】字节回应被曝秘密利用OpenAI；英特尔预

...PT”。据透露，该团队的任务是在今年年底前达到GPT-3.5的性能，在2024年年中达到GPT-4的性能。目前Seed大约有2000亿个参数。相比之下，GPT-3.5有1750亿个参数。阿里云首席商业官蔡英华离职阿里云首席商业官蔡英华（花名：华琰）...……更多

2023-12-18 22:02:00马斯,英特,英华,马斯克,英特尔,阿里

群核科技（酷家乐）陈卓：用多模态AI助理赋能设计产业，用合成

...常长，往往会耗费大量的时间和资源，但通过云端部署高性能计算的方式，通过GPU+AI，让设计渲染速度比传统软件快几十倍甚至上百倍，并实现所见即所得的实时渲染效果。在过去十几年的时间里，群核科技的算力和数据得到了...……更多

2024-05-28 09:06:00家乐,模态,生产力,助理,大会,产业

让机器人拥有人一样潜意识，英伟达1.5M小模型就能实现通用控

当机器人也有潜意识。大模型固然性能强大，但限制也颇多。如果想在端侧塞进 405B 这种级别的大模型，那真是小庙供不起大菩萨。近段时间，小模型正在逐渐赢得人们更多关注。这一趋势不仅出现在语言模型领域，也出现在...……更多

2024-11-01 09:28:00拥有人,英伟,潜意识,机器人,模型,机器

疯狂一夜！美国AMD、谷歌纷纷亮出大杀器，人类迎来巨变前夜？

...oud TPU v5p。谷歌表示，在六项基准测试中，大杯的Gemini Pro性能表现优于GPT-3.5；而在30项性能基准测试中，超大杯Gemini Ultra超越了目前最强模型GPT-4。甚至，Gemini Ultra在MMLU测试上得分高达90.0%，即数学、物理、法律等57个领域测试.……更多

2023-12-07 13:02:00美国,人类,疯狂,焦点,媒体,英伟

小红书技术副总裁王晓博：大模型让AI越来越像人，更懂小红书的

...行的高效率训练，同时自研了RLHF框架，相较于开源框架性能和收敛稳定性都有提升。推理上我们做了W4A8模型压缩，结合算子优化整体性能超过开源框架20%左右。“王晓博介绍道。最后，王晓博表示：“人工智能技术在多模态、A...……更多

2024-07-08 14:43:00小红,越来,副总,模型,越来越,内容

Kimi爆火背后：访问量仅次于文心一言和阿里通义，国内外大模

...模型等。这些方式虽然能提升上下文窗口长度，但对模型性能均有不同程度的损害，换言之都是通过牺牲模型其他方面的性能来换取更长的上下文窗口。因此，如何在提高上下文支持长度的同时，保证处理能力的提升是目前业界...……更多

2024-03-23 14:00:00卷上,通义,阿里,文心,下文,模型

阿里云发布通义千问2.5，性能赶超GPT-4 Turbo

...历史性时刻。5月9日，阿里云正式发布通义千问2.5，模型性能全面赶超GPT-4 Turbo，成为地表最强中文大模型。同时，通义千问1100亿参数开源模型在多个基准测评收获最佳成绩，超越Llama-3-70B，成为开源领域最强大模型。历经一年...……更多

2024-05-09 12:00:00通义,阿里,性能,通义,模型,阿里

大模型到了该「验收」的时候

...Turbo版本的混元大模型，定价仅为前一代Pro版本的一半。性能更强、价格更低，这是大模型是深入落地场景的前提。走进场景的第一步：找到场景解决问题的第一步是，定义问题，而落地场景的第一步是，明确场景。大模型的核...……更多

2024-09-19 10:07:00验收,模型,时候,模型,腾讯,知识

首届空天信息技术大会开幕，发布全球首个百亿级遥感解译基础模型

...热能扩散过程，从而使该架构有效突破了遥感模型推理的性能和速度瓶颈，计算速度较传统结构模型提升2.4倍以上。孙显表示，“目前传统的、用于处理遥感图像的基础模型架构（transformer结构）本质上是基于文本处理架构发展...……更多

2024-09-23 11:53:00空天,遥感,首届,模型,大会,基础

全球最强开源大模型Llama 3发布：使用15T数据预训练，

...表现。此外，Meta 也测试了 Llama 3 在真实世界场景中的性能。他们专门开发了一个新的高质量人类评估集，该评估集包含 1800 个提示，涵盖 12 种关键用例（征求建议、头脑风暴、分类、封闭式问题解答、编码、创意写作、提取...……更多

2024-04-20 11:03:00模型,训练,参数,数据,全球,模型

国产GPU万卡集群终于来了！摩尔线程CEO张建中：做难而正确

...，通用型算力才具备更强的抗风险能力。三是AI、3D、高性能计算（HPC）跨技术与跨领域融合加速，推动空间智能物理AI和AI for Science、世界模型等领域的边界拓展，使得大模型的训练和应用环境更加复杂多元。这些趋势对智算...……更多

2024-07-09 09:47:00摩尔,张建中,万卡,张建,集群,线程

Bengio团队提出多模态新基准，直指Claude 3.5和

...ini 1.5 Pro, GPT-4o, GPT-4 Turbo, Qwen-VL-Max, Reka Core 以及一些目前性能最好的开源模型。下图中展示了在 VCR-Wiki 中文的简单难度上各个模型的性能：红框测量指标包括代表包含了图像（VI）和图像中的文字（TEI）两部分作为上下文信息……更多

2024-06-29 09:37:00模态,基准,弱点,团队,模型,任务

突破视频多模态大模型瓶颈！「合成数据」立大功，项目已开源

...。我们对慢帧使用 pXp 池化，对快帧使用 2pX2p 池化。基准性能LLaVA-Video 的表现。对于 VideoDC 和 VideoChatGPT 的，我们使用 5 分制度打分，其他评测集结果以准确率打分。所有结果均为 0-shot 准确率。* 表示该评测集的训练集已在我们...……更多

2024-10-22 09:54:00模态,大功,瓶颈,模型,突破,项目

苹果开源7B模型，训练过程数据集一口气全给了，网友：很不像苹

...。因此，团队使用DCLM来设计高质量数据集从而提高模型性能，尤其是在多模态领域。其思路很简单：使用一个标准化的框架来进行实验，包括固定的模型架构、训练代码、超参数和评估，最终找出哪种数据整理策略最适合训练...……更多

2024-07-23 09:33:00苹果,一口,模型,一口气,训练,过程

北京人工智能数据运营平台发布

...工智能研究院理事长、北京大学教授黄铁军表示，构建大模型生态首先要建立数据流通机制，推动从数据到智能的正反馈。汇聚数据超700万亿字节“如果没有开源数据集，很难想象人工智能怎样才能实现如此快速的迭代，然而，...……更多

2024-06-16 04:14:00人工智能,北京,人工,运营,智能,数据

让大模型能听会说,国内机构开源首个端到端语音对话模型Mini

...非与启元世界多模态负责人吴昌桥，研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。随着多类型大模型的飞速发展，全球 AI 已经进入到了多模交互时代。2024 年 5 月，OpenAI 推出了全新的多模...……更多

2024-09-07 09:44:00模型,语音,对话,机构,语音,文本

“弱智吧”成最佳中文AI语料库，究竟什么算优质数据？

...映射关系，从而能够实现“以图生文”、“以文生图”等性能。2026年数据预言是真是假？数据，是人工智能赖以发展的核心资源。如何解决“数据瓶颈”是未来一段时期我们即将面临或已经面临的挑战。据业内人士分析，GPT-3于...……更多

2024-04-15 17:00:00语料库,语料,中文,数据,数据,模型

更快、更强、更可控：智谱“起舞弄清影”，视频生成卷出新高度！

...展的多模态模型GLM-4V-9B能够很好地融合文本和视觉模态，性能比肩GPT-4V。如今，在视频生成领域，智谱立足多模态能力，再次实现“一举爆破”，推动技术天花板升维。二、立足多模态能力，智谱补齐视频生成版图智谱在多模...……更多

2024-07-27 10:00:00更快,生成,高度,视频,清影,视频

模型即服务，卓世科技MaaS平台 2.0 正式上线

...、超参数调优：帮助用户找到最优的模型参数，提高模型性能，可能包括自动化的超参数搜索服务。 5、模型训练监控：提供训练过程中的实时监控和日志记录，帮助用户了解模型训练的状态和效果。应用部署和构建服务确保...……更多

2024-08-07 09:45:00模型,服务,平台,科技,模型,数据

本周硅谷发生了什么？｜苹果Vision Pro正式开售；Ne

...更新了编程模型Code Llama 70B，是Code Llama系列中规模最大，性能最强的版本。一款名为“miqu-1-70b”的神秘模型现身Hugging Face，跑分接近GPT-4，引发众多猜测后被Mistral联合创始人证实，是此前一款公开的量化模型被泄露。字节跳动...……更多

2024-02-05 11:37:00硅谷,字节,接口,人类,苹果,模型

GPT-4劲敌，谷歌进入高能+高产模式

...世，将多模态大模型的标准提到了一个新高度。一、极致性能背后的模型架构当地时间2月15日，Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多模态模型Gemini 1.5 Pro。这是继2月7日的Gemini 1.0 Ul.……更多

2024-02-21 14:05:00劲敌,高产,模式,模型,上下文,处理