性能,模型,模态,训练,数据,卷上头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

Kimi爆火背后：访问量仅次于文心一言和阿里通义，国内外大模

...模型等。这些方式虽然能提升上下文窗口长度，但对模型性能均有不同程度的损害，换言之都是通过牺牲模型其他方面的性能来换取更长的上下文窗口。因此，如何在提高上下文支持长度的同时，保证处理能力的提升是目前业界...……更多

2024-03-23 14:00:00卷上,通义,阿里,文心,下文,模型

疯狂一夜！美国AMD、谷歌纷纷亮出大杀器，人类迎来巨变前夜？

...oud TPU v5p。谷歌表示，在六项基准测试中，大杯的Gemini Pro性能表现优于GPT-3.5；而在30项性能基准测试中，超大杯Gemini Ultra超越了目前最强模型GPT-4。甚至，Gemini Ultra在MMLU测试上得分高达90.0%，即数学、物理、法律等57个领域测试.……更多

2023-12-07 13:02:00美国,人类,疯狂,焦点,媒体,英伟

小红书技术副总裁王晓博：大模型让AI越来越像人，更懂小红书的

...行的高效率训练，同时自研了RLHF框架，相较于开源框架性能和收敛稳定性都有提升。推理上我们做了W4A8模型压缩，结合算子优化整体性能超过开源框架20%左右。“王晓博介绍道。最后，王晓博表示：“人工智能技术在多模态、A...……更多

2024-07-08 14:43:00小红,越来,副总,模型,越来越,内容

阿里Qwen3登顶全球最强开源模型，用8款模型夺回中国AI话

...和LLaMA-4-Maverick（超4000亿），实现了小而美、以小博大的性能。这样的能力同样体现在其它模型当中。另一款小型MoE模型Qwen3-30B-A3B的激活参数量仅有30亿，仅有QwQ-32B的10%，更远低于DeepSeek-V3（总参数6710亿、激活370亿）和GPT-4……更多

2025-04-29 16:17:00模型,阿里,话语权,中国,话语,全球

阿里云发布通义千问2.5，性能赶超GPT-4 Turbo

...历史性时刻。5月9日，阿里云正式发布通义千问2.5，模型性能全面赶超GPT-4 Turbo，成为地表最强中文大模型。同时，通义千问1100亿参数开源模型在多个基准测评收获最佳成绩，超越Llama-3-70B，成为开源领域最强大模型。历经一年...……更多

2024-05-09 12:00:00通义,阿里,性能,通义,模型,阿里

大模型到了该「验收」的时候

...Turbo版本的混元大模型，定价仅为前一代Pro版本的一半。性能更强、价格更低，这是大模型是深入落地场景的前提。走进场景的第一步：找到场景解决问题的第一步是，定义问题，而落地场景的第一步是，明确场景。大模型的核...……更多

2024-09-19 10:07:00验收,模型,时候,模型,腾讯,知识

全球最强开源大模型Llama 3发布：使用15T数据预训练，

...表现。此外，Meta 也测试了 Llama 3 在真实世界场景中的性能。他们专门开发了一个新的高质量人类评估集，该评估集包含 1800 个提示，涵盖 12 种关键用例（征求建议、头脑风暴、分类、封闭式问题解答、编码、创意写作、提取...……更多

2024-04-20 11:03:00模型,训练,参数,数据,全球,模型

首届空天信息技术大会开幕，发布全球首个百亿级遥感解译基础模型

...热能扩散过程，从而使该架构有效突破了遥感模型推理的性能和速度瓶颈，计算速度较传统结构模型提升2.4倍以上。孙显表示，“目前传统的、用于处理遥感图像的基础模型架构（transformer结构）本质上是基于文本处理架构发展...……更多

2024-09-23 11:53:00空天,遥感,首届,模型,大会,基础

国产GPU万卡集群终于来了！摩尔线程CEO张建中：做难而正确

...，通用型算力才具备更强的抗风险能力。三是AI、3D、高性能计算（HPC）跨技术与跨领域融合加速，推动空间智能物理AI和AI for Science、世界模型等领域的边界拓展，使得大模型的训练和应用环境更加复杂多元。这些趋势对智算...……更多

2024-07-09 09:47:00摩尔,张建中,万卡,张建,集群,线程

具身智能竞速时刻，百度百舸提供全栈加速方案

...语言动作模型 VLA 等各类模型的训练与迭代效率。1.1. 高性能算力与极致优化：AIAK 赋能训推加速百舸依托强大的算力基础设施，并通过自研 AI 加速套件 AIAK（AI Acceleration Kit）进行深度工程优化，针对具身智能主流模型提供显著...……更多

2025-08-13 17:25:00百舸,竞速,时刻,智能,方案,模型

如何跑赢生成式AI竞赛？云计算大厂揭秘组合拳：自研大模型只是

...些“另类”。它不像其他云大厂那样强调自研模型的顶尖性能，而是早早推出一个大模型货架，集邮般摆上了各家头部大模型，供客户挑选。“没有一个模型能包办一切”，这个被亚马逊频繁强调的理念，已经逐渐深入人心。而...……更多

2024-12-16 09:15:00大厂,组合拳,竞赛,生成,模型,只是

Bengio团队提出多模态新基准，直指Claude 3.5和

...ini 1.5 Pro, GPT-4o, GPT-4 Turbo, Qwen-VL-Max, Reka Core 以及一些目前性能最好的开源模型。下图中展示了在 VCR-Wiki 中文的简单难度上各个模型的性能：红框测量指标包括代表包含了图像（VI）和图像中的文字（TEI）两部分作为上下文信息……更多

2024-06-29 09:37:00模态,基准,弱点,团队,模型,任务

撞墙还是新起点？自回归模型在图像领域展现出Scaling潜力

...现为：随着模型大小的增加，训练损失会降低，模型生成性能会提高，捕捉全局信息的能力也会增强。论文标题：Elucidating the design space of language models for image generation 论文链接：https://arxiv……更多

2024-11-27 13:32:00潜力,模型,图像,起点,领域,还是

突破视频多模态大模型瓶颈！「合成数据」立大功，项目已开源

...。我们对慢帧使用 pXp 池化，对快帧使用 2pX2p 池化。基准性能LLaVA-Video 的表现。对于 VideoDC 和 VideoChatGPT 的，我们使用 5 分制度打分，其他评测集结果以准确率打分。所有结果均为 0-shot 准确率。* 表示该评测集的训练集已在我们...……更多

2024-10-22 09:54:00模态,大功,瓶颈,模型,突破,项目

苹果开源7B模型，训练过程数据集一口气全给了，网友：很不像苹

...。因此，团队使用DCLM来设计高质量数据集从而提高模型性能，尤其是在多模态领域。其思路很简单：使用一个标准化的框架来进行实验，包括固定的模型架构、训练代码、超参数和评估，最终找出哪种数据整理策略最适合训练...……更多

2024-07-23 09:33:00苹果,一口,模型,一口气,训练,过程

北京人工智能数据运营平台发布

...工智能研究院理事长、北京大学教授黄铁军表示，构建大模型生态首先要建立数据流通机制，推动从数据到智能的正反馈。汇聚数据超700万亿字节“如果没有开源数据集，很难想象人工智能怎样才能实现如此快速的迭代，然而，...……更多

2024-06-16 04:14:00人工智能,北京,人工,运营,智能,数据

让大模型能听会说,国内机构开源首个端到端语音对话模型Mini

...非与启元世界多模态负责人吴昌桥，研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。随着多类型大模型的飞速发展，全球 AI 已经进入到了多模交互时代。2024 年 5 月，OpenAI 推出了全新的多模...……更多

2024-09-07 09:44:00模型,语音,对话,机构,语音,文本

推动前沿大模型技术应用这只浙股去年营收净利双增

...域，持续优化升级问财HithinkGPT 大模型，不断提升其整体性能。同花顺在公告中称，公司建立了高效的训练体系，涵盖数据配比、模型架构优化等多维度，以低成本完成大模型训练；公司拥有数十年的数据积累和自建的HithinkFinEva...……更多

2025-02-26 09:09:00净利,技术应用,模型,应用,技术,模型

“弱智吧”成最佳中文AI语料库，究竟什么算优质数据？

...映射关系，从而能够实现“以图生文”、“以文生图”等性能。2026年数据预言是真是假？数据，是人工智能赖以发展的核心资源。如何解决“数据瓶颈”是未来一段时期我们即将面临或已经面临的挑战。据业内人士分析，GPT-3于...……更多

2024-04-15 17:00:00语料库,语料,中文,数据,数据,模型

更快、更强、更可控：智谱“起舞弄清影”，视频生成卷出新高度！

...展的多模态模型GLM-4V-9B能够很好地融合文本和视觉模态，性能比肩GPT-4V。如今，在视频生成领域，智谱立足多模态能力，再次实现“一举爆破”，推动技术天花板升维。二、立足多模态能力，智谱补齐视频生成版图智谱在多模...……更多

2024-07-27 10:00:00更快,生成,高度,视频,清影,视频

模型即服务，卓世科技MaaS平台 2.0 正式上线

...、超参数调优：帮助用户找到最优的模型参数，提高模型性能，可能包括自动化的超参数搜索服务。 5、模型训练监控：提供训练过程中的实时监控和日志记录，帮助用户了解模型训练的状态和效果。应用部署和构建服务确保...……更多

2024-08-07 09:45:00模型,服务,平台,科技,模型,数据

本周硅谷发生了什么？｜苹果Vision Pro正式开售；Ne

...更新了编程模型Code Llama 70B，是Code Llama系列中规模最大，性能最强的版本。一款名为“miqu-1-70b”的神秘模型现身Hugging Face，跑分接近GPT-4，引发众多猜测后被Mistral联合创始人证实，是此前一款公开的量化模型被泄露。字节跳动...……更多

2024-02-05 11:37:00硅谷,字节,接口,人类,苹果,模型

Sam Altman或筹数十亿美元自造AI芯片，DeepMi

...本嵌入模型：text-embedding-3-small和text-embedding-3-large，前者性能比前代模型大幅提升，价格降至1/5；后者能创建最高3072维数的嵌入，性能更强，价格亦十分经济。GPT-3.5 Turbo的新版本也将推出，输入价格降低50%，输出价格减少25%。.……更多

2024-01-29 09:20:00首席,科学家,芯片,创业,科学,模型

GPT-4劲敌，谷歌进入高能+高产模式

...世，将多模态大模型的标准提到了一个新高度。一、极致性能背后的模型架构当地时间2月15日，Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多模态模型Gemini 1.5 Pro。这是继2月7日的Gemini 1.0 Ul.……更多

2024-02-21 14:05:00劲敌,高产,模式,模型,上下文,处理