上下文,新贵,上下,世界,模型,视频头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

本周AI不得了！OpenAI的Sora“模拟世界”、Gemini 1.5“10M上下文”、Mistral的开源新贵同日出现

...质量令人着迷。总结：谷歌可能找到了某种新方法，将长上下文的架构理念与他们的 TPU 计算堆栈相结合，并取得了很好的效果。据 Gemini 长语境的负责人之一Pranav Shyam说，这个想法几个月前才刚刚萌芽。如果以小版本（v1.5）而...……更多

2024-02-17 19:48:00上下文,新贵,上下,世界,模型,视频

国产地表最强视频模型震惊歪果仁，官方现场摇人30s直出！视觉

...刚刚诞生！Vidu 1.5一上线，全网网友都震惊了：LLM独有的上下文学习优势，视觉模型居然也有了。来自中国的视频生成模型，再一次震惊了全球大模型圈。生数科技推出的Vidu 1.5，成为世界首个支持多主体一致性的多模态模型！...……更多

2024-11-15 09:52:00模型,果仁,上下文,地表,上下,视觉

支持1024帧、准确率近100％，英伟达「LongVILA」

现在，长上下文视觉语言模型（VLM）有了新的全栈解决方案 ——LongVILA，它集系统、模型训练与数据集开发于一体。现阶段，将模型的多模态理解与长上下文能力相结合是非常重要的，支持更多模态的基础模型可以接受更灵活...……更多

2024-08-22 09:51:00英伟,准确率,支持,视频,序列,训练

让人工智能模型训练提速10倍以上

...致训练成本飙升。“简单来说，就像做阅读理解时忽视了上下文的语义关系，导致生成图像中经常出现偏差需要反复修正，大幅增加了训练成本。”程明明说。如何降低训练成本、提高训练效率？研究团队在扩散训练过程中引入...……更多

2024-04-03 07:20:00人工智能,提速,人工,模型,训练,智能

GPT-4劲敌，谷歌进入高能+高产模式

...内的大模型而言，只有Minimax采用了MoE架构。二、扩容的上下文窗口意味着什么？虽然Gemini 1.5 Pro是 Gemini 1.5 系列的初代版本，但初代便表现不俗。扩大上下文窗口后的高水平性能是Gemini 1.5 Pro的一大亮点。多模态大模型卷到今日...……更多

2024-02-21 14:05:00劲敌,高产,模式,模型,上下文,处理

英国ai初创公司wayve公布gaia-1最新进展

...个共享的表示形式，进而在模型中实现统一的时序对齐和上下文理解，这种编码方法，让模型能够更好地整合和理解不同类型的输入。▲图源Wayve而GAIA-1的核心，是一个自回归Transformer，能够预测序列中下一组图像token，世界模型...……更多

2023-10-10 11:51:00英国,进展,公司,模型,驾驶,生成

全面叫板OpenAI！谷歌发布多模态大模型全家桶：从AI助手

...将具备多步骤推理能力。来源：谷歌谷歌的Gemini以超长的上下文窗口而出名。在大会上，谷歌重点强调了大模型Gemini 1.5 Pro的多模态和长文本能力，为其推出一系列更新。谷歌将向全球150多个国家地区的Gemini Advanced订阅者提供最...……更多

2024-05-15 09:54:00文生,模型,模态,全家,助手,视频

Kimi引爆人工智能新风口，龙头连续20CM涨停！哪些公司可

...宣布，公司旗下的kimi智能助手，已支持200万字超长无损上下文，并已开启产品内测。继昨日爆发后，kimi概念股今天（3月21日）继续上涨。其中，龙头股华策影视（300133.SZ）再次涨停，连续收获两个20CM涨停，捷成股份（300182.SZ）...……更多

2024-03-21 16:48:00风口,人工智能,龙头,人工,智能,公司

Sora抢了谁的饭碗

...流趋势。“Sora能够生成60秒时长的视频说明它的技术对于上下文的信息理解是非常优秀的，比如在视频场景的变换下能够识别同一主体，又如能够理解带有情感倾向的文字并通过画面表现出来。”他认为，“拟人化”和“理解世...……更多

2024-02-23 06:19:00饭碗,文生,视频,新技,李进,千里

MiniMax进化论：一群「偏执者」的破浪前行

...除了在业内主流的 17 个评测集位列前茅之外，M1还是全球上下文最长的推理模型，原生支持100万token输入长度，是DeepSeek R1的8倍；并且支持8万个输出token，打破了Gemini 2.5 Pro的6.4万个限制，成为世界最长输出的模型。对大模型而...……更多

2025-07-02 13:31:00一群,进化论,偏执,进化,模型,技术

中信证券：OpenAI推出视频生成模型Sora AI产业围绕

...方不断加码。Gemini1.5 Pro基于大语言模型处理视频模态，上下文长度超过百万， Sora在技术上采用了Diffusion Transformer的路线，OpenAI表示Sora在训练过程中表现出了与其他模型不同的涌现能力，有望成为真正的“世界模型”。从投资...……更多

2024-02-19 09:23:00中信证券,模态,中信,生成,模型,不断

低端显卡登上AI的大船！6GB显存就能生成高质量视频

...技术FramePack，通过在视频扩散模型中使用固定长度的时域上下文，可以更高效地生成时间更长、质量更高的视频。根据实测，基于FramePack构建的130亿参数模型，只需一块6GB显存的显卡，就能生成60秒钟的视频。FramePack是一种神经...……更多

2025-04-20 22:58:00大船,显存,低端,高质量,显卡,生成

4090单卡可跑，6秒直出电影级画质，智谱版Sora正式开源

...时间因果卷积确保了信息的因果性，减少了通信开销。而上下文并行技术的采用，则可以适应大规模视频处理。实验中，团队发现大分辨率编码易于泛化，而增加帧数则挑战较大。因此，可将分两阶段训练模型：- 首先在较低...……更多

2024-08-07 09:43:00画质,电影,视频,模型,生成,团队

rtxai助手的进化

...Assist项目可接收玩家的语音或文字输入内容，游戏窗口的上下文信息，并通过AI视觉模型处理数据。这些模型增强了与游戏知识数据库相连的大语言模型(LLM)的上下文感知和对特定游戏及应用的理解，然后生成定制的回复，以文...……更多

2024-06-07 04:47:00进化,助手,助手,模型,性能,开发者

林达华谈大模型发展之路：未来会有更高效的模型结构出现

大模型的上下文长度快速增长，超长上下文解锁新应用，但推理计算代价高昂，上下文本身对于信息不会进行压缩，不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年，人工智能领域风起...……更多

2024-03-25 10:53:00林达,模型,之路,结构,发展,模型

3D大模型助力，15分钟即可训练高质量、个性化的数字人模型

...t (ICLR 2024) 适应到目标数字人的高效微调策略和（2）具有上下文学习能力的人脸动作生成模型，MimicTalk 可以生成相比原有方法更高质量、更具表现力的数字人视频。此外，单个数字人模型的训练时间可以被压缩到 15 分钟以内，...……更多

2024-11-01 09:27:00模型,高质量,训练,数字,个性,模型

微软连发3款Phi-3.5模型：128K上下文，首用MoE架

...Phi-3.5，适合在内存和算力受限的环境中运行，均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务，Phi-3.5-MoE-instruct可胜任复杂推理任务，Phi-3.5-vision-instruct则兼具文本与视觉能力。性能最强大的Phi-3……更多

2024-08-22 09:49:00上下文,微软,架构,模型,上下,性能