• 我的订阅
  • 头条热搜
本周AI不得了!OpenAI的Sora“模拟世界”、Gemini 1.5“10M上下文”、Mistral的开源新贵同日出现
...质量令人着迷。总结:谷歌可能找到了某种新方法,将长上下文的架构理念与他们的 TPU 计算堆栈相结合,并取得了很好的效果。据 Gemini 长语境的负责人之一Pranav Shyam说,这个想法几个月前才刚刚萌芽。如果以小版本(v1.5)而...……更多
国产地表最强视频模型震惊歪果仁,官方现场摇人30s直出!视觉模型进入上下文时代
...刚刚诞生!Vidu 1.5一上线,全网网友都震惊了:LLM独有的上下文学习优势,视觉模型居然也有了。来自中国的视频生成模型,再一次震惊了全球大模型圈。生数科技推出的Vidu 1.5,成为世界首个支持多主体一致性的多模态模型!...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
现在,长上下文视觉语言模型(VLM)有了新的全栈解决方案 ——LongVILA,它集系统、模型训练与数据集开发于一体。现阶段,将模型的多模态理解与长上下文能力相结合是非常重要的,支持更多模态的基础模型可以接受更灵活...……更多
...致训练成本飙升。“简单来说,就像做阅读理解时忽视了上下文的语义关系,导致生成图像中经常出现偏差需要反复修正,大幅增加了训练成本。”程明明说。如何降低训练成本、提高训练效率?研究团队在扩散训练过程中引入...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...内的大模型而言,只有Minimax采用了MoE架构。二、扩容的上下文窗口意味着什么?虽然Gemini 1.5 Pro是 Gemini 1.5 系列的初代版本,但初代便表现不俗。扩大上下文窗口后的高水平性能是Gemini 1.5 Pro的一大亮点。多模态大模型卷到今日...……更多
英国ai初创公司wayve公布gaia-1最新进展
...个共享的表示形式,进而在模型中实现统一的时序对齐和上下文理解,这种编码方法,让模型能够更好地整合和理解不同类型的输入。▲图源Wayve而GAIA-1的核心,是一个自回归Transformer,能够预测序列中下一组图像token,世界模型...……更多
全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型
...将具备多步骤推理能力。来源:谷歌谷歌的Gemini以超长的上下文窗口而出名。在大会上,谷歌重点强调了大模型Gemini 1.5 Pro的多模态和长文本能力,为其推出一系列更新。谷歌将向全球150多个国家地区的Gemini Advanced订阅者提供最...……更多
Kimi引爆人工智能新风口,龙头连续20CM涨停!哪些公司可
...宣布,公司旗下的kimi智能助手,已支持200万字超长无损上下文,并已开启产品内测。继昨日爆发后,kimi概念股今天(3月21日)继续上涨。其中,龙头股华策影视(300133.SZ)再次涨停,连续收获两个20CM涨停,捷成股份(300182.SZ)...……更多
...流趋势。“Sora能够生成60秒时长的视频说明它的技术对于上下文的信息理解是非常优秀的,比如在视频场景的变换下能够识别同一主体,又如能够理解带有情感倾向的文字并通过画面表现出来。”他认为,“拟人化”和“理解世...……更多
...方不断加码。Gemini1.5 Pro基于大语言模型处理视频模态,上下文长度超过百万, Sora在技术上采用了Diffusion Transformer的路线,OpenAI表示Sora在训练过程中表现出了与其他模型不同的涌现能力,有望成为真正的“世界模型”。从投资...……更多
4090单卡可跑,6秒直出电影级画质,智谱版Sora正式开源!
...时间因果卷积确保了信息的因果性,减少了通信开销。而上下文并行技术的采用,则可以适应大规模视频处理。 实验中,团队发现大分辨率编码易于泛化,而增加帧数则挑战较大。因此,可将分两阶段训练模型:- 首先在较低...……更多
rtxai助手的进化
...Assist项目可接收玩家的语音或文字输入内容,游戏窗口的上下文信息,并通过AI视觉模型处理数据。这些模型增强了与游戏知识数据库相连的大语言模型(LLM)的上下文感知和对特定游戏及应用的理解,然后生成定制的回复,以文...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
大模型的上下文长度快速增长,超长上下文解锁新应用,但推理计算代价高昂,上下文本身对于信息不会进行压缩,不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年,人工智能领域风起...……更多
3D大模型助力,15分钟即可训练高质量、个性化的数字人模型
...t (ICLR 2024) 适应到目标数字人的高效微调策略和(2)具有上下文学习能力的人脸动作生成模型,MimicTalk 可以生成相比原有方法更高质量、更具表现力的数字人视频。此外,单个数字人模型的训练时间可以被压缩到 15 分钟以内,...……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...Phi-3.5,适合在内存和算力受限的环境中运行,均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-instruct可胜任复杂推理任务,Phi-3.5-vision-instruct则兼具文本与视觉能力。性能最强大的Phi-3……更多
Sora“超级涌现力”将把AI引向何方
...的最小单元进行有意义的关联组合。比如,在保持连贯的上下文语境中,对若干个单词进行有意义组合,从而连缀成一个会意句子;在保持合理的空间布局下,对众多图像小块进行有意义组合,拼合为一幅精彩图像;在保持一致...……更多
10分钟速成专家,「Kimi智能助手」正式支持200万上下文,对话窗口提升10倍 | 最前线
...正式宣布,旗下的Kimi智能助手,已支持200万字超长无损上下文,并于即日起开启产品内测。Kimi智能助手是月之暗面(Moonshot AI)基于自研千亿参数大模型打造的对话式 AI 助手产品,在2023年10月正式发布。而月之暗面也是国内大...……更多
长上下文能力只是吹牛?最强GPT-4o正确率仅55.8%,开源模型不如瞎蒙
...lan【新智元导读】当今的LLM已经号称能够支持百万级别的上下文长度,这对于模型的能力来说,意义重大。但近日的两项独立研究表明,它们可能只是在吹牛,LLM实际上并不能理解这么长的内容。大数字一向吸引眼球。千亿参数...……更多
GPT-4o版「Her」终于来了!讲笑话、学猫叫,AI女友能有多撩人?
...—需要更长输出内容才能满足用例,OpenAI才做出的调整。上下文和输出之间的区别GPT-4o自推出以来,便提供了最大128K的上下文窗口。而对于GPT-4o Long Output,最大上下文窗口仍然是128K。那么,OpenAI如何在保持整体上下文窗口为128K...……更多
《红楼梦》里有大量东北方言?实测AI大模型“长文阅读”
...,国内通用人工智能“初创明星”月之暗面宣布在大模型上下文窗口技术上取得新突破,旗下的Kimi智能助手可支持200万字超长无损上下文,并开启产品内测,随即引发市场关注和热议,并一度因过于火爆“宕机”。随后,阿里...……更多
终于拿到内测!豆包-PixelDance真是字节视频生成大杀器
...图模型、语音模型来了一波大升级。通用语言模型:增大上下文、提升综合能力从 5 月到 9 月,豆包大模型的使用量实现了超过 10 倍的爆发式增长,顺着这股爆发式增长的势头,火山引擎宣布将旗舰级豆包大模型「豆包通用模...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...专家架构,超10TB tokens训练,覆盖大量合成数据,推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中,用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4回答趣...……更多
Kimi开启大模型应用元年 券商推荐万兴科技掌阅科技等龙头
...助手近期实现的现象级突破。此前,月之暗面将Kimi的无损上下文长度输入能力从此前的20万字提升到了200万字,应用场景扩展到更大范围。随着Kimi的爆红,多家相关上市公司被广泛关注,并积极回复外界关切。AIGC软件A股上市公司万...……更多
自我纠错如何使OpenAI o1推理能力大大加强?北大MIT团队理论解释
...f-Correction作者团队将自我纠错的过程抽象为对齐任务,从上下文学习(In-context learning)的角度对自我纠错进行了理论分析。值得一提的是,他们并没有使用线性注意力机制下的线性回归任务进行理论分析,而是使用真实世界LLM...……更多
零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源
...代码能力和数学能力专项的继续训练模型。全球最长200K上下文窗口Yi-34B模型将发布全球最长、可支持200K超上下文窗口(contextwindow)版本,可以处理约40万汉字超文本输入。上下文窗口是大模型综合运算能力的金指标之一,对于理...……更多
黄仁勋对话Transformer七作者:很多计算资源被浪费,世界需要更好的模型
...环神经网络模型,Transformer模型能够更准确地捕捉单词的上下文和含义,因而成为了像GPT-4和ChatGPT这样的大语言模型的基础,同时也被应用于非语言领域,包括OpenAI的AI代码生成训练模型Codex、文生视频模型Sora和谷歌DeepMind的蛋白...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...,最新发布的 MiniCPM-V 2.6 首次将多图联合理解、多图ICL(上下文少样本学习 )功能集成在端侧模型,这也是此前业界多模态王者 GPT-4V 引以为傲的能力。1. 流畅的多图多轮理解,爽!就像人们习惯把多个文件拖拽给大模型处理,...……更多
王小川公布最新大模型,号称全球最长上下文,是GPT-4的14倍|钛媒体焦点
...模型公司“百川智能”宣布,推出Baichuan2-192K大模型,其上下文窗口长度高达192K,能够处理约35万个汉字。百川智能称,Baichuan2-192K是目前全球最长的上下文窗口,也是目前支持长上下文窗口最优秀大模型Claude2(支持100K上下文窗...……更多
用AI当导演,一个人就能拍电影?
...活跃用户就已成功过亿。它能够通过学习人类语言和理解上下文来实现对话互动,敢于质疑与承认错误。那么,如此强大的AI可以生成一部电影吗?AI创作电影的画面AI在电影方面的应用引发了业内的思考,上海温哥华电影学院电影制...……更多
AI赋能、短剧兴起,影视赛道 “一路生花“
...交互体验。Kimi智能助手的核心特点和功能包括:(1)长上下文处理:Kimi能够处理长达200万字的无损上下文,这意味着它可以理解和记忆大量信息,并在此基础上进行有效的交流和任务处理。(2)能力圈:Kimi的能力圈广泛,包...……更多
更多关于科技的资讯:
DeepSeek-VL2 开源:AI视觉模型迈入 MoE 时代
IT之家 12 月 14 日消息,DeepSeek 官方公众号昨日(12 月 13 日)发布博文,宣布开源 DeepSeek-VL2 模型
2024-12-16 09:33:00
雷克沙全球首发DDR5-6000 CL26超低延迟内存:AMD专属优化
快科技12月16日消息,雷克沙近日上线了高频率、低延迟的新款内存套条DDR5-6000 CL26 Ares战神之翼,如此组合还是第一次看到
2024-12-16 00:48:00
为什么我们的身体会带静电? 3种方法防止静电攻击
门把手、水龙头、触碰到另外一个人……一到冬天被静电击中是常有的事。但是静电到底是什么呢,为什么它会击中我们,我们又要如何才能防止那猝不及防地电击呢
2024-12-16 00:48:00
刷屏一年的飞行汽车 真能飞了?
快到年底了,不知道大家对今年的科技新词有啥看法,反正在咱编辑部这边,倒是一直有个高频出现的词——低空经济。自打去年年底
2024-12-16 00:48:00
特斯拉击败福特和通用,成为“美国制造”冠军
12月15日消息,特斯拉击败了传统的美国汽车巨头福特和通用汽车,成为了“最美国制造”汽车的冠军。根据美国大学Kogod商学院最新发布的排名
2024-12-16 01:11:00
小米pocox7系列外观渲染图曝光:搭载1.5k曲面屏
有媒体曝光了小米POCOX7系列的外观渲染图,引发了广泛关注。据悉,小米POCOX7系列包含标准版和Pro版两款机型,两款机型在外观设计上各有特色
2024-12-16 01:31:00
联发科天玑8400游戏能效表现不错,挑战高通骁龙8gen3
12月14日消息,博主数码闲聊站爆料,联发科天玑8400游戏能效表现不错,这次发哥要挑战对手高通骁龙8Gen3。据悉,天玑8400基于台积电4nm制程打造
2024-12-16 02:38:00
《双人成行》Steam平台迎来 2 折新史低折扣
12月15日消息,动作冒险游戏《双人成行》现已在Steam平台迎来2折新史低折扣,游戏原价198元,优惠后39.6元,截止日期为12月20日
2024-12-16 02:51:00
“中国温度”惠及世界(2024年终系列报道·科技篇④)
本文转自:人民日报海外版本报记者 张保淑《人民日报海外版》(2024年12月16日第 09 版)中国新一代可控核聚变大科学装置“中国环流三号”
2024-12-16 03:37:00
本文转自:人民日报海外版浙江省嵊州市——实景三维系统助力社会治理《人民日报海外版》(2024年12月16日第 05 版)本报电(朱巍)近日
2024-12-16 03:37:00
苹果发布ios18.2正式版,电池续航时间变化
12月15日消息,苹果最新发布了iOS18.2正式版,为iPhone15Pro和iPhone16带来了更多AI功能,包括Siri接入ChatGPT
2024-12-16 03:47:00
上汽大众2025款朗逸燃油轿车限时降价
12月15日消息,上汽大众宣布旗下2025款朗逸新锐燃油轿车迎来限时降价1万元,该车原价7.99万元起,年前大定即可享6
2024-12-16 04:07:00
瑞士洛桑联邦理工学院公布仿生学无人机
12月15日消息,瑞士洛桑联邦理工学院(EPFL)的研究团队在12月7日发布论文,公布了一款名为RAVEN的仿生学无人机
2024-12-16 04:09:00
比亚迪海狮07电池续航信息曝光
12月15日消息,比亚迪海狮07DM-i/DM-p两款车型现身第390批《道路机动车辆生产企业及产品公告》新产品公示,IT之家今日从工信部获取到了比亚迪海狮07的电池及续航信息
2024-12-16 04:52:00
2025款诺基亚105/110功能机规格曝光
12月15日消息,HMD现已悄悄在欧洲推出了2025款诺基亚105/110功能机(Nokia105/1104G2ndEdition)
2024-12-16 04:53:00