• 我的订阅
  • 头条热搜
本周AI不得了!OpenAI的Sora“模拟世界”、Gemini 1.5“10M上下文”、Mistral的开源新贵同日出现
...质量令人着迷。总结:谷歌可能找到了某种新方法,将长上下文的架构理念与他们的 TPU 计算堆栈相结合,并取得了很好的效果。据 Gemini 长语境的负责人之一Pranav Shyam说,这个想法几个月前才刚刚萌芽。如果以小版本(v1.5)而...……更多
国产地表最强视频模型震惊歪果仁,官方现场摇人30s直出!视觉模型进入上下文时代
...刚刚诞生!Vidu 1.5一上线,全网网友都震惊了:LLM独有的上下文学习优势,视觉模型居然也有了。来自中国的视频生成模型,再一次震惊了全球大模型圈。生数科技推出的Vidu 1.5,成为世界首个支持多主体一致性的多模态模型!...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
现在,长上下文视觉语言模型(VLM)有了新的全栈解决方案 ——LongVILA,它集系统、模型训练与数据集开发于一体。现阶段,将模型的多模态理解与长上下文能力相结合是非常重要的,支持更多模态的基础模型可以接受更灵活...……更多
...致训练成本飙升。“简单来说,就像做阅读理解时忽视了上下文的语义关系,导致生成图像中经常出现偏差需要反复修正,大幅增加了训练成本。”程明明说。如何降低训练成本、提高训练效率?研究团队在扩散训练过程中引入...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...内的大模型而言,只有Minimax采用了MoE架构。二、扩容的上下文窗口意味着什么?虽然Gemini 1.5 Pro是 Gemini 1.5 系列的初代版本,但初代便表现不俗。扩大上下文窗口后的高水平性能是Gemini 1.5 Pro的一大亮点。多模态大模型卷到今日...……更多
英国ai初创公司wayve公布gaia-1最新进展
...个共享的表示形式,进而在模型中实现统一的时序对齐和上下文理解,这种编码方法,让模型能够更好地整合和理解不同类型的输入。▲图源Wayve而GAIA-1的核心,是一个自回归Transformer,能够预测序列中下一组图像token,世界模型...……更多
全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型
...将具备多步骤推理能力。来源:谷歌谷歌的Gemini以超长的上下文窗口而出名。在大会上,谷歌重点强调了大模型Gemini 1.5 Pro的多模态和长文本能力,为其推出一系列更新。谷歌将向全球150多个国家地区的Gemini Advanced订阅者提供最...……更多
Kimi引爆人工智能新风口,龙头连续20CM涨停!哪些公司可
...宣布,公司旗下的kimi智能助手,已支持200万字超长无损上下文,并已开启产品内测。继昨日爆发后,kimi概念股今天(3月21日)继续上涨。其中,龙头股华策影视(300133.SZ)再次涨停,连续收获两个20CM涨停,捷成股份(300182.SZ)...……更多
...流趋势。“Sora能够生成60秒时长的视频说明它的技术对于上下文的信息理解是非常优秀的,比如在视频场景的变换下能够识别同一主体,又如能够理解带有情感倾向的文字并通过画面表现出来。”他认为,“拟人化”和“理解世...……更多
...方不断加码。Gemini1.5 Pro基于大语言模型处理视频模态,上下文长度超过百万, Sora在技术上采用了Diffusion Transformer的路线,OpenAI表示Sora在训练过程中表现出了与其他模型不同的涌现能力,有望成为真正的“世界模型”。从投资...……更多
4090单卡可跑,6秒直出电影级画质,智谱版Sora正式开源!
...时间因果卷积确保了信息的因果性,减少了通信开销。而上下文并行技术的采用,则可以适应大规模视频处理。 实验中,团队发现大分辨率编码易于泛化,而增加帧数则挑战较大。因此,可将分两阶段训练模型:- 首先在较低...……更多
rtxai助手的进化
...Assist项目可接收玩家的语音或文字输入内容,游戏窗口的上下文信息,并通过AI视觉模型处理数据。这些模型增强了与游戏知识数据库相连的大语言模型(LLM)的上下文感知和对特定游戏及应用的理解,然后生成定制的回复,以文...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
大模型的上下文长度快速增长,超长上下文解锁新应用,但推理计算代价高昂,上下文本身对于信息不会进行压缩,不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年,人工智能领域风起...……更多
3D大模型助力,15分钟即可训练高质量、个性化的数字人模型
...t (ICLR 2024) 适应到目标数字人的高效微调策略和(2)具有上下文学习能力的人脸动作生成模型,MimicTalk 可以生成相比原有方法更高质量、更具表现力的数字人视频。此外,单个数字人模型的训练时间可以被压缩到 15 分钟以内,...……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...Phi-3.5,适合在内存和算力受限的环境中运行,均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-instruct可胜任复杂推理任务,Phi-3.5-vision-instruct则兼具文本与视觉能力。性能最强大的Phi-3……更多
Sora“超级涌现力”将把AI引向何方
...的最小单元进行有意义的关联组合。比如,在保持连贯的上下文语境中,对若干个单词进行有意义组合,从而连缀成一个会意句子;在保持合理的空间布局下,对众多图像小块进行有意义组合,拼合为一幅精彩图像;在保持一致...……更多
10分钟速成专家,「Kimi智能助手」正式支持200万上下文,对话窗口提升10倍 | 最前线
...正式宣布,旗下的Kimi智能助手,已支持200万字超长无损上下文,并于即日起开启产品内测。Kimi智能助手是月之暗面(Moonshot AI)基于自研千亿参数大模型打造的对话式 AI 助手产品,在2023年10月正式发布。而月之暗面也是国内大...……更多
长上下文能力只是吹牛?最强GPT-4o正确率仅55.8%,开源模型不如瞎蒙
...lan【新智元导读】当今的LLM已经号称能够支持百万级别的上下文长度,这对于模型的能力来说,意义重大。但近日的两项独立研究表明,它们可能只是在吹牛,LLM实际上并不能理解这么长的内容。大数字一向吸引眼球。千亿参数...……更多
GPT-4o版「Her」终于来了!讲笑话、学猫叫,AI女友能有多撩人?
...—需要更长输出内容才能满足用例,OpenAI才做出的调整。上下文和输出之间的区别GPT-4o自推出以来,便提供了最大128K的上下文窗口。而对于GPT-4o Long Output,最大上下文窗口仍然是128K。那么,OpenAI如何在保持整体上下文窗口为128K...……更多
《红楼梦》里有大量东北方言?实测AI大模型“长文阅读”
...,国内通用人工智能“初创明星”月之暗面宣布在大模型上下文窗口技术上取得新突破,旗下的Kimi智能助手可支持200万字超长无损上下文,并开启产品内测,随即引发市场关注和热议,并一度因过于火爆“宕机”。随后,阿里...……更多
终于拿到内测!豆包-PixelDance真是字节视频生成大杀器
...图模型、语音模型来了一波大升级。通用语言模型:增大上下文、提升综合能力从 5 月到 9 月,豆包大模型的使用量实现了超过 10 倍的爆发式增长,顺着这股爆发式增长的势头,火山引擎宣布将旗舰级豆包大模型「豆包通用模...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...专家架构,超10TB tokens训练,覆盖大量合成数据,推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中,用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4回答趣...……更多
Kimi开启大模型应用元年 券商推荐万兴科技掌阅科技等龙头
...助手近期实现的现象级突破。此前,月之暗面将Kimi的无损上下文长度输入能力从此前的20万字提升到了200万字,应用场景扩展到更大范围。随着Kimi的爆红,多家相关上市公司被广泛关注,并积极回复外界关切。AIGC软件A股上市公司万...……更多
自我纠错如何使OpenAI o1推理能力大大加强?北大MIT团队理论解释
...f-Correction作者团队将自我纠错的过程抽象为对齐任务,从上下文学习(In-context learning)的角度对自我纠错进行了理论分析。值得一提的是,他们并没有使用线性注意力机制下的线性回归任务进行理论分析,而是使用真实世界LLM...……更多
零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源
...代码能力和数学能力专项的继续训练模型。全球最长200K上下文窗口Yi-34B模型将发布全球最长、可支持200K超上下文窗口(contextwindow)版本,可以处理约40万汉字超文本输入。上下文窗口是大模型综合运算能力的金指标之一,对于理...……更多
黄仁勋对话Transformer七作者:很多计算资源被浪费,世界需要更好的模型
...环神经网络模型,Transformer模型能够更准确地捕捉单词的上下文和含义,因而成为了像GPT-4和ChatGPT这样的大语言模型的基础,同时也被应用于非语言领域,包括OpenAI的AI代码生成训练模型Codex、文生视频模型Sora和谷歌DeepMind的蛋白...……更多
王小川公布最新大模型,号称全球最长上下文,是GPT-4的14倍|钛媒体焦点
...模型公司“百川智能”宣布,推出Baichuan2-192K大模型,其上下文窗口长度高达192K,能够处理约35万个汉字。百川智能称,Baichuan2-192K是目前全球最长的上下文窗口,也是目前支持长上下文窗口最优秀大模型Claude2(支持100K上下文窗...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...,最新发布的 MiniCPM-V 2.6 首次将多图联合理解、多图ICL(上下文少样本学习 )功能集成在端侧模型,这也是此前业界多模态王者 GPT-4V 引以为傲的能力。1. 流畅的多图多轮理解,爽!就像人们习惯把多个文件拖拽给大模型处理,...……更多
用AI当导演,一个人就能拍电影?
...活跃用户就已成功过亿。它能够通过学习人类语言和理解上下文来实现对话互动,敢于质疑与承认错误。那么,如此强大的AI可以生成一部电影吗?AI创作电影的画面AI在电影方面的应用引发了业内的思考,上海温哥华电影学院电影制...……更多
AI赋能、短剧兴起,影视赛道 “一路生花“
...交互体验。Kimi智能助手的核心特点和功能包括:(1)长上下文处理:Kimi能够处理长达200万字的无损上下文,这意味着它可以理解和记忆大量信息,并在此基础上进行有效的交流和任务处理。(2)能力圈:Kimi的能力圈广泛,包...……更多
更多关于科技的资讯:
提高警惕!随手拍的照片竟然成了泄密源头
12月21日消息,微博话题“随手拍的照片竟然成了泄密源头”引发关注。据媒体报道,看似一张普通的照片往往包含着很多信息,稍有不慎就可能成为泄密源头
2024-12-21 18:02:00
联想黄智信:2025年将是联想moto的复兴之旅
快科技12月21日消息,2024年12月20日,联想在武汉产业基地举办了第15期新质媒体沙龙。作为与会媒体之一,快科技首次深入联想武汉产业基地
2024-12-21 18:02:00
苹果AI为何不收费:iPhone能为苹果提供源源不断的现金流
快科技12月21日消息,苹果CEO库克在接受采访时表示,我们从来没有考虑过AI收费服务,AI就像是多点触控,它推动了智能手机的革命
2024-12-21 19:02:00
汽车之家冬季能耗实测:特斯拉Model 3第一 百公里不到12度
快科技12月21日消息,汽车之家近期公布了2024年冬季纯电车型能耗排行榜,引发了广泛关注。在低温区(5℃到15℃)的环境下
2024-12-21 19:02:00
中新经纬12月21日电 (龚宸芫)在中国电动汽车百人会(下称百人会)于20日举办的大军山·智能汽车科技大会上,东风公司
2024-12-21 19:05:00
预测未来,抢先体验:2025年“备受瞩目”降噪耳机排行榜大揭
随着科技的不断发展,智能降噪耳机已成为当下最受消费者关注的热门电子产品之一。未来两年,这一市场将迎来更多创新和突破,带来更加出色的用户体验
2024-12-21 19:37:00
蔚来NIO Day何小鹏来探班:给李斌送去汤圆
快科技12月21日消息,今天是蔚来NIO Day以及10周年纪念日,何小鹏去了NIO Day现场,正值冬至,何小鹏给李斌送了汤圆
2024-12-21 20:02:00
李斌:蔚来2025年底前在27省级行政区实现换电县县通
快科技12月21日消息,今日晚间,蔚来NIO Day 2024在广州举行。在活动上,蔚来李斌宣布,截止12月15日,蔚来全球建成了2903座换电站
2024-12-21 20:32:00
冯骥:把《黑神话:悟空》做成历史销量最高的ARPG
快科技12月21日消息,昨日,《黑神话》在新闻联播中亮相,冯骥亲自演示了游戏并分享了未来的发展规划。细心的观众发现,冯骥在汇报时提到了一个宏伟的目标
2024-12-21 20:32:00
湖南长沙:电网迎峰度冬 人工智能来帮忙
本文转自:人民网-湖南频道国网长沙供电公司自主研发的人工智能“光明”。受访单位供图人民网长沙12月21日电 “当前时间是22时50分
2024-12-21 20:42:00
中国蓝新闻 企业是创新的生力军,强化企业创新主体地位,是推动科技创新和产业创新深度融合,加快建设创新浙江的关键举措。眼下
2024-12-21 21:09:00
78.80万起 蔚来旗舰车型ET9上市:首发多项世界顶尖科技
快科技12月21日消息,刚刚,蔚来旗舰车型ET9正式上市,该车整车购买为78.8万元起售,采用BaaS租电模式则为66万
2024-12-21 21:32:00
李斌亲自参与蔚来ET9高速爆胎测试:直呼“做车太费CEO了”
快科技12月21日消息,在今日的蔚来NIO Day 2024上,蔚来创始人、董事长、CEO李斌发表演讲,蔚来ET9正式亮相
2024-12-21 21:32:00
四川发放10万张免费门票 涉及全省120余家A级景区
快科技12月21日消息,据“四川发布”微信公众号消息,四川推出“冬游四川”消费季系列活动。从今年12月到明年3月将开展5000场文旅活动
2024-12-21 21:32:00
智能音箱、榫卯积木!三峡博物馆文创“脑洞大开”
颁奖典礼现场当虎钮錞于的一身青铜色变成了金色,一个既复古又满满都是时尚味道的智能音箱便出现在了大家面前;还有根据萌萌的青铜鸟形尊和此前圈粉无数的“小粉炉”打造的榫卯积木
2024-12-21 21:54:00