• 我的订阅
  • 头条热搜
本周AI不得了!OpenAI的Sora“模拟世界”、Gemini 1.5“10M上下文”、Mistral的开源新贵同日出现
...质量令人着迷。总结:谷歌可能找到了某种新方法,将长上下文的架构理念与他们的 TPU 计算堆栈相结合,并取得了很好的效果。据 Gemini 长语境的负责人之一Pranav Shyam说,这个想法几个月前才刚刚萌芽。如果以小版本(v1.5)而...……更多
国产地表最强视频模型震惊歪果仁,官方现场摇人30s直出!视觉模型进入上下文时代
...刚刚诞生!Vidu 1.5一上线,全网网友都震惊了:LLM独有的上下文学习优势,视觉模型居然也有了。来自中国的视频生成模型,再一次震惊了全球大模型圈。生数科技推出的Vidu 1.5,成为世界首个支持多主体一致性的多模态模型!...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
现在,长上下文视觉语言模型(VLM)有了新的全栈解决方案 ——LongVILA,它集系统、模型训练与数据集开发于一体。现阶段,将模型的多模态理解与长上下文能力相结合是非常重要的,支持更多模态的基础模型可以接受更灵活...……更多
...致训练成本飙升。“简单来说,就像做阅读理解时忽视了上下文的语义关系,导致生成图像中经常出现偏差需要反复修正,大幅增加了训练成本。”程明明说。如何降低训练成本、提高训练效率?研究团队在扩散训练过程中引入...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...内的大模型而言,只有Minimax采用了MoE架构。二、扩容的上下文窗口意味着什么?虽然Gemini 1.5 Pro是 Gemini 1.5 系列的初代版本,但初代便表现不俗。扩大上下文窗口后的高水平性能是Gemini 1.5 Pro的一大亮点。多模态大模型卷到今日...……更多
英国ai初创公司wayve公布gaia-1最新进展
...个共享的表示形式,进而在模型中实现统一的时序对齐和上下文理解,这种编码方法,让模型能够更好地整合和理解不同类型的输入。▲图源Wayve而GAIA-1的核心,是一个自回归Transformer,能够预测序列中下一组图像token,世界模型...……更多
全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型
...将具备多步骤推理能力。来源:谷歌谷歌的Gemini以超长的上下文窗口而出名。在大会上,谷歌重点强调了大模型Gemini 1.5 Pro的多模态和长文本能力,为其推出一系列更新。谷歌将向全球150多个国家地区的Gemini Advanced订阅者提供最...……更多
Kimi引爆人工智能新风口,龙头连续20CM涨停!哪些公司可
...宣布,公司旗下的kimi智能助手,已支持200万字超长无损上下文,并已开启产品内测。继昨日爆发后,kimi概念股今天(3月21日)继续上涨。其中,龙头股华策影视(300133.SZ)再次涨停,连续收获两个20CM涨停,捷成股份(300182.SZ)...……更多
...流趋势。“Sora能够生成60秒时长的视频说明它的技术对于上下文的信息理解是非常优秀的,比如在视频场景的变换下能够识别同一主体,又如能够理解带有情感倾向的文字并通过画面表现出来。”他认为,“拟人化”和“理解世...……更多
...方不断加码。Gemini1.5 Pro基于大语言模型处理视频模态,上下文长度超过百万, Sora在技术上采用了Diffusion Transformer的路线,OpenAI表示Sora在训练过程中表现出了与其他模型不同的涌现能力,有望成为真正的“世界模型”。从投资...……更多
4090单卡可跑,6秒直出电影级画质,智谱版Sora正式开源!
...时间因果卷积确保了信息的因果性,减少了通信开销。而上下文并行技术的采用,则可以适应大规模视频处理。 实验中,团队发现大分辨率编码易于泛化,而增加帧数则挑战较大。因此,可将分两阶段训练模型:- 首先在较低...……更多
rtxai助手的进化
...Assist项目可接收玩家的语音或文字输入内容,游戏窗口的上下文信息,并通过AI视觉模型处理数据。这些模型增强了与游戏知识数据库相连的大语言模型(LLM)的上下文感知和对特定游戏及应用的理解,然后生成定制的回复,以文...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
大模型的上下文长度快速增长,超长上下文解锁新应用,但推理计算代价高昂,上下文本身对于信息不会进行压缩,不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年,人工智能领域风起...……更多
3D大模型助力,15分钟即可训练高质量、个性化的数字人模型
...t (ICLR 2024) 适应到目标数字人的高效微调策略和(2)具有上下文学习能力的人脸动作生成模型,MimicTalk 可以生成相比原有方法更高质量、更具表现力的数字人视频。此外,单个数字人模型的训练时间可以被压缩到 15 分钟以内,...……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...Phi-3.5,适合在内存和算力受限的环境中运行,均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-instruct可胜任复杂推理任务,Phi-3.5-vision-instruct则兼具文本与视觉能力。性能最强大的Phi-3……更多
Sora“超级涌现力”将把AI引向何方
...的最小单元进行有意义的关联组合。比如,在保持连贯的上下文语境中,对若干个单词进行有意义组合,从而连缀成一个会意句子;在保持合理的空间布局下,对众多图像小块进行有意义组合,拼合为一幅精彩图像;在保持一致...……更多
10分钟速成专家,「Kimi智能助手」正式支持200万上下文,对话窗口提升10倍 | 最前线
...正式宣布,旗下的Kimi智能助手,已支持200万字超长无损上下文,并于即日起开启产品内测。Kimi智能助手是月之暗面(Moonshot AI)基于自研千亿参数大模型打造的对话式 AI 助手产品,在2023年10月正式发布。而月之暗面也是国内大...……更多
长上下文能力只是吹牛?最强GPT-4o正确率仅55.8%,开源模型不如瞎蒙
...lan【新智元导读】当今的LLM已经号称能够支持百万级别的上下文长度,这对于模型的能力来说,意义重大。但近日的两项独立研究表明,它们可能只是在吹牛,LLM实际上并不能理解这么长的内容。大数字一向吸引眼球。千亿参数...……更多
GPT-4o版「Her」终于来了!讲笑话、学猫叫,AI女友能有多撩人?
...—需要更长输出内容才能满足用例,OpenAI才做出的调整。上下文和输出之间的区别GPT-4o自推出以来,便提供了最大128K的上下文窗口。而对于GPT-4o Long Output,最大上下文窗口仍然是128K。那么,OpenAI如何在保持整体上下文窗口为128K...……更多
《红楼梦》里有大量东北方言?实测AI大模型“长文阅读”
...,国内通用人工智能“初创明星”月之暗面宣布在大模型上下文窗口技术上取得新突破,旗下的Kimi智能助手可支持200万字超长无损上下文,并开启产品内测,随即引发市场关注和热议,并一度因过于火爆“宕机”。随后,阿里...……更多
终于拿到内测!豆包-PixelDance真是字节视频生成大杀器
...图模型、语音模型来了一波大升级。通用语言模型:增大上下文、提升综合能力从 5 月到 9 月,豆包大模型的使用量实现了超过 10 倍的爆发式增长,顺着这股爆发式增长的势头,火山引擎宣布将旗舰级豆包大模型「豆包通用模...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...专家架构,超10TB tokens训练,覆盖大量合成数据,推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中,用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4回答趣...……更多
Kimi开启大模型应用元年 券商推荐万兴科技掌阅科技等龙头
...助手近期实现的现象级突破。此前,月之暗面将Kimi的无损上下文长度输入能力从此前的20万字提升到了200万字,应用场景扩展到更大范围。随着Kimi的爆红,多家相关上市公司被广泛关注,并积极回复外界关切。AIGC软件A股上市公司万...……更多
自我纠错如何使OpenAI o1推理能力大大加强?北大MIT团队理论解释
...f-Correction作者团队将自我纠错的过程抽象为对齐任务,从上下文学习(In-context learning)的角度对自我纠错进行了理论分析。值得一提的是,他们并没有使用线性注意力机制下的线性回归任务进行理论分析,而是使用真实世界LLM...……更多
零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源
...代码能力和数学能力专项的继续训练模型。全球最长200K上下文窗口Yi-34B模型将发布全球最长、可支持200K超上下文窗口(contextwindow)版本,可以处理约40万汉字超文本输入。上下文窗口是大模型综合运算能力的金指标之一,对于理...……更多
黄仁勋对话Transformer七作者:很多计算资源被浪费,世界需要更好的模型
...环神经网络模型,Transformer模型能够更准确地捕捉单词的上下文和含义,因而成为了像GPT-4和ChatGPT这样的大语言模型的基础,同时也被应用于非语言领域,包括OpenAI的AI代码生成训练模型Codex、文生视频模型Sora和谷歌DeepMind的蛋白...……更多
王小川公布最新大模型,号称全球最长上下文,是GPT-4的14倍|钛媒体焦点
...模型公司“百川智能”宣布,推出Baichuan2-192K大模型,其上下文窗口长度高达192K,能够处理约35万个汉字。百川智能称,Baichuan2-192K是目前全球最长的上下文窗口,也是目前支持长上下文窗口最优秀大模型Claude2(支持100K上下文窗...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...,最新发布的 MiniCPM-V 2.6 首次将多图联合理解、多图ICL(上下文少样本学习 )功能集成在端侧模型,这也是此前业界多模态王者 GPT-4V 引以为傲的能力。1. 流畅的多图多轮理解,爽!就像人们习惯把多个文件拖拽给大模型处理,...……更多
用AI当导演,一个人就能拍电影?
...活跃用户就已成功过亿。它能够通过学习人类语言和理解上下文来实现对话互动,敢于质疑与承认错误。那么,如此强大的AI可以生成一部电影吗?AI创作电影的画面AI在电影方面的应用引发了业内的思考,上海温哥华电影学院电影制...……更多
AI赋能、短剧兴起,影视赛道 “一路生花“
...交互体验。Kimi智能助手的核心特点和功能包括:(1)长上下文处理:Kimi能够处理长达200万字的无损上下文,这意味着它可以理解和记忆大量信息,并在此基础上进行有效的交流和任务处理。(2)能力圈:Kimi的能力圈广泛,包...……更多
更多关于科技的资讯:
理想MEGA高速跑123km/h车主被扣12分罚200:或因错误识别
快科技12月25日消息,通常而言,在限速120km/h的高速路上,开小型客车如果超速在10%以内通常不会面临罚款或扣分
2024-12-25 18:06:00
《黄仁勋:英伟达之芯》作者:他内心仍把自己当中国人
快科技12月25日消息,近日腾讯科技采访了《黄仁勋:英伟达之芯》一书的作者斯蒂芬·威特,其中探讨了英伟达创始人黄仁勋的个人品质及其与企业文化的关系
2024-12-25 18:06:00
你去玩吗!日本面向中国公民新设10年旅游签:可停留天数延长至30天
12月25日消息,据报道,日本外相岩屋毅于12月25日在访问北京期间,表示针对中国公民签证的放宽措施。具体包括设立有效期10年的旅游签证
2024-12-25 18:06:00
变废为宝!全球最大甲酸钙装置投产
快科技12月25日消息,据报道,全球单套规模最大的甲酸钙生产装置日前在山东顺利开车投产。该装置为钢厂尾气高值化利用制甲酸钙装置
2024-12-25 18:06:00
《白雪公主》真人电影新剧照:邪恶皇后照魔镜
近日迪士尼《白雪公主》真人电影新剧照曝光,邪恶皇后出现在魔镜前。还有张剧照中,白雪公主和男主角乔纳森牵手。该片由瑞秋·泽格勒(《饥饿游戏
2024-12-25 18:06:00
男子为省停车费网购假车牌 结果行拘20天、罚款6000元
快科技12月25日消息,安徽警方今日披露了一起使用网购假号牌省停车费的案例。据介绍,近日,芜湖无为交警在开展日常路面整治工作中
2024-12-25 18:06:00
一箭11星!力箭一号冲击中国航天2024最后一发 淘宝88VIP冠名
12月25日,中科宇航官方宣布,力箭一号遥六运载火箭即将执行一箭11星发射任务,命名为“淘宝88VIP探索号”,并公布了任务徽章
2024-12-25 18:06:00
飞机上哪个座位最安全:后排中间
快科技12月25日消息,今日,阿塞拜疆航空公司的一架Embraer 190型飞机在哈萨克斯坦阿克套机场降落时与地面相撞
2024-12-25 18:36:00
九州风神推出FL12R系列机箱反叶风扇:配备36颗第二代ARGB灯珠
快科技12月25日消息,据报道,九州风神宣布推出FL12R系列机箱反叶风扇,提供了黑色和白色版本。售价139元起。FL12R机箱反叶风扇搭载了36颗第二代ARGB灯珠
2024-12-25 18:36:00
脑洞大开!小伙研发冬季防静电装置:我给自己接了跟地线
快科技12月25日消息,近日,一小伙自主研发了一个防静电装置的视频在网络走红。视频中,起因是小伙天天被静电电的哇哇叫,于是他脑洞大开
2024-12-25 18:36:00
柔宇资产二拍降价2.5亿又流拍!每月维护费用都要500万
快科技12月25日消息,柔宇显示公司资产12.3亿元起拍流拍后,又进行了降价二拍,起拍价仅9.8亿,目前已经结束,再次流拍
2024-12-25 18:36:00
全国统一心理援助热线:12356即将开通
内心烦恼,无人倾诉?现在好了,你可以直接拨打“12356”,咨询心理健康的相关知识,自有人替你排忧解难。据国家卫生健康委
2024-12-25 18:36:00
贵州首次!南航在黔开启空客A320飞机拆解工作
“吊起来,慢一点……好,放下……”2024年12月24日,南航贵州飞机维修厂(以下简称“维修厂”)机库内,一架空客A320飞机的拆解工作正在逐项有序开展
2024-12-25 22:44:00
突破行业局限,东郊到家如何打通健康与科技的无缝连接?
随着科技的不断进步和人们对健康关注度的提高,传统按摩行业正面临着新的挑战与机遇。如何将健康服务与现代科技结合,突破行业固有局限
2024-12-25 22:46:00
网友意外钓到“水老虎”:能吃的不像话 同类都不放过
最近在江西省,有位幸运的钓友成功钓起了一条大鱼,目测大概有七公斤半。从视频中看,这条鱼有着巨大且较尖的头部,上半身呈灰色
2024-12-25 18:36:00