• 我的订阅
  • 头条热搜
本周AI不得了!OpenAI的Sora“模拟世界”、Gemini 1.5“10M上下文”、Mistral的开源新贵同日出现
...质量令人着迷。总结:谷歌可能找到了某种新方法,将长上下文的架构理念与他们的 TPU 计算堆栈相结合,并取得了很好的效果。据 Gemini 长语境的负责人之一Pranav Shyam说,这个想法几个月前才刚刚萌芽。如果以小版本(v1.5)而...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
现在,长上下文视觉语言模型(VLM)有了新的全栈解决方案 ——LongVILA,它集系统、模型训练与数据集开发于一体。现阶段,将模型的多模态理解与长上下文能力相结合是非常重要的,支持更多模态的基础模型可以接受更灵活...……更多
...致训练成本飙升。“简单来说,就像做阅读理解时忽视了上下文的语义关系,导致生成图像中经常出现偏差需要反复修正,大幅增加了训练成本。”程明明说。如何降低训练成本、提高训练效率?研究团队在扩散训练过程中引入...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...内的大模型而言,只有Minimax采用了MoE架构。二、扩容的上下文窗口意味着什么?虽然Gemini 1.5 Pro是 Gemini 1.5 系列的初代版本,但初代便表现不俗。扩大上下文窗口后的高水平性能是Gemini 1.5 Pro的一大亮点。多模态大模型卷到今日...……更多
英国ai初创公司wayve公布gaia-1最新进展
...个共享的表示形式,进而在模型中实现统一的时序对齐和上下文理解,这种编码方法,让模型能够更好地整合和理解不同类型的输入。▲图源Wayve而GAIA-1的核心,是一个自回归Transformer,能够预测序列中下一组图像token,世界模型...……更多
全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型
...将具备多步骤推理能力。来源:谷歌谷歌的Gemini以超长的上下文窗口而出名。在大会上,谷歌重点强调了大模型Gemini 1.5 Pro的多模态和长文本能力,为其推出一系列更新。谷歌将向全球150多个国家地区的Gemini Advanced订阅者提供最...……更多
Kimi引爆人工智能新风口,龙头连续20CM涨停!哪些公司可
...宣布,公司旗下的kimi智能助手,已支持200万字超长无损上下文,并已开启产品内测。继昨日爆发后,kimi概念股今天(3月21日)继续上涨。其中,龙头股华策影视(300133.SZ)再次涨停,连续收获两个20CM涨停,捷成股份(300182.SZ)...……更多
...流趋势。“Sora能够生成60秒时长的视频说明它的技术对于上下文的信息理解是非常优秀的,比如在视频场景的变换下能够识别同一主体,又如能够理解带有情感倾向的文字并通过画面表现出来。”他认为,“拟人化”和“理解世...……更多
...方不断加码。Gemini1.5 Pro基于大语言模型处理视频模态,上下文长度超过百万, Sora在技术上采用了Diffusion Transformer的路线,OpenAI表示Sora在训练过程中表现出了与其他模型不同的涌现能力,有望成为真正的“世界模型”。从投资...……更多
4090单卡可跑,6秒直出电影级画质,智谱版Sora正式开源!
...时间因果卷积确保了信息的因果性,减少了通信开销。而上下文并行技术的采用,则可以适应大规模视频处理。 实验中,团队发现大分辨率编码易于泛化,而增加帧数则挑战较大。因此,可将分两阶段训练模型:- 首先在较低...……更多
rtxai助手的进化
...Assist项目可接收玩家的语音或文字输入内容,游戏窗口的上下文信息,并通过AI视觉模型处理数据。这些模型增强了与游戏知识数据库相连的大语言模型(LLM)的上下文感知和对特定游戏及应用的理解,然后生成定制的回复,以文...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
大模型的上下文长度快速增长,超长上下文解锁新应用,但推理计算代价高昂,上下文本身对于信息不会进行压缩,不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年,人工智能领域风起...……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...Phi-3.5,适合在内存和算力受限的环境中运行,均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-instruct可胜任复杂推理任务,Phi-3.5-vision-instruct则兼具文本与视觉能力。性能最强大的Phi-3……更多
Sora“超级涌现力”将把AI引向何方
...的最小单元进行有意义的关联组合。比如,在保持连贯的上下文语境中,对若干个单词进行有意义组合,从而连缀成一个会意句子;在保持合理的空间布局下,对众多图像小块进行有意义组合,拼合为一幅精彩图像;在保持一致...……更多
10分钟速成专家,「Kimi智能助手」正式支持200万上下文,对话窗口提升10倍 | 最前线
...正式宣布,旗下的Kimi智能助手,已支持200万字超长无损上下文,并于即日起开启产品内测。Kimi智能助手是月之暗面(Moonshot AI)基于自研千亿参数大模型打造的对话式 AI 助手产品,在2023年10月正式发布。而月之暗面也是国内大...……更多
长上下文能力只是吹牛?最强GPT-4o正确率仅55.8%,开源模型不如瞎蒙
...lan【新智元导读】当今的LLM已经号称能够支持百万级别的上下文长度,这对于模型的能力来说,意义重大。但近日的两项独立研究表明,它们可能只是在吹牛,LLM实际上并不能理解这么长的内容。大数字一向吸引眼球。千亿参数...……更多
GPT-4o版「Her」终于来了!讲笑话、学猫叫,AI女友能有多撩人?
...—需要更长输出内容才能满足用例,OpenAI才做出的调整。上下文和输出之间的区别GPT-4o自推出以来,便提供了最大128K的上下文窗口。而对于GPT-4o Long Output,最大上下文窗口仍然是128K。那么,OpenAI如何在保持整体上下文窗口为128K...……更多
《红楼梦》里有大量东北方言?实测AI大模型“长文阅读”
...,国内通用人工智能“初创明星”月之暗面宣布在大模型上下文窗口技术上取得新突破,旗下的Kimi智能助手可支持200万字超长无损上下文,并开启产品内测,随即引发市场关注和热议,并一度因过于火爆“宕机”。随后,阿里...……更多
终于拿到内测!豆包-PixelDance真是字节视频生成大杀器
...图模型、语音模型来了一波大升级。通用语言模型:增大上下文、提升综合能力从 5 月到 9 月,豆包大模型的使用量实现了超过 10 倍的爆发式增长,顺着这股爆发式增长的势头,火山引擎宣布将旗舰级豆包大模型「豆包通用模...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...专家架构,超10TB tokens训练,覆盖大量合成数据,推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中,用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4回答趣...……更多
Kimi开启大模型应用元年 券商推荐万兴科技掌阅科技等龙头
...助手近期实现的现象级突破。此前,月之暗面将Kimi的无损上下文长度输入能力从此前的20万字提升到了200万字,应用场景扩展到更大范围。随着Kimi的爆红,多家相关上市公司被广泛关注,并积极回复外界关切。AIGC软件A股上市公司万...……更多
零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源
...代码能力和数学能力专项的继续训练模型。全球最长200K上下文窗口Yi-34B模型将发布全球最长、可支持200K超上下文窗口(contextwindow)版本,可以处理约40万汉字超文本输入。上下文窗口是大模型综合运算能力的金指标之一,对于理...……更多
黄仁勋对话Transformer七作者:很多计算资源被浪费,世界需要更好的模型
...环神经网络模型,Transformer模型能够更准确地捕捉单词的上下文和含义,因而成为了像GPT-4和ChatGPT这样的大语言模型的基础,同时也被应用于非语言领域,包括OpenAI的AI代码生成训练模型Codex、文生视频模型Sora和谷歌DeepMind的蛋白...……更多
王小川公布最新大模型,号称全球最长上下文,是GPT-4的14倍|钛媒体焦点
...模型公司“百川智能”宣布,推出Baichuan2-192K大模型,其上下文窗口长度高达192K,能够处理约35万个汉字。百川智能称,Baichuan2-192K是目前全球最长的上下文窗口,也是目前支持长上下文窗口最优秀大模型Claude2(支持100K上下文窗...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...,最新发布的 MiniCPM-V 2.6 首次将多图联合理解、多图ICL(上下文少样本学习 )功能集成在端侧模型,这也是此前业界多模态王者 GPT-4V 引以为傲的能力。1. 流畅的多图多轮理解,爽!就像人们习惯把多个文件拖拽给大模型处理,...……更多
用AI当导演,一个人就能拍电影?
...活跃用户就已成功过亿。它能够通过学习人类语言和理解上下文来实现对话互动,敢于质疑与承认错误。那么,如此强大的AI可以生成一部电影吗?AI创作电影的画面AI在电影方面的应用引发了业内的思考,上海温哥华电影学院电影制...……更多
AI赋能、短剧兴起,影视赛道 “一路生花“
...交互体验。Kimi智能助手的核心特点和功能包括:(1)长上下文处理:Kimi能够处理长达200万字的无损上下文,这意味着它可以理解和记忆大量信息,并在此基础上进行有效的交流和任务处理。(2)能力圈:Kimi的能力圈广泛,包...……更多
MemGPT团队官宣创业,融资1000万美金,硅谷大佬Jeff Dean也投了
...宣创业。由该团队创立的Letta公司,推出了一个同名的AI上下文内存管理平台Letta。最近2年,大语言模型快速发展,但受到上下文窗口长度的限制,导致它在多轮对话和文档分析等任务中的适用性较差。针对这个问题,Letta提出了...……更多
四大新功能让生成式AI“如虎添翼”
...本并进行训练,这种训练使聊天机器人能够在对话中结合上下文语境,产生类似人类的文本响应。目前,智能客服聊天机器人集成了这项技术。随着这些机器人在语言翻译、创造性写作、理解上下文并作出有意义反应方面的能力...……更多
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...款面向C端的大模型产品。早前,该公司宣布在大模型长上下文窗口技术上取得新的突破,Kimi已支持200万字超长无损上下文,并开启产品内测,该能力在不到半年内提升9倍。市场的火爆,导致Kimi服务器一度瘫痪,无法回复用户...……更多
更多关于科技的资讯:
近日,西湖区举行环大学创新生态圈“一圈一试点”启动大会。会上,西湖区以“创新令”为号角,为环紫金港、环老和山等五大环大学创新生态圈划定年度攻坚目标
2025-03-25 07:51:00
特斯拉撞上高速护栏腾空翻两圈 司机下车后竟毫发无伤
快科技3月25日消息,湖北高速交警发布的视频显示,在杭瑞高速通山段,一辆特斯拉开上导流线,并高速撞上了中间的护栏。高速撞击后
2025-03-25 08:02:00
TCL夺中国电视市场出货量第一 大涨近40%
快科技3月25日消息,据洛图科技(RUNTO)最新数据显示,在今年1-2月期间,TCL系品牌于中国电视市场表现卓越,出货量稳居行业榜首
2025-03-25 08:02:00
我国多地实施小学生作业熔断机制:晚上9点半停写 无需补做
快科技3月25日消息,为了保证小学生的睡眠,不少城市的学校已经开始了作业熔断机制。近日,《蚌埠市加强义务教育阶段学生作业管理的七条规定》(下称《七条规定》)出台
2025-03-25 08:02:00
雷军回武大:在雷军班分享学习经验
快科技3月25日消息,武大的樱花是全国著名“景点”之一,每年春暖花开之际都会吸引无数游客和校友参观。雷军作为著名校友,日前也重返母校
2025-03-25 08:02:00
小米SU7前车识别功能除了识别车辆 还可以干啥
快科技3月25日消息,目前小米汽车的“前车识别”已全量上线所有在售的小米汽车,车主通过唤醒“小爱同学”即可体验。该功能现已支持1000多辆常见车识别
2025-03-25 08:32:00
GoPro发布广角变形镜
售价高达130美元的附加镜头模组可提供21:9画幅超宽视野,适用于Hero 13 Black运动相机:相机检测到模组被安装后会自动切换至相应模式以补偿(矫正)变形失真
2025-03-25 08:32:00
华为联通携手部署F5G-A万兆光网:实测网速接近10000Mbps!
快科技3月25日消息,据华为官方介绍,近日海南联通在琼海市博鳌亚洲论坛年会新闻中心(博鳌亚洲论坛大酒店)完成了基于华为50G PON解决方案的F5G-A万兆光网试点
2025-03-25 08:32:00
300斤野猪勇闯肉联厂 獠牙锋利无比凶猛 被一斧敲晕
快科技3月25日消息,日前,在广西柳州柳南肉联厂内,一头野猪突然横冲直撞,引发了现场的一阵骚动。面对这头凶猛且突如其来的野兽
2025-03-25 08:32:00
蔚来李斌:没想到欧洲人办事这么慢 让我们交了大量学费
快科技3月25日消息,日前,蔚来董事长李斌邀请十多家机构、媒体在北京举办了一场小范围的沟通会,期间围绕蔚来近期的组织变革和盈利目标等话题透露出不少信息
2025-03-25 08:32:00
厦门智算“火车头”带着AI跑进千行百业 开展创新服务
算力短时破局●去年年初,厦门的公共智能算力仅有100多P,与我市产业实际需求的约700P相比存在较大缺口。●去年年底,厦门公共智能算力规模已达1000P
2025-03-25 08:32:00
厦门网讯(厦门日报记者 吴君宁)连日来,一场全球显示技术领域的顶级盛会在我市举办——国际显示技术大会(ICDT 2025)22日在厦门佰翔会展中心开幕
2025-03-25 08:32:00
厦门网讯(厦门日报记者 林露虹)厦企牵手华为探索减碳路径,建设绿色工厂。近日,厦企宇电与华为数字能源就“助力绿色能源发展”签署战略合作协议
2025-03-25 08:32:00
留住一个格瑞邦,引来一支“梦之队”——石家庄以“产业合伙人”思维打造电脑整机产业链“订单供不应求,来石家庄,真是选对了
2025-03-25 08:47:00
郓城2025暖春焕新季启幕 电商直播引燃消费潮
鲁网3月24日讯3月22日,“惠享菏泽·约惠郓城”2025暖春焕新季暨提振消费年主题活动在唐塔广场盛大启幕。活动通过“线上直播+线下展销”联动模式
2025-03-25 08:58:00