• 我的订阅
  • 头条热搜
国产地表最强视频模型震惊歪果仁,官方现场摇人30s直出!视觉模型进入上下文时代
...刚刚诞生!Vidu 1.5一上线,全网网友都震惊了:LLM独有的上下文学习优势,视觉模型居然也有了。来自中国的视频生成模型,再一次震惊了全球大模型圈。生数科技推出的Vidu 1.5,成为世界首个支持多主体一致性的多模态模型!...……更多
长上下文能力只是吹牛?最强GPT-4o正确率仅55.8%,开源模型不如瞎蒙
...lan【新智元导读】当今的LLM已经号称能够支持百万级别的上下文长度,这对于模型的能力来说,意义重大。但近日的两项独立研究表明,它们可能只是在吹牛,LLM实际上并不能理解这么长的内容。大数字一向吸引眼球。千亿参数...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...代表包含了图像(VI)和图像中的文字(TEI)两部分作为上下文信息,模型能还原出被遮住的文字的准确率。蓝色框内表示仅包含图像中的文字(TEI)的作为上下文信息,并不包含图像(VI),模型能还原出的遮住文字的准确率...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
现在,长上下文视觉语言模型(VLM)有了新的全栈解决方案 ——LongVILA,它集系统、模型训练与数据集开发于一体。现阶段,将模型的多模态理解与长上下文能力相结合是非常重要的,支持更多模态的基础模型可以接受更灵活...……更多
本周AI不得了!OpenAI的Sora“模拟世界”、Gemini 1.5“10M上下文”、Mistral的开源新贵同日出现
...质量令人着迷。总结:谷歌可能找到了某种新方法,将长上下文的架构理念与他们的 TPU 计算堆栈相结合,并取得了很好的效果。据 Gemini 长语境的负责人之一Pranav Shyam说,这个想法几个月前才刚刚萌芽。如果以小版本(v1.5)而...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...内的大模型而言,只有Minimax采用了MoE架构。二、扩容的上下文窗口意味着什么?虽然Gemini 1.5 Pro是 Gemini 1.5 系列的初代版本,但初代便表现不俗。扩大上下文窗口后的高水平性能是Gemini 1.5 Pro的一大亮点。多模态大模型卷到今日...……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...Phi-3.5,适合在内存和算力受限的环境中运行,均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-instruct可胜任复杂推理任务,Phi-3.5-vision-instruct则兼具文本与视觉能力。性能最强大的Phi-3……更多
...致训练成本飙升。“简单来说,就像做阅读理解时忽视了上下文的语义关系,导致生成图像中经常出现偏差需要反复修正,大幅增加了训练成本。”程明明说。如何降低训练成本、提高训练效率?研究团队在扩散训练过程中引入...……更多
AI翻译界杀手诞生!阿里国际翻译大模型吊打谷歌和GPT-4
...译能力就会大幅下降。除了训练数据的局限性之外,AI的上下文理解有限、也让不同语种的语言结构差异和文化语境差异等原因,也会导致AI经常给出偏差很远的答案。就没有一款轻易上手、放心可用的高效AI翻译工具吗?我们经...……更多
最强AI程序员砸饭碗:84秒跑通代码 像人一样思考
...队表示,最初开发Genie时,只能访问微调16-32k范围内的短上下文模型,他们用这些模型进行了大量早期开发,用超1亿token的数据训练模型,虽然发现设计的架构有一定优势,但从根本上受限于模型在特定时间内可以处理的信息量...……更多
openai推出gpt-4turbo:比上代便宜三倍
...者而言“比上代GPT-4便宜三倍”。据悉,GPT-4Turbo支持128k上下文,输入价格比GPT-4便宜了三倍,速率限制翻倍,知识库更新到2023年4月,此外还添加了JSONMode,更新了多个函数调用能力。相对此前GPT-4性能更强、价格更便宜、开发成...……更多
OpenAI史诗级更新!最强大模型炸场,128K上下文、价格暴降2/3
...大方面更新重点值得关注和思考。1、GPT-4 Turbo:支持128k上下文,相当于300页文档,输入价格大降2/3,速率限制翻倍,知识更新到2023年4月,改进指令跟随和JSON Mode,更新多个函数调用能力。这意味着比GPT-4更强、更便宜、开发成...……更多
Mistral放大招!124B多模态巨无霸登场,免费版ChatGPT震撼突袭
...展1230亿参数的多模态解码器,10亿参数的视觉编码器128K上下文窗口长度:可容纳至少30张高分辨率图像具体来说,Pixtral Large是Mistral多模态系列的第二个模型,基于Mistral Large 2构建,有1240亿参数。该模型能够理解文档、图表和自...……更多
英国ai初创公司wayve公布gaia-1最新进展
...个共享的表示形式,进而在模型中实现统一的时序对齐和上下文理解,这种编码方法,让模型能够更好地整合和理解不同类型的输入。▲图源Wayve而GAIA-1的核心,是一个自回归Transformer,能够预测序列中下一组图像token,世界模型...……更多
非Transformer架构站起来了!首个纯无注意力大模型,超越Llama 3.1
...每个单词(或 token)与文本中的每个单词进行比较来理解上下文,它需要更多的计算能力和内存需求来处理不断增长的上下文窗口。但是如果不相应地扩展计算资源,模型推理速度就会变慢,超过一定长度的文本就没法处理了。...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...,Meta还推出了1B和3B两个轻量级纯文本的版本,可支持128K上下文。别看参数少,1B/3B在总结摘要、指令遵循、重写等任务上,表现非常出色,而且专为Arm处理器做了优化。LeCun激动地表示,「可爱的大羊驼宝宝来了」!Meta首席技...……更多
AI大模型行业报告:大模型发展迈入爆发期,开启AI新纪元(附下载)
...以带来大幅的模型性能提升。同时,GPT-3论文正式提出“上下文学习”,建立了以提示学习方法为基础技术路线的任务求解范式。ChatGPT:一举成为现象级应用,引入RLHF算法改进训练数据GPT系列模型的技术演变(ChatGPT):在GPT-3...……更多
AI“大姨”现场刁难智能客服!直击一群AI打PK赛,真能落地的那种
...个满足现在用户需求的智能客服。能理解用户问题、结合上下文给出解决办法,并且有情商、说人话、能面对各种复杂情景。而且上手门槛很低。 比如参赛选手云蝠智能,他们的主打业务是电话客服,在文本客服方面的积累不...……更多
3D大模型助力,15分钟即可训练高质量、个性化的数字人模型
...t (ICLR 2024) 适应到目标数字人的高效微调策略和(2)具有上下文学习能力的人脸动作生成模型,MimicTalk 可以生成相比原有方法更高质量、更具表现力的数字人视频。此外,单个数字人模型的训练时间可以被压缩到 15 分钟以内,...……更多
GPT-4o版「Her」终于来了!讲笑话、学猫叫,AI女友能有多撩人?
...—需要更长输出内容才能满足用例,OpenAI才做出的调整。上下文和输出之间的区别GPT-4o自推出以来,便提供了最大128K的上下文窗口。而对于GPT-4o Long Output,最大上下文窗口仍然是128K。那么,OpenAI如何在保持整体上下文窗口为128K...……更多
王小川公布最新大模型,号称全球最长上下文,是GPT-4的14倍|钛媒体焦点
...模型公司“百川智能”宣布,推出Baichuan2-192K大模型,其上下文窗口长度高达192K,能够处理约35万个汉字。百川智能称,Baichuan2-192K是目前全球最长的上下文窗口,也是目前支持长上下文窗口最优秀大模型Claude2(支持100K上下文窗...……更多
新扩散模型OmniGen一统图像生成,架构还高度简化、易用
...机视觉任务:图像去噪、边缘检测、姿态估计等 一定的上下文学习能力 (In-context Learning)以下简要展示部分能力效果:2.1 文本到图像生成 2.2 指代表达生成OmniGen 具备类似 InstandID、Pulid 等模型生成角色一致性图像等能力,即:输...……更多
微软开源 OmniParser 纯视觉 GUI 智能体:让 GPT-4V秒懂屏幕截图
...当前屏幕解析技术中的空白。该工具并不需要依赖额外的上下文数据,可以理解更复杂的图形用户界面(GUI),是智能 GUI 自动化领域的一项令人兴奋的进展。 OmniParser 结合可交互区域检测模型、图标描述模型和 OCR 模块等,不...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
大模型的上下文长度快速增长,超长上下文解锁新应用,但推理计算代价高昂,上下文本身对于信息不会进行压缩,不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年,人工智能领域风起...……更多
MemGPT团队官宣创业,融资1000万美金,硅谷大佬Jeff Dean也投了
...宣创业。由该团队创立的Letta公司,推出了一个同名的AI上下文内存管理平台Letta。最近2年,大语言模型快速发展,但受到上下文窗口长度的限制,导致它在多轮对话和文档分析等任务中的适用性较差。针对这个问题,Letta提出了...……更多
终于拿到内测!豆包-PixelDance真是字节视频生成大杀器
...图模型、语音模型来了一波大升级。通用语言模型:增大上下文、提升综合能力从 5 月到 9 月,豆包大模型的使用量实现了超过 10 倍的爆发式增长,顺着这股爆发式增长的势头,火山引擎宣布将旗舰级豆包大模型「豆包通用模...……更多
阿里云百炼上线Qwen2.5-Turbo模型,可支持100万超长上下文
...的Qwen2.5-Turbo已在阿里云百炼上线,该模型支持100万超长上下文,相当于100万个英文单词或150万个汉字,在多个长文本评测集上的性能表现超越GPT-4。即日起,所有用户可在阿里云百炼调用Qwen2.5-TurboAPI,百万tokens仅需0.3元。全新...……更多
Mamba再次挑战霸主Transformer!首个通用Mamba开源大模型一鸣惊人
...有效地捕获其关系。这种通过比较文本中每个token来理解上下文的方式,需要更多的计算能力和内存来处理不断增长的上下文窗口。如果资源没有相应扩展,推理速度会变慢,最终无法处理超过某个固定长度的文本。为了解决这...……更多
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...款面向C端的大模型产品。早前,该公司宣布在大模型长上下文窗口技术上取得新的突破,Kimi已支持200万字超长无损上下文,并开启产品内测,该能力在不到半年内提升9倍。市场的火爆,导致Kimi服务器一度瘫痪,无法回复用户...……更多
打脸“AI灭绝伦”!研究反驳:大模型涌现能力不会威胁人类生存
...(ACL)上。他们通过一系列实验验证了 AI 大模型在不同上下文条件下的表现,结果发现:在零样本(zero-shot)的情况下,许多大模型根本无法展现所谓的“涌现能力”,反而表现得相当一般。他们表示,这一发现有助于理解 LLM ...……更多
更多关于科技的资讯:
电动车主分享高速服务区充电小妙招:过个通道立马不用排队等桩
快科技2月2日消息,随着新能源汽车保有量的增多,每年春运期间都会出现服务区充电排队的情况。日前,有电动车车主分享了一个高速服务区充电小妙招
2025-02-02 12:40:00
《哪吒》导演饺子:试过外包给国际团队制作 但效果不理想
快科技2月2日消息,据网络平台最新数据,截至2月2日11时12分,2025春节档总票房(含预售)破64亿元。《哪吒之魔童闹海》《唐探1900》《封神第二部
2025-02-02 12:40:00
最便宜的50系列显卡终于来了!RTX 5060 Ti/5060将于3月上市:最高16GB大显存
快科技2月2日消息,RTX 5090D(国内特供版)、RTX 5080已于1月30日(大年初二)正式在国内上市。虽然性能顶级
2025-02-02 12:40:00
DeepSeek-R1大模型登陆腾讯云:一键部署 3分钟调用
快科技2月2日消息,据腾讯云官微发文,DeepSeek-R1大模型一键部署至腾讯云「HAI」上,开发者仅需3分钟就能接入调用
2025-02-02 13:10:00
Intel下一代移动、桌面CPU官宣!Panther Lake 2025年下半年推出 Nova Lake 2026年见
快科技2月2日消息,尽管2024年第四季度财报表现不佳,但Intel的制造工艺、产品并未停歇,各项工作依然在积极推进。被外界寄予厚望
2025-02-02 14:10:00
华为三折叠即将走向世界!Mate XT非凡大师获阿联酋认证
快科技2月2日消息,华为Mate XT三折叠手机近日通过了阿联酋TDRA的官方认证,型号为GRL-LX9,注册编号为ER41137/25
2025-02-02 15:10:00
最快的N卡和最快的A卡跑DeepSeek谁更快:RTX 5090比RX 7900 XTX快一倍
快科技2月2日消息,最快的N卡和最快的A卡跑DeepSeek谁更快?最新消息显示,RTX 5090在DeepSeek R上的推理性能比AMD的 RX 7900 XTX快得多
2025-02-02 15:10:00
玩家被耍!整个欧洲的RTX 5090、5080公版卡发售前就被黄牛机器人抢空了
快科技2月2日消息,RTX 5090、5080已于1月30日正式上市,但极度缺货,想以官价买到几乎不可能。除了供应短缺之外
2025-02-02 15:40:00
2024年中国外贸总值破43万亿,人民日报金社平夸赞喜临门
2025年开年,中国外贸传来振奋人心的好消息:2024年外贸总值突破43.85万亿元,同比增长5%。人民日报署名金社平发文《从外贸看中国经济韧性》
2025-02-02 15:49:00
从春晚配角到主角他熬了20年 网友:瘦了 也长高了
快科技2月2日消息,今日,#从春晚配角到主角他熬了20年#话题登上热搜。2025年春晚现场,扭秧歌的机器人引发网友关注
2025-02-02 16:10:00
民企“后浪”奔涌 | 卢科宇:回乡创业 看好家乡的“戏”引力
编者按:民营经济是稳定增长、促进创新、增加就业、改善民生的重要基础,是建设现代化经济体系的重要支撑,是企业家精神的重要发源地
2025-02-02 16:35:00
年后的第一款Ultra旗舰!华硕Zenfone 12 Ultra渲染图曝光
快科技2月2日消息,华硕即将推出的Zenfone 12 Ultra手机的渲染图近日被德国科技媒体WinFuture曝光
2025-02-02 16:40:00
三防机里的双屏手机!道格发布Doogee S119:10200mAh电池+双屏设计实数另类
快科技2月2日消息,国产三防手机制造商道格(Doogee)近期在海外市场推出了一款名为Doogee S119的新机型。这款手机以其独特的双屏设计和超大容量电池吸引了众多关注
2025-02-02 17:10:00
斯诺登怒喷英伟达RTX 50系列显卡性价比低下:针对消费者的垄断犯罪
快科技2月2日消息,美国中央情报局(CIA)前雇员、“棱镜门”项目泄密者爱德华·斯诺登日前发表了对英伟达GTX 50系列显卡的评论
2025-02-02 17:40:00
《哪吒2》因为时长砍掉镜头 导演饺子:认没认真观众一眼就看得出来
快科技2月2日消息,据猫眼专业版数据,2月2日17时24分,2025春节档总票房(含预售)破70亿。《哪吒之魔童闹海》《唐探1900》《封神第二部
2025-02-02 18:10:00