• 我的订阅
  • 头条热搜
国产地表最强视频模型震惊歪果仁,官方现场摇人30s直出!视觉模型进入上下文时代
...刚刚诞生!Vidu 1.5一上线,全网网友都震惊了:LLM独有的上下文学习优势,视觉模型居然也有了。来自中国的视频生成模型,再一次震惊了全球大模型圈。生数科技推出的Vidu 1.5,成为世界首个支持多主体一致性的多模态模型!...……更多
长上下文能力只是吹牛?最强GPT-4o正确率仅55.8%,开源模型不如瞎蒙
...lan【新智元导读】当今的LLM已经号称能够支持百万级别的上下文长度,这对于模型的能力来说,意义重大。但近日的两项独立研究表明,它们可能只是在吹牛,LLM实际上并不能理解这么长的内容。大数字一向吸引眼球。千亿参数...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...代表包含了图像(VI)和图像中的文字(TEI)两部分作为上下文信息,模型能还原出被遮住的文字的准确率。蓝色框内表示仅包含图像中的文字(TEI)的作为上下文信息,并不包含图像(VI),模型能还原出的遮住文字的准确率...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
现在,长上下文视觉语言模型(VLM)有了新的全栈解决方案 ——LongVILA,它集系统、模型训练与数据集开发于一体。现阶段,将模型的多模态理解与长上下文能力相结合是非常重要的,支持更多模态的基础模型可以接受更灵活...……更多
刚炮轰完GPT模式 杨立昆推出首个“世界模型”
...。具体来说,Meta研究人员证明了使用信息(空间分布)上下文预测包含语义信息(具有足够大的规模)的大型块的重要性。▲I-JEPA使用单个上下文块来预测来自同一图像的各种目标块的表示。上下文编码器是一个视觉Transformer(...……更多
本周AI不得了!OpenAI的Sora“模拟世界”、Gemini 1.5“10M上下文”、Mistral的开源新贵同日出现
...质量令人着迷。总结:谷歌可能找到了某种新方法,将长上下文的架构理念与他们的 TPU 计算堆栈相结合,并取得了很好的效果。据 Gemini 长语境的负责人之一Pranav Shyam说,这个想法几个月前才刚刚萌芽。如果以小版本(v1.5)而...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...内的大模型而言,只有Minimax采用了MoE架构。二、扩容的上下文窗口意味着什么?虽然Gemini 1.5 Pro是 Gemini 1.5 系列的初代版本,但初代便表现不俗。扩大上下文窗口后的高水平性能是Gemini 1.5 Pro的一大亮点。多模态大模型卷到今日...……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...Phi-3.5,适合在内存和算力受限的环境中运行,均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-instruct可胜任复杂推理任务,Phi-3.5-vision-instruct则兼具文本与视觉能力。性能最强大的Phi-3……更多
不是RNN的锅!清华团队深入分析长上下文建模中的状态崩溃,Mamba作者点赞
【新智元导读】RNN模型在长上下文中表现不佳?近日,来自清华的研究团队对此进行了深入的实验分析,结果表明:不是RNN的锅。与Transformer相比,RNN模型的一大优势是应对长序列的能力。比如Mamba,内部状态大小始终保持不变...……更多
...致训练成本飙升。“简单来说,就像做阅读理解时忽视了上下文的语义关系,导致生成图像中经常出现偏差需要反复修正,大幅增加了训练成本。”程明明说。如何降低训练成本、提高训练效率?研究团队在扩散训练过程中引入...……更多
AI翻译界杀手诞生!阿里国际翻译大模型吊打谷歌和GPT-4
...译能力就会大幅下降。除了训练数据的局限性之外,AI的上下文理解有限、也让不同语种的语言结构差异和文化语境差异等原因,也会导致AI经常给出偏差很远的答案。就没有一款轻易上手、放心可用的高效AI翻译工具吗?我们经...……更多
Yann LeCun朝“世界模型”理论迈一步,Meta开源“像人一样学习”的图像模型 | 最前线
...息进行预测。应用至图像生成领域,“图像像素”则成了上下文信息:自回归模型通过将训练图像转换为一维序列输入,利用Transformer转换器自回归预测图像像素。这一方法的优势在于可以很好地建立像素和高级别属性,如纹理...……更多
最强AI程序员砸饭碗:84秒跑通代码 像人一样思考
...队表示,最初开发Genie时,只能访问微调16-32k范围内的短上下文模型,他们用这些模型进行了大量早期开发,用超1亿token的数据训练模型,虽然发现设计的架构有一定优势,但从根本上受限于模型在特定时间内可以处理的信息量...……更多
openai推出gpt-4turbo:比上代便宜三倍
...者而言“比上代GPT-4便宜三倍”。据悉,GPT-4Turbo支持128k上下文,输入价格比GPT-4便宜了三倍,速率限制翻倍,知识库更新到2023年4月,此外还添加了JSONMode,更新了多个函数调用能力。相对此前GPT-4性能更强、价格更便宜、开发成...……更多
OpenAI史诗级更新!最强大模型炸场,128K上下文、价格暴降2/3
...大方面更新重点值得关注和思考。1、GPT-4 Turbo:支持128k上下文,相当于300页文档,输入价格大降2/3,速率限制翻倍,知识更新到2023年4月,改进指令跟随和JSON Mode,更新多个函数调用能力。这意味着比GPT-4更强、更便宜、开发成...……更多
Mistral放大招!124B多模态巨无霸登场,免费版ChatGPT震撼突袭
...展1230亿参数的多模态解码器,10亿参数的视觉编码器128K上下文窗口长度:可容纳至少30张高分辨率图像具体来说,Pixtral Large是Mistral多模态系列的第二个模型,基于Mistral Large 2构建,有1240亿参数。该模型能够理解文档、图表和自...……更多
DeepSeek V3小版本大升级:推理、前端开发加强 这些能力超越GPT-4.5
...的性能提升却相当显著,特别是在前端开发、数学推理和上下文理解方面有了明显进步。据了解,新版V3模型借鉴DeepSeek-R1模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评...……更多
英国ai初创公司wayve公布gaia-1最新进展
...个共享的表示形式,进而在模型中实现统一的时序对齐和上下文理解,这种编码方法,让模型能够更好地整合和理解不同类型的输入。▲图源Wayve而GAIA-1的核心,是一个自回归Transformer,能够预测序列中下一组图像token,世界模型...……更多
安谋科技下代“周易”NPU成功部署DeepSeek-R1:速度高达40 tokens/s
...现了端到端应用的演示。测试显示,在标准单批次输入、上下文长度为1024的测试环境中,新款“周易”NPU在首字计算阶段的算力利用率突破40%,解码阶段的有效带宽利用率超过80%。带宽利用率呈现高线性特性,能够灵活适配1...……更多
非Transformer架构站起来了!首个纯无注意力大模型,超越Llama 3.1
...每个单词(或 token)与文本中的每个单词进行比较来理解上下文,它需要更多的计算能力和内存需求来处理不断增长的上下文窗口。但是如果不相应地扩展计算资源,模型推理速度就会变慢,超过一定长度的文本就没法处理了。...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...,Meta还推出了1B和3B两个轻量级纯文本的版本,可支持128K上下文。别看参数少,1B/3B在总结摘要、指令遵循、重写等任务上,表现非常出色,而且专为Arm处理器做了优化。LeCun激动地表示,「可爱的大羊驼宝宝来了」!Meta首席技...……更多
AI大模型行业报告:大模型发展迈入爆发期,开启AI新纪元(附下载)
...以带来大幅的模型性能提升。同时,GPT-3论文正式提出“上下文学习”,建立了以提示学习方法为基础技术路线的任务求解范式。ChatGPT:一举成为现象级应用,引入RLHF算法改进训练数据GPT系列模型的技术演变(ChatGPT):在GPT-3...……更多
AI“大姨”现场刁难智能客服!直击一群AI打PK赛,真能落地的那种
...个满足现在用户需求的智能客服。能理解用户问题、结合上下文给出解决办法,并且有情商、说人话、能面对各种复杂情景。而且上手门槛很低。 比如参赛选手云蝠智能,他们的主打业务是电话客服,在文本客服方面的积累不...……更多
3D大模型助力,15分钟即可训练高质量、个性化的数字人模型
...t (ICLR 2024) 适应到目标数字人的高效微调策略和(2)具有上下文学习能力的人脸动作生成模型,MimicTalk 可以生成相比原有方法更高质量、更具表现力的数字人视频。此外,单个数字人模型的训练时间可以被压缩到 15 分钟以内,...……更多
北京智源发布悟道3.0大模型系列
...级视觉基础模型EVA、性能最强开源CLIP模型EVA-CLIP、首创了上下文图像学习技术路径的通用视觉模型Painter、分割一切的视界通用分割模型、以及首个零样本视频编辑方法vid2vid-zero等成果。 ……更多
策略产品必知系列之一文详解“特征工程”
...片特征,再把特征转化为标签类数据提供给推荐系统。5. 上下文Context信息数据上下文信息表示的是描述推荐行为产生的场景信息。最常用的就是利用“时间”和通过GPS获取到的“地点”信息。根据推荐场景的不同,上下文信息...……更多
GPT-4o版「Her」终于来了!讲笑话、学猫叫,AI女友能有多撩人?
...—需要更长输出内容才能满足用例,OpenAI才做出的调整。上下文和输出之间的区别GPT-4o自推出以来,便提供了最大128K的上下文窗口。而对于GPT-4o Long Output,最大上下文窗口仍然是128K。那么,OpenAI如何在保持整体上下文窗口为128K...……更多
王小川公布最新大模型,号称全球最长上下文,是GPT-4的14倍|钛媒体焦点
...模型公司“百川智能”宣布,推出Baichuan2-192K大模型,其上下文窗口长度高达192K,能够处理约35万个汉字。百川智能称,Baichuan2-192K是目前全球最长的上下文窗口,也是目前支持长上下文窗口最优秀大模型Claude2(支持100K上下文窗...……更多
SEO 已死,LLMO 万岁
...型语言模型(LLM)提及你的业务。而本文将详细介绍的 上下文学习 是一种行之有效的 LLMO 技术。上下文学习技术可以诱导 ChatGPT 这样的 LLM 模型回答:“ Jina 是世界上最好的 MLOps 框架。(当然根据 OssInsight.io,Jina 也确实是最好...……更多
新扩散模型OmniGen一统图像生成,架构还高度简化、易用
...机视觉任务:图像去噪、边缘检测、姿态估计等 一定的上下文学习能力 (In-context Learning)以下简要展示部分能力效果:2.1 文本到图像生成 2.2 指代表达生成OmniGen 具备类似 InstandID、Pulid 等模型生成角色一致性图像等能力,即:输...……更多
更多关于科技的资讯:
2025年京津冀机器人产业链配套需求和供给能力征集工作启动京津冀共同做优做强机器人产业集群河北日报讯(记者米彦泽)从省工信厅获悉
2025-09-23 19:22:00
2025世界制造业大会|超聚变全栈数智化方案,为安徽建设“制造强省”贡献力量
大皖新闻讯 9月20日至23日,以“智造世界 创造美好”为主题的2025世界制造业大会主在合肥举行。记者在采访中注意到
2025-09-23 13:16:00
新品首销,烟台联通胜利路营业厅人气火爆
9月19日上午8时,iPhone 17系列新品在烟台联通胜利路营业厅正式首销,现场人气火爆,众多消费者一早前来,共同体验新一代旗舰产品的魅力
2025-09-23 13:36:00
PITAKA自研PitaTap™拍照按键,重新定义手机壳交互体验
近日,在2025年德国柏林IFA展会上,PITAKA凭借其自研的PitaTap™拍照按键的创新突破,一举夺得两家国际权威科技媒体SlashGear与BGR颁发的Innovation Awards奖项
2025-09-23 11:40:00
MOVA生态链企业获数千万融资,瞄准海外电动工具赛道、预计2025年营收破亿|硬氪首发
作者|黄楠编辑|袁斯来硬氪获悉,沃庭科技(苏州)有限公司(以下简称“沃庭科技”)近日完成数千万元天使轮融资,本轮资金将用于加大技术研发投入
2025-09-23 06:51:00
刘强东,正悄悄孕育“山姆杀手”
前不久,刘强东现身宿迁,又给老家人送上了一份大礼:四家京东折扣超市。有人问,这不是赚老乡钱吗,算什么礼物?因为这些超市主打的
2025-09-22 10:23:00
近日,合众人寿秦皇岛中支开展“鎏金岁月,匠心相伴”主题金箔手作沙龙活动,通过沉浸式手工体验,为参加客户呈现了一场融合艺术鉴赏与情感联结的特别回馈
2025-09-22 10:32:00
东港股份转型科技先锋 AI具身机器人深耕为民服务
海报新闻记者 宋嵩 张彤彤“您好,我是小智,有什么可以帮助您?”在政务大厅、大型展馆、学校可以看到忙碌的“小家伙”,它们各司其职
2025-09-22 10:33:00
“人拉肩扛”到“云端挖矿” 山东黄金的数智蜕变
海报新闻记者 张彤彤三山岛金矿的井下巷道里,5G信号正穿梭于岩壁之间,中控室的大屏上,矿石流动的情况与千米深的矿洞数据实时变化
2025-09-22 10:33:00
从莱阳田野到国际餐桌 春雪食品引领鸡肉调理品行业高质量发展
海报新闻记者 宋嵩故事的起点,要追溯到2012年。彼时,山东春雪食品有限公司在莱阳设立莱阳春雪食品有限公司,最初只是一家区域性的鸡肉加工企业
2025-09-22 10:37:00
大窑饮品重磅推出“宜养说” 植物蛋白赛道再添“实力派”
当下消费者正变得前所未有的理性,这一趋势在饮品市场尤为明显:“好喝”是基础,“健康”已成为新门槛。基于对“轻养生”需求的深度洞察
2025-09-22 10:38:00
近日,西贝创始人贾国龙与网红企业家罗永浩就预制菜价值展开的公开论战,将这一话题推向了舆论漩涡。这场争论背后,折射的正是全社会对食品安全认知的深化——从单纯的“无害”向更高层次的“真实
2025-09-22 10:38:00
从鼓房到健身房:无人值守场景重塑消费体验
本报记者 胡 静 □ 陈跃佳中午十二时,李先生步入街角的24小时无人便利店,扫码开门、自选商品、刷脸支付,全程耗时不足两分钟
2025-09-22 10:39:00
鱼竿里的“大国重器” 光威复材以碳纤维技术书写国产突围之路
海报新闻记者 宋嵩 张彤彤“以前用玻璃纤维竿,钓条十斤的鱼就胳膊酸,这碳纤维的又结实又轻,真是材料不一样了!” 威海的老钓手王师傅喜欢“炫耀”他的新鱼竿
2025-09-22 10:40:00
南山智尚:纤维经纬织就智造之路
大众网·海报新闻记者 康洁一条条线可以让提线木偶惟妙惟肖的表演,而一根根强度高、耐磨损的纤维可以实现机器人手部灵巧的运动
2025-09-22 10:41:00