模型,果仁,上下文,地表,上下,视觉头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...刚刚诞生！Vidu 1.5一上线，全网网友都震惊了：LLM独有的上下文学习优势，视觉模型居然也有了。来自中国的视频生成模型，再一次震惊了全球大模型圈。生数科技推出的Vidu 1.5，成为世界首个支持多主体一致性的多模态模型！...……更多

2024-11-15 09:52:00模型,果仁,上下文,地表,上下,视觉

长上下文能力只是吹牛？最强GPT-4o正确率仅55.8%，开

...lan【新智元导读】当今的LLM已经号称能够支持百万级别的上下文长度，这对于模型的能力来说，意义重大。但近日的两项独立研究表明，它们可能只是在吹牛，LLM实际上并不能理解这么长的内容。大数字一向吸引眼球。千亿参数...……更多

2024-07-23 17:12:00正确率,长上,下文,模型,只是,能力

Bengio团队提出多模态新基准，直指Claude 3.5和

...代表包含了图像（VI）和图像中的文字（TEI）两部分作为上下文信息，模型能还原出被遮住的文字的准确率。蓝色框内表示仅包含图像中的文字（TEI）的作为上下文信息，并不包含图像（VI），模型能还原出的遮住文字的准确率...……更多

2024-06-29 09:37:00模态,基准,弱点,团队,模型,任务

支持1024帧、准确率近100％，英伟达「LongVILA」

现在，长上下文视觉语言模型（VLM）有了新的全栈解决方案 ——LongVILA，它集系统、模型训练与数据集开发于一体。现阶段，将模型的多模态理解与长上下文能力相结合是非常重要的，支持更多模态的基础模型可以接受更灵活...……更多

2024-08-22 09:51:00英伟,准确率,支持,视频,序列,训练

本周AI不得了！OpenAI的Sora“模拟世界”、Gemi

...质量令人着迷。总结：谷歌可能找到了某种新方法，将长上下文的架构理念与他们的 TPU 计算堆栈相结合，并取得了很好的效果。据 Gemini 长语境的负责人之一Pranav Shyam说，这个想法几个月前才刚刚萌芽。如果以小版本（v1.5）而...……更多

2024-02-17 19:48:00上下文,新贵,上下,世界,模型,视频

GPT-4劲敌，谷歌进入高能+高产模式

...内的大模型而言，只有Minimax采用了MoE架构。二、扩容的上下文窗口意味着什么？虽然Gemini 1.5 Pro是 Gemini 1.5 系列的初代版本，但初代便表现不俗。扩大上下文窗口后的高水平性能是Gemini 1.5 Pro的一大亮点。多模态大模型卷到今日...……更多

2024-02-21 14:05:00劲敌,高产,模式,模型,上下文,处理

微软连发3款Phi-3.5模型：128K上下文，首用MoE架

...Phi-3.5，适合在内存和算力受限的环境中运行，均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务，Phi-3.5-MoE-instruct可胜任复杂推理任务，Phi-3.5-vision-instruct则兼具文本与视觉能力。性能最强大的Phi-3……更多

2024-08-22 09:49:00上下文,微软,架构,模型,上下,性能

不是RNN的锅！清华团队深入分析长上下文建模中的状态崩溃，M

【新智元导读】RNN模型在长上下文中表现不佳？近日，来自清华的研究团队对此进行了深入的实验分析，结果表明：不是RNN的锅。与Transformer相比，RNN模型的一大优势是应对长序列的能力。比如Mamba，内部状态大小始终保持不变...……更多

2024-11-28 12:03:00长上,清华,下文,团队,状态,作者

让人工智能模型训练提速10倍以上

...致训练成本飙升。“简单来说，就像做阅读理解时忽视了上下文的语义关系，导致生成图像中经常出现偏差需要反复修正，大幅增加了训练成本。”程明明说。如何降低训练成本、提高训练效率？研究团队在扩散训练过程中引入...……更多

2024-04-03 07:20:00人工智能,提速,人工,模型,训练,智能

AI翻译界杀手诞生！阿里国际翻译大模型吊打谷歌和GPT-4

...译能力就会大幅下降。除了训练数据的局限性之外，AI的上下文理解有限、也让不同语种的语言结构差异和文化语境差异等原因，也会导致AI经常给出偏差很远的答案。就没有一款轻易上手、放心可用的高效AI翻译工具吗？我们经...……更多

2024-10-17 09:49:00阿里,模型,杀手,国际,电商,模型

最强AI程序员砸饭碗：84秒跑通代码像人一样思考

...队表示，最初开发Genie时，只能访问微调16-32k范围内的短上下文模型，他们用这些模型进行了大量早期开发，用超1亿token的数据训练模型，虽然发现设计的架构有一定优势，但从根本上受限于模型在特定时间内可以处理的信息量...……更多

2024-08-13 14:46:00程序员,代码,程序,数据,模型,团队

openai推出gpt-4turbo：比上代便宜三倍

...者而言“比上代GPT-4便宜三倍”。据悉，GPT-4Turbo支持128k上下文，输入价格比GPT-4便宜了三倍，速率限制翻倍，知识库更新到2023年4月，此外还添加了JSONMode，更新了多个函数调用能力。相对此前GPT-4性能更强、价格更便宜、开发成...……更多

2023-11-07 11:18:00上代,模型,开发,人民币,上下文,价格

OpenAI史诗级更新！最强大模型炸场，128K上下文、价格

...大方面更新重点值得关注和思考。1、GPT-4 Turbo：支持128k上下文，相当于300页文档，输入价格大降2/3，速率限制翻倍，知识更新到2023年4月，改进指令跟随和JSON Mode，更新多个函数调用能力。这意味着比GPT-4更强、更便宜、开发成...……更多

2023-11-07 17:45:00上下文,史诗,模型,上下,更新,价格

Mistral放大招！124B多模态巨无霸登场，免费版Cha

...展1230亿参数的多模态解码器，10亿参数的视觉编码器128K上下文窗口长度：可容纳至少30张高分辨率图像具体来说，Pixtral Large是Mistral多模态系列的第二个模型，基于Mistral Large 2构建，有1240亿参数。该模型能够理解文档、图表和自...……更多

2024-11-20 09:43:00巨无霸,免费版,模态,突袭,模型,生成

DeepSeek V3小版本大升级：推理、前端开发加强这些

...的性能提升却相当显著，特别是在前端开发、数学推理和上下文理解方面有了明显进步。据了解，新版V3模型借鉴DeepSeek-R1模型训练过程中所使用的强化学习技术，大幅提高了在推理类任务上的表现水平，在数学、代码类相关评...……更多

2025-03-25 23:03:00前端,推理,能力,版本,升级,开发

英国ai初创公司wayve公布gaia-1最新进展

...个共享的表示形式，进而在模型中实现统一的时序对齐和上下文理解，这种编码方法，让模型能够更好地整合和理解不同类型的输入。▲图源Wayve而GAIA-1的核心，是一个自回归Transformer，能够预测序列中下一组图像token，世界模型...……更多

2023-10-10 11:51:00英国,进展,公司,模型,驾驶,生成

安谋科技下代“周易”NPU成功部署DeepSeek-R1：速

...现了端到端应用的演示。测试显示，在标准单批次输入、上下文长度为1024的测试环境中，新款“周易”NPU在首字计算阶段的算力利用率突破40％，解码阶段的有效带宽利用率超过80％。带宽利用率呈现高线性特性，能够灵活适配1...……更多

2025-02-14 13:22:00周易,高达,速度,成功,科技,周易

非Transformer架构站起来了!首个纯无注意力大模型,

...每个单词（或 token）与文本中的每个单词进行比较来理解上下文，它需要更多的计算能力和内存需求来处理不断增长的上下文窗口。但是如果不相应地扩展计算资源，模型推理速度就会变慢，超过一定长度的文本就没法处理了。...……更多

2024-08-14 09:39:00力大,架构,模型,模型,架构,训练

Meta首款多模态Llama 3.2开源！1B羊驼宝宝，跑在

...，Meta还推出了1B和3B两个轻量级纯文本的版本，可支持128K上下文。别看参数少，1B/3B在总结摘要、指令遵循、重写等任务上，表现非常出色，而且专为Arm处理器做了优化。LeCun激动地表示，「可爱的大羊驼宝宝来了」！Meta首席技...……更多

2024-09-27 13:39:00模态,宝宝,模型,图像,训练,文本

AI大模型行业报告：大模型发展迈入爆发期，开启AI新纪元（附

...以带来大幅的模型性能提升。同时，GPT-3论文正式提出“上下文学习”，建立了以提示学习方法为基础技术路线的任务求解范式。ChatGPT：一举成为现象级应用，引入RLHF算法改进训练数据GPT系列模型的技术演变（ChatGPT）：在GPT-3...……更多

2024-10-21 10:03:00模型,行业报告,新纪元,报告,发展,行业

AI“大姨”现场刁难智能客服！直击一群AI打PK赛，真能落地

...个满足现在用户需求的智能客服。能理解用户问题、结合上下文给出解决办法，并且有情商、说人话、能面对各种复杂情景。而且上手门槛很低。比如参赛选手云蝠智能，他们的主打业务是电话客服，在文本客服方面的积累不...……更多

2024-09-23 09:53:00大姨,一群,落地,智能,百炼,模型

3D大模型助力，15分钟即可训练高质量、个性化的数字人模型

...t (ICLR 2024) 适应到目标数字人的高效微调策略和（2）具有上下文学习能力的人脸动作生成模型，MimicTalk 可以生成相比原有方法更高质量、更具表现力的数字人视频。此外，单个数字人模型的训练时间可以被压缩到 15 分钟以内，...……更多

2024-11-01 09:27:00模型,高质量,训练,数字,个性,模型

GPT-4o版「Her」终于来了！讲笑话、学猫叫，AI女友能

...—需要更长输出内容才能满足用例，OpenAI才做出的调整。上下文和输出之间的区别GPT-4o自推出以来，便提供了最大128K的上下文窗口。而对于GPT-4o Long Output，最大上下文窗口仍然是128K。那么，OpenAI如何在保持整体上下文窗口为128K...……更多

2024-08-01 09:36:00女友,输出,语音,上下文,网友,输入

王小川公布最新大模型，号称全球最长上下文，是GPT-4的14

...模型公司“百川智能”宣布，推出Baichuan2-192K大模型，其上下文窗口长度高达192K，能够处理约35万个汉字。百川智能称，Baichuan2-192K是目前全球最长的上下文窗口，也是目前支持长上下文窗口最优秀大模型Claude2（支持100K上下文窗...……更多

2023-10-30 15:02:00王小川,王小,上下文,模型,上下,焦点

新扩散模型OmniGen一统图像生成，架构还高度简化、易用

...机视觉任务：图像去噪、边缘检测、姿态估计等一定的上下文学习能力 (In-context Learning)以下简要展示部分能力效果：2.1 文本到图像生成 2.2 指代表达生成OmniGen 具备类似 InstandID、Pulid 等模型生成角色一致性图像等能力，即：输...……更多

2024-10-30 09:53:00易用,架构,生成,模型,图像,高度

微软开源 OmniParser 纯视觉 GUI 智能体：让

...当前屏幕解析技术中的空白。该工具并不需要依赖额外的上下文数据，可以理解更复杂的图形用户界面（GUI），是智能 GUI 自动化领域的一项令人兴奋的进展。 OmniParser 结合可交互区域检测模型、图标描述模型和 OCR 模块等，不...……更多

2024-10-30 09:47:00微软,截图,屏幕,视觉,智能,模型

林达华谈大模型发展之路：未来会有更高效的模型结构出现

大模型的上下文长度快速增长，超长上下文解锁新应用，但推理计算代价高昂，上下文本身对于信息不会进行压缩，不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年，人工智能领域风起...……更多

2024-03-25 10:53:00林达,模型,之路,结构,发展,模型

MemGPT团队官宣创业，融资1000万美金，硅谷大佬Jef

...宣创业。由该团队创立的Letta公司，推出了一个同名的AI上下文内存管理平台Letta。最近2年，大语言模型快速发展，但受到上下文窗口长度的限制，导致它在多轮对话和文档分析等任务中的适用性较差。针对这个问题，Letta提出了...……更多

2024-09-26 13:42:00大佬,硅谷,美金,融资,团队,创业

终于拿到内测！豆包-PixelDance真是字节视频生成大杀

...图模型、语音模型来了一波大升级。通用语言模型：增大上下文、提升综合能力从 5 月到 9 月，豆包大模型的使用量实现了超过 10 倍的爆发式增长，顺着这股爆发式增长的势头，火山引擎宣布将旗舰级豆包大模型「豆包通用模...……更多

2024-09-30 09:51:00豆包,字节,生成,视频,模型,豆包

阿里云百炼上线Qwen2.5-Turbo模型，可支持100万

...的Qwen2.5-Turbo已在阿里云百炼上线，该模型支持100万超长上下文，相当于100万个英文单词或150万个汉字，在多个长文本评测集上的性能表现超越GPT-4。即日起，所有用户可在阿里云百炼调用Qwen2.5-TurboAPI，百万tokens仅需0.3元。全新...……更多

2024-11-21 09:48:00百炼,阿里,上下文,模型,上下,支持

page 1/1334 首页上一页 12 3 4 5 6 下一页末页

更多关于科技的资讯：

联通客户日暖冬送温情——福建联通VIP客户答谢会在三明圆满

活动现场。东南网11月26日讯（通讯员肖锦雯）近日，以“联通客户日暖冬回馈季”为主题的福建联通VIP客户答谢会在三明市徐锦新城小区温馨启幕

2025-11-26 12:50:00

梦百合家居董事长倪张根亮相沈阳“梦粉见面会”，发布适老化智能

近日，知名睡眠品牌MLILY 梦百合在沈阳京东MALL发布适老化智能床系列新品，并针对沈阳大东区社会福利院展开公益捐赠

2025-11-26 13:04:00

BORCHERS®亮相中国国际涂料展，以本地化创新与全球技术

在今天开幕的 2025 中国国际涂料展上，美利肯涂料添加剂品牌BORCHERS®于 W2.F21 展位（展馆 W2）再次携核心解决方案亮相

2025-11-26 13:37:00

国际大咖为“南京故事”国际传播支招

国际大咖为“南京故事”国际传播支招在中国制作向世界传播南报网讯（记者乔雅萱）11月22日上午，南京国际传播中心揭牌仪式现场

2025-11-26 10:27:00

江苏南京：链接全球资本！宁企赴港上市热潮涌动

□南京日报/紫金山新闻记者曹丽珍今年以来，一股赴港上市浪潮正在全国范围内持续奔涌。相关数据显示，今年前三季度，中国企业境外首次公开募股（IPO）的活跃度大幅回升

2025-11-26 10:27:00

江苏南京：一张购物小票，掘出一座“数据金山”

南京加快释放数据要素价值培育壮大数据产业一张购物小票，掘出一座“数据金山”晓数通社区微数据中心。江苏荣泽信息科技股份有限公司供图数族科技

2025-11-26 10:27:00

以栖霞区为核心舞台中欧携手共寻机器人产业“合伙人”

南报网讯（记者朱旖旎通讯员刘芳）深秋的南京，一场跨越山海的双向奔赴正在发生。近日，2025中欧机器人产业合作（南京）对接会在栖霞区召开

2025-11-26 10:28:00

医疗器械“产学研医”对接会举办

近日，2025南京医疗器械“产学研医”对接会在高淳举办，高校、医院、企业等多方代表齐聚。活动搭建协同平台，助力产业创新与成果转化

2025-11-26 10:28:00

南京打造微短剧产业集聚高地

在长三角文博会上亮出“文化家底”和数字创新实力南京打造微短剧产业集聚高地□南京日报/紫金山新闻记者朱静近日，一场聚焦微短剧的产业合作交流活动在国家会展中心（上海）火热举办

2025-11-26 10:28:00

江苏南京：相约十年，让制造更聪明

相约十年，让制造更聪明——写在2025世界智能制造大会即将召开之际□南京日报/紫金山新闻记者徐宁实习生黄倩“作为南京智能制造产业的标杆力量

2025-11-26 10:28:00

智能工厂运营效率提升

近日，在南京天加环境科技有限公司今年5月投产的天加洁净基地内，高度自动化生产线正生产发泡板机、换热器等核心零部件。该生产基地建立了从客户需求到最终交付的“端到端”全流程数字化运营体系

2025-11-26 10:28:00

厦大团队激光打印技术获重大突破

东南网11月26日讯（福建日报记者李珂）记者从厦门大学获悉，日前，该校萨本栋微米纳米科学技术研究院吴德志教授团队在3D打印技术领域取得突破性进展——首创“激光原位诱导直写打印”技术

2025-11-26 10:34:00

我市跨境电商生态再添新支点 POD孵化平台落地银城智谷

厦门网讯（厦门日报记者张珺通讯员吴冰冰）我市跨境电商生态再添新支点，日前，POD（按需定制）专卖孵化平台公司正式落户银城智谷海熹跨境电商产业园

2025-11-25 08:11:00

AI赋能千行百业一线故事（十七）：这位“农事专家”，让种地更

这位“农事专家”，让种地更聪明——AI赋能千行百业一线故事（十七）11月14日，雄安新区都市农业科技博览园温室大棚内，工作人员查看番茄长势

2025-11-25 08:41:00

荣耀加冕！锦程酒管多店荣登消费者喜爱榜-2025年中国高端酒

2025 年 11 月 20 日-21日—— 在备受文旅与酒店行业瞩目的 “2025 迈点文旅节・第七届迈点酒店运营创新大会” 上

2025-11-25 09:25:00

头条订阅服务