上下文,史诗,模型,上下,更新,价格头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...t (ICLR 2024) 适应到目标数字人的高效微调策略和（2）具有上下文学习能力的人脸动作生成模型，MimicTalk 可以生成相比原有方法更高质量、更具表现力的数字人视频。此外，单个数字人模型的训练时间可以被压缩到 15 分钟以内，...……更多

2024-11-01 09:27:00模型,高质量,训练,数字,个性,模型

苹果AI版iOS首日火爆：聊天秒变高情商，大模型成最强嘴替

...另外，新的Siri还可以够理解从一个查询到下一个查询的上下文，例如要求Siri创建日历事件，然后请求创建提醒，而无需重述正在谈论的内容。不过，之前介绍的屏幕感知功能，并未包含在此次Siri 的更新当中。相册的更新则让...……更多

2024-07-31 09:39:00情商,火爆,模型,苹果,模型,苹果

知名开发工具intellijidea2023.3更新

...的直接代码生成、无需复制代码即可回答项目相关查询的上下文感知AI聊天，以及使用扩展上下文提供更全面结果的项目感知AI操作。新的差异查看器有助于更轻松地识别AI操作对代码所做的更改。IntelliJIDEA2023.3提供了对最新Java21...……更多

2023-12-07 13:49:00开发工具,更新,工具,开发,开发,版本

王小川公布最新大模型，号称全球最长上下文，是GPT-4的14

...模型公司“百川智能”宣布，推出Baichuan2-192K大模型，其上下文窗口长度高达192K，能够处理约35万个汉字。百川智能称，Baichuan2-192K是目前全球最长的上下文窗口，也是目前支持长上下文窗口最优秀大模型Claude2（支持100K上下文窗...……更多

2023-10-30 15:02:00王小川,王小,上下文,模型,上下,焦点

击败GPT-4o的开源模型如何炼成?关于Llama 3.1

...之后，Llama 3.1 终于在昨夜由官方正式发布了。Llama 3.1 将上下文长度扩展到了 128K，拥有 8B、70B 和 405B 三个版本，再次以一已之力抬高了大模型赛道的竞争标准。对 AI 社区来说，Llama 3.1 405B 最重要的意义是刷新了开源基础模型的...……更多

2024-07-25 09:32:00模型,论文,模型,训练,论文,开发

Meta祭出三篇最详尽Llama微调指南！千字长文，0基础小

...驱动的LLM文本生成」。RAG于2020年推出，它使用动态提示上下文，通过用户问题检索并注入LLM提示，以引导其使用检索到的内容，而不是预训练的知识。Chat LangChain是由RAG支持的、在Lang Chain文档上流行的Q/A聊天机器人。上下文学...……更多

2024-08-27 12:03:00小白,长文,千字,基础,指南,训练

科技巨头打响语音模型之战！亚马逊用Claude升级Alexa

...增强，与用户进行更自然、更有吸引力的对话，并提供与上下文相关的响应- 个性化推荐：根据用户喜好和历史记录，针对购物、新闻和其他内容进行定制化推荐- 家居自动化：Remarkable Alexa将作为一个更复杂的家居自动化中心，...……更多

2024-09-10 13:38:00亚马,亚马逊,语音,巨头,模型,升级

林达华谈大模型发展之路：未来会有更高效的模型结构出现

大模型的上下文长度快速增长，超长上下文解锁新应用，但推理计算代价高昂，上下文本身对于信息不会进行压缩，不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年，人工智能领域风起...……更多

2024-03-25 10:53:00林达,模型,之路,结构,发展,模型

零成本突破多模态大模型瓶颈！多所美国顶尖高校华人团队，联合推

...VLM更加偏重于视觉模型，同时能缓解文本attention中存在的上下文依赖问题。 ……更多

2024-06-21 09:21:00模态,美国,瓶颈,顶尖,模型,团队

MemGPT团队官宣创业，融资1000万美金，硅谷大佬Jef

...宣创业。由该团队创立的Letta公司，推出了一个同名的AI上下文内存管理平台Letta。最近2年，大语言模型快速发展，但受到上下文窗口长度的限制，导致它在多轮对话和文档分析等任务中的适用性较差。针对这个问题，Letta提出了...……更多

2024-09-26 13:42:00大佬,硅谷,美金,融资,团队,创业

更快、更强、更经济！港大开源大模型RAG系统LightRAG

...题。具体方法是，将每个数据集的所有文本内容视为背景上下文，然后利用大型语言模型（LLM）生成问题。首先，我们让LLM为每个数据集创建五个虚拟的RAG用户，每个用户代表不同的信息需求或兴趣领域。接着，针对每个用户，...……更多

2024-10-15 09:57:00更快,模型,经济,系统,检索,数据

OpenAI举办“AI春晚”；李开复大模型破纪录 | 图灵周

...的Baichuan2-192K大模型之后，李开复的Yi系列模型再次刷新上下文窗口长度纪录——参数量达340亿的Yi-34B，可支持200K超长上下文窗口，可处理约40万汉字超长文本输入，是目前全球最长的上下文窗口。目前，零一万物估值超过10亿美...……更多

2023-11-13 15:48:00李开复,图灵,周报,模型,纪录,微软

又热闹了！OpenAI的加强版“Her”正式开放，压过了Ge

...提示。2. 整体质量改进：尤其在数学、代码生成、长文本上下文和视觉任务上的性能提升显著，包括在MATH、HiddenMath等基准测试中提高约20%，视觉和代码应用提高2%-7%。 3. 速率限制提高：1.5 Flash和1.5 Pro的速率限制分别从每分钟10...……更多

2024-09-25 09:54:00升级,开放,生产,开发者,开发,模型

阿里云百炼上线Qwen2.5-Turbo模型，可支持100万

...的Qwen2.5-Turbo已在阿里云百炼上线，该模型支持100万超长上下文，相当于100万个英文单词或150万个汉字，在多个长文本评测集上的性能表现超越GPT-4。即日起，所有用户可在阿里云百炼调用Qwen2.5-TurboAPI，百万tokens仅需0.3元。全新...……更多

2024-11-21 09:48:00百炼,阿里,上下文,模型,上下,支持

开源版OpenAI再出「神作」，小模型吊打Llama 3！M

...界上最好的边缘模型Ministral 3B和Ministral 8B都支持高达128k上下文（目前在vLLM上为32k）。在知识、常识、推理、函数调用、效率等方面，为低于10B参数模型设立了新标杆。而且，Ministral 8B还有配备了滑动窗口注意机制（sliding-window a...……更多

2024-10-23 09:56:00模型,边缘,革命,模型,指令,性能

调研219篇文献，全面了解GenAI在自适应系统中的现状与研

...系统中的应用潜力概览监控功能：GenAI，特别是 LLMs，在上下文理解和预测方面显著增强了自适应系统的监控能力。LLMs 可将监控收集的非结构化数据进行结构化处理，辅助异常检测；在上下文预测方面，基于 LLM 和扩散模型的时...……更多

2024-09-27 13:42:00路线图,文献,调研,路线,现状,研究

Kimi爆火背后：访问量仅次于文心一言和阿里通义，国内外大模

...款面向C端的大模型产品。早前，该公司宣布在大模型长上下文窗口技术上取得新的突破，Kimi已支持200万字超长无损上下文，并开启产品内测，该能力在不到半年内提升9倍。市场的火爆，导致Kimi服务器一度瘫痪，无法回复用户...……更多

2024-03-23 14:00:00卷上,通义,阿里,文心,下文,模型

Mamba再次挑战霸主Transformer！首个通用Mam

...有效地捕获其关系。这种通过比较文本中每个token来理解上下文的方式，需要更多的计算能力和内存来处理不断增长的上下文窗口。如果资源没有相应扩展，推理速度会变慢，最终无法处理超过某个固定长度的文本。为了解决这...……更多

2024-08-14 09:43:00一鸣,霸主,模型,再次,模型,序列

打脸“AI灭绝伦”！研究反驳：大模型涌现能力不会威胁人类生存

...（ACL）上。他们通过一系列实验验证了 AI 大模型在不同上下文条件下的表现，结果发现：在零样本（zero-shot）的情况下，许多大模型根本无法展现所谓的“涌现能力”，反而表现得相当一般。他们表示，这一发现有助于理解 LLM ...……更多

2024-08-19 09:31:00模型,威胁,人类,能力,研究,模型

长上下文能力只是吹牛？最强GPT-4o正确率仅55.8%，开

...lan【新智元导读】当今的LLM已经号称能够支持百万级别的上下文长度，这对于模型的能力来说，意义重大。但近日的两项独立研究表明，它们可能只是在吹牛，LLM实际上并不能理解这么长的内容。大数字一向吸引眼球。千亿参数...……更多

2024-07-23 17:12:00正确率,长上,下文,模型,只是,能力

国产地表最强视频模型震惊歪果仁，官方现场摇人30s直出！视觉

...刚刚诞生！Vidu 1.5一上线，全网网友都震惊了：LLM独有的上下文学习优势，视觉模型居然也有了。来自中国的视频生成模型，再一次震惊了全球大模型圈。生数科技推出的Vidu 1.5，成为世界首个支持多主体一致性的多模态模型！...……更多

2024-11-15 09:52:00模型,果仁,上下文,地表,上下,视觉

必然的命运：AI大模型冲向“免费轮盘赌”

...开发者大会上推出了0.0035美元/千tokens的Gemini Pro1.5，并将上下文长度拓展至200万tokens。国内外价格战的打响无不证明着，要在愈发汹涌的人工智能市场上分得一杯羹，卷是宿命，也是必然。 02 鏖战，谁能破局向C端免费意味着大...……更多

2024-05-24 13:40:00轮盘,模型,必然,命运,模型,价格

Meta首款多模态Llama 3.2开源！1B羊驼宝宝，跑在

...，Meta还推出了1B和3B两个轻量级纯文本的版本，可支持128K上下文。别看参数少，1B/3B在总结摘要、指令遵循、重写等任务上，表现非常出色，而且专为Arm处理器做了优化。LeCun激动地表示，「可爱的大羊驼宝宝来了」！Meta首席技...……更多

2024-09-27 13:39:00模态,宝宝,模型,图像,训练,文本

商汤升级“日日新5.0”大模型，对标GPT-4Turbo

...专家架构，超10TB tokens训练，覆盖大量合成数据，推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中，用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4回答趣...……更多

2024-04-24 09:32:00商汤,模型,升级,商汤,模型,推理

AI“大姨”现场刁难智能客服！直击一群AI打PK赛，真能落地

...个满足现在用户需求的智能客服。能理解用户问题、结合上下文给出解决办法，并且有情商、说人话、能面对各种复杂情景。而且上手门槛很低。比如参赛选手云蝠智能，他们的主打业务是电话客服，在文本客服方面的积累不...……更多

2024-09-23 09:53:00大姨,一群,落地,智能,百炼,模型

大模型卷向下半场：价格战之后如何成为真正“刚需”

...性能比肩GPT-4”，并报出每百万token输入1元、输出2元（32K上下文）的低价。大模型价格战，到底在“打”什么？免费的只是基础版。科大讯飞就曾在投资者关系活动上表示，讯飞人工智能开放平台面向全行业提供人工智能能力和...……更多

2024-06-04 08:03:00价格战,半场,模型,价格,模型,价格战

本周AI不得了！OpenAI的Sora“模拟世界”、Gemi

...质量令人着迷。总结：谷歌可能找到了某种新方法，将长上下文的架构理念与他们的 TPU 计算堆栈相结合，并取得了很好的效果。据 Gemini 长语境的负责人之一Pranav Shyam说，这个想法几个月前才刚刚萌芽。如果以小版本（v1.5）而...……更多

2024-02-17 19:48:00上下文,新贵,上下,世界,模型,视频

支持1024帧、准确率近100％，英伟达「LongVILA」

现在，长上下文视觉语言模型（VLM）有了新的全栈解决方案 ——LongVILA，它集系统、模型训练与数据集开发于一体。现阶段，将模型的多模态理解与长上下文能力相结合是非常重要的，支持更多模态的基础模型可以接受更灵活...……更多

2024-08-22 09:51:00英伟,准确率,支持,视频,序列,训练

微软连发3款Phi-3.5模型：128K上下文，首用MoE架

...Phi-3.5，适合在内存和算力受限的环境中运行，均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务，Phi-3.5-MoE-instruct可胜任复杂推理任务，Phi-3.5-vision-instruct则兼具文本与视觉能力。性能最强大的Phi-3……更多

2024-08-22 09:49:00上下文,微软,架构,模型,上下,性能