模型,国产,模型,上下文,能力,应用头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

“百模大战”下半场：野蛮生长后，如何避免重复“造轮子”？

...院自动化研究所等机构的大模型专家，分享多模态、超长上下文、开源数据集等大模型技术话题，并将就大模型的技术路线、训练的工程化挑战与开源生态建设展开对话碰撞。图说：人工智能计算大会(AICC2023)近日在京举行。摄...……更多

2023-12-02 18:56:00轮子,野蛮,大战,模型,人工智能,智能

kimi智能助手更新：模型能力提升

...的智能助手产品。今年3月，Kimi智能助手启动200万字无损上下文内测。 ……更多

2024-04-19 09:57:00助手,模型,能力,智能,更新,支持

鸿蒙harmonyos3.1开启公测招募

...tage开发模型，包含Stage模型生命周期管理、调度、回调、上下文获取、鉴权等。同时增强了应用的运行管理能力。ArkUI开发框架增强了声明式Canvas/XComponent组件能力，增强了组件布局能力及状态管理能力，优化了部分组件的易用...……更多

2023-02-09 14:25:00公测,鸿蒙,招募,华为,开发,能力

整合长期记忆，AI实现自我进化，探索大模型这一可能性

...平均化」的问题，使个性化信息能够更全面地表达。使用上下文学习（ICL）的检索增强生成（RAG）和用于微调的低秩适应（LoRA）等技术都可被视为局部更新个体数据的方法。该团队的做法是采用一种混合策略来整合 LTM 数据，...……更多

2024-10-29 09:55:00进化,可能性,模型,整合,记忆,模型

阿里通义开源模型Qwen2.5力压Claude3.5、GPT

...Qwen2.5能够提供更为自然流畅的交互体验，这得益于其对上下文理解的深度把握以及对人类情感和意图的准确捕捉。可以说，在实现人机交互更加人性化方面，Qwen2.5迈出了坚实的一步。四、未来展望：探索未知的可能性最后，...……更多

2024-10-31 09:47:00通义,模型,阿里,顶级,模型,技术

当AI的“野心”撞击人性的弱点；微软发布开源Orca-2大模

...以为大型语言模型（LLM）提供附加信息，提高其准确性和上下文相关性，减少幻觉。实现方法：使用 Python、OpenAI LLM、Weaviate 向量数据库和 OpenAI 嵌入模型，通过 LangChain 编排 RAG 工作流程，包括检索、增强和生成三个步骤。（来...……更多

2023-11-22 15:19:00电商,微软,野心,早报,弱点,模型

吴泳铭官宣3800亿投入后，阿里云如何打AI这场硬仗？

...个全生命周期MCP服务，以降低Agent开发门槛。MCP即为模型上下文协议，是由Anthropic提出的开放协议。MCP是模型和外部数据、工具的通信协议，解决了双方交互问题，可以让用户不用懂代码就能直接调用模型和MCP服务，搭建Agent应...……更多

2025-04-10 17:12:00硬仗,阿里,投入,模型,阿里,模态

AI圈卷疯了！xAI、Anthropic同日上线API：Gr

...「grok-beta」，该模型目前正处于开发的最后阶段。该模型上下文长度为128000 token，这意味着Grok可以处理更长的文本输入，理解更复杂的上下文关系。此外，该模型不仅支持函数调用，也能支持系统提示词。从而让开发者能够更...……更多

2024-11-06 09:44:00公测,价格,模型,公测,价格,性能

大模型App上线腾讯晚不晚

...性解析多个微信公众号链接、网址、支持256K的原生窗口上下文。在AI写作方面，元宝支持多轮问答，可将对话的内容整理成报告。通过“发现”栏目，用户可免费体验百变AI头像、口语陪练、超能翻译官等应用。此外，元宝支...……更多

2024-05-31 00:32:00腾讯,模型,腾讯,元宝,模型,产品

如何让大模型输出更精准、更可靠的结果？

...检索出来，并提供给大模型，利用其语义理解能力，结合上下文最终生成问题答案。每个领域都有自己的智慧和专业知识，RAG的精髓在于能够帮助企业建立专属知识库，这个知识库就像是企业独有的秘笈和配方，不仅可信、有用...……更多

2024-05-13 15:03:00输出,模型,结果,模型,博坦,知识

AI难盈利，商汤生成式AI创收12亿增长两倍，全年净利亏损6

...。“它将全面达到GPT-4-turbo的标准，同时支持百万字无损上下文，并且它的多模态模型能力也将全面对标GPT-4。”作为通用人工智能（AGI）的信徒，商汤信奉尺度定律（Scaling Law），认为大模型正处于一个技术革新与性能提升的黄...……更多

2024-03-27 15:00:00商汤,净利,亏损,全年,盈利,生成

联汇科技发布最新智能体应用——第二代多模态智能体OmAgen

...实现了20倍以上的感知速度提升；OmChat V2则支持高达512K的上下文长度，能够处视频、图、文复杂的混合输入，具有时序关系判断和多图关系理解能力。Om多模态智能体全新产品系列——空间运营智能体、知识服务智能体。空间运...……更多

2024-07-18 14:51:00联汇,二代,模态,智能,应用,科技

87.8%准确率赶超GPT-4o登顶！谷歌DeepMind发

...这样的句子所左右?注意力：自动评估器是否被不相关的上下文信息干扰评估结果如表4所示，可以看到，相比其他基线模型，FLAMe系列在大部分维度都表现出明显较低的偏见，而且总体偏见值最低。使用FLAMe对解码输出重新排序最...……更多

2024-08-05 09:37:00准确率,模型,评估,评估,模型,数据

首发！优刻得云平台上新DeepSeek-V3-0324模型

...略，实现跨节点通信开销降低37%，推理速度提升128K超长上下文：可解析50页PDF文档或完整代码库，多轮对话记忆保持能力提升FP8混合精度训练：显存占用压缩，单卡推理成本较初代降低 2.代码生成质的飞跃单次生成400+行生产级...……更多

2025-03-25 18:45:00模型,平台,模型,推理,体验,可通

史无前例！Seq2Seq和GAN同获NeurIPS时间检验奖

...码器（Encoder）：将输入序列逐步编码为一个固定长度的上下文向量。编码器逐一接收输入序列的元素（例如单词），并通过LSTM的隐藏状态逐渐生成该上下文向量。解码器（Decoder）：基于编码器生成的上下文向量，解码器逐步...……更多

2024-11-28 09:56:00获奖,检验,时间,生成,判别,生成器

容易“幻觉”的大模型与最严肃制造竟双向奔赴了？造船、高端装备

...大模型具解析、理解、推理及生成能力。同时，大模型对上下文理解能力的突破，也使设计工程师得以用自然语言与大模型交互。上海汽轮机厂智能出图项目由设序科技支撑，公司首席产品官杨庆保告诉记者，设计师们操作鼠...……更多

2024-08-12 09:41:00造船,双向,幻觉,高端,模型,制造

临商银行上线AI大模型平台“临小智” 应用落地五大场景

...生成可靠回答。在解析合同、财报等复杂文档时，可结合上下文不断完善答案，比如自动提取关键条款并对比历史版本的不同之处。值得一提的是，“临小智”的技术架构与以往相比有所创新，具体体现为四大数据库协同运作。...……更多

2025-07-18 11:43:00小智,临商,落地,模型,场景,银行

DeepSeek降本秘诀曝光：2招极致压榨推理部署，算力全留

...一家DeepSeek模型服务商。如果在这张图上用气泡大小表示上下文窗口，可以看出DeepSeek在价格与性能之间的另一个权衡。在有限的推理计算资源下，只提供64k上下文窗口的服务，在主流模型提供商中算是最小的之一。在需要读取...……更多

2025-07-05 10:58:00极致,推理,秘诀,研究,模型,用户

不要苛责中国大模型公司的盈利

...称GLM-4在能力上已经逼近GPT-4。此外，GLM-4模型支持更长的上下文，自动选择模型的多模态能力，同时实现了更快的推理速度和更多并发。GLMs的个性化智能体定制能力，则被认为是直接瞄准了GPTs。目前，国内敢说自己的大模型比...……更多

2024-01-22 18:00:00中国,盈利,模型,公司,模型,公司

微软连发3款Phi-3.5模型：128K上下文，首用MoE架

...Phi-3.5，适合在内存和算力受限的环境中运行，均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务，Phi-3.5-MoE-instruct可胜任复杂推理任务，Phi-3.5-vision-instruct则兼具文本与视觉能力。性能最强大的Phi-3……更多

2024-08-22 09:49:00上下文,微软,架构,模型,上下,性能