• 我的订阅
  • 头条热搜
“百模大战”下半场:野蛮生长后,如何避免重复“造轮子”?
...院自动化研究所等机构的大模型专家,分享多模态、超长上下文、开源数据集等大模型技术话题,并将就大模型的技术路线、训练的工程化挑战与开源生态建设展开对话碰撞。图说:人工智能计算大会(AICC2023)近日在京举行。摄...……更多
kimi智能助手更新:模型能力提升
...的智能助手产品。今年3月,Kimi智能助手启动200万字无损上下文内测。 ……更多
鸿蒙harmonyos3.1开启公测招募
...tage开发模型,包含Stage模型生命周期管理、调度、回调、上下文获取、鉴权等。同时增强了应用的运行管理能力。ArkUI开发框架增强了声明式Canvas/XComponent组件能力,增强了组件布局能力及状态管理能力,优化了部分组件的易用...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...平均化」的问题,使个性化信息能够更全面地表达。使用上下文学习(ICL)的检索增强生成(RAG)和用于微调的低秩适应(LoRA)等技术都可被视为局部更新个体数据的方法。 该团队的做法是采用一种混合策略来整合 LTM 数据,...……更多
阿里通义开源模型Qwen2.5力压Claude3.5、GPT-4o等顶级闭源模型
...Qwen2.5能够提供更为自然流畅的交互体验,这得益于其对上下文理解的深度把握以及对人类情感和意图的准确捕捉。可以说,在实现人机交互更加人性化方面,Qwen2.5迈出了坚实的一步。 四、未来展望:探索未知的可能性最后,...……更多
当AI的“野心”撞击人性的弱点;微软发布开源Orca-2大模型;百度用AI做电商有戏吗丨AI新零售早报
...以为大型语言模型(LLM)提供附加信息,提高其准确性和上下文相关性,减少幻觉。实现方法:使用 Python、OpenAI LLM、Weaviate 向量数据库和 OpenAI 嵌入模型,通过 LangChain 编排 RAG 工作流程,包括检索、增强和生成三个步骤。(来...……更多
吴泳铭官宣3800亿投入后,阿里云如何打AI这场硬仗?
...个全生命周期MCP服务,以降低Agent开发门槛。MCP即为模型上下文协议,是由Anthropic提出的开放协议。MCP是模型和外部数据、工具的通信协议,解决了双方交互问题,可以让用户不用懂代码就能直接调用模型和MCP服务,搭建Agent应...……更多
AI圈卷疯了!xAI、Anthropic同日上线API:Grok免费公测,Claude 3.5 Haiku价格暴涨
...「grok-beta」,该模型目前正处于开发的最后阶段。该模型上下文长度为128000 token,这意味着Grok可以处理更长的文本输入,理解更复杂的上下文关系。此外,该模型不仅支持函数调用,也能支持系统提示词。从而让开发者能够更...……更多
大模型App上线 腾讯晚不晚
...性解析多个微信公众号链接、网址、支持256K的原生窗口上下文。在AI写作方面,元宝支持多轮问答,可将对话的内容整理成报告。通过“发现”栏目,用户可免费体验百变AI头像、口语陪练、超能翻译官等应用。 此外,元宝支...……更多
如何让大模型输出更精准、更可靠的结果?
...检索出来,并提供给大模型,利用其语义理解能力,结合上下文最终生成问题答案。每个领域都有自己的智慧和专业知识,RAG的精髓在于能够帮助企业建立专属知识库,这个知识库就像是企业独有的秘笈和配方,不仅可信、有用...……更多
AI难盈利,商汤生成式AI创收12亿增长两倍,全年净利亏损65亿
...。“它将全面达到GPT-4-turbo的标准,同时支持百万字无损上下文,并且它的多模态模型能力也将全面对标GPT-4。”作为通用人工智能(AGI)的信徒,商汤信奉尺度定律(Scaling Law),认为大模型正处于一个技术革新与性能提升的黄...……更多
联汇科技发布最新智能体应用——第二代多模态智能体OmAgent
...实现了20倍以上的感知速度提升;OmChat V2则支持高达512K的上下文长度,能够处视频、图、文复杂的混合输入,具有时序关系判断和多图关系理解能力。Om多模态智能体全新产品系列——空间运营智能体、知识服务智能体。空间运...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
...这样的句子所左右?注意力:自动评估器是否被不相关的上下文信息干扰评估结果如表4所示,可以看到,相比其他基线模型,FLAMe系列在大部分维度都表现出明显较低的偏见,而且总体偏见值最低。使用FLAMe对解码输出重新排序最...……更多
首发!优刻得云平台上新DeepSeek-V3-0324模型
...略,实现跨节点通信开销降低37%,推理速度提升128K超长上下文:可解析50页PDF文档或完整代码库,多轮对话记忆保持能力提升FP8混合精度训练:显存占用压缩,单卡推理成本较初代降低 2.代码生成质的飞跃 单次生成400+行生产级...……更多
史无前例!Seq2Seq和GAN同获NeurIPS时间检验奖,Ilya连续2年获奖
...码器(Encoder):将输入序列逐步编码为一个固定长度的上下文向量。编码器逐一接收输入序列的元素(例如单词),并通过LSTM的隐藏状态逐渐生成该上下文向量。 解码器(Decoder):基于编码器生成的上下文向量,解码器逐步...……更多
容易“幻觉”的大模型与最严肃制造竟双向奔赴了?造船、高端装备已着迷……
...大模型具解析、理解、推理及生成能力。同时,大模型对上下文理解能力的突破,也使设计工程师得以用自然语言与大模型交互。 上海汽轮机厂智能出图项目由设序科技支撑,公司首席产品官杨庆保告诉记者,设计师们操作鼠...……更多
...生成可靠回答。在解析合同、财报等复杂文档时,可结合上下文不断完善答案,比如自动提取关键条款并对比历史版本的不同之处。值得一提的是,“临小智”的技术架构与以往相比有所创新,具体体现为四大数据库协同运作。...……更多
DeepSeek降本秘诀曝光:2招极致压榨推理部署,算力全留给内部AGI研究
...一家DeepSeek模型服务商。如果在这张图上用气泡大小表示上下文窗口,可以看出DeepSeek在价格与性能之间的另一个权衡。 在有限的推理计算资源下,只提供64k上下文窗口的服务,在主流模型提供商中算是最小的之一。在需要读取...……更多
不要苛责中国大模型公司的盈利
...称GLM-4在能力上已经逼近GPT-4。此外,GLM-4模型支持更长的上下文,自动选择模型的多模态能力,同时实现了更快的推理速度和更多并发。GLMs的个性化智能体定制能力,则被认为是直接瞄准了GPTs。目前,国内敢说自己的大模型比...……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...Phi-3.5,适合在内存和算力受限的环境中运行,均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-instruct可胜任复杂推理任务,Phi-3.5-vision-instruct则兼具文本与视觉能力。性能最强大的Phi-3……更多
科大讯飞构建全新语音建模框架 降低AI声音复刻门槛
...讯飞的超拟人合成技术此次进阶的重点是赋予AI声音以“上下文情商”。面对多轮对话的复杂度,科大讯飞开发了上下文感知的语音生成系统。该系统融合历史文本及对应音频特征,通过跨模态编码器分析上下文,让AI声音能像...……更多
智谱AI新大模型来袭:部署价格大降50%,免费商用,做应用能力逼近GPT3.5 | 最前线
...文做完形填空”,那么GLM完形填空的依据则从上文扩充到上下文——理论上,GLM的训练效率会比GPT更高,也能理解更复杂的场景。△GLM训练原理基于GLM这个通用大模型底座,目前智谱AI已经开源了中英双语对话模型ChatGLM-6B,还推...……更多
云知声依托山海大模型,成功落地智慧车载解决方案
...:一方面,它可以学习、识别用户的说话习惯,并能关联上下文展开多轮对话;另一方面,它能真正“听懂”用户在表达什么,并能够充分利用自身强大的知识储备和跨领域应用能力,为用户提供更精准、更具个性化的服务,真...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...归一化。因此,模型输出对数概率。在动作 - 值预测中,上下文大小为 79,而在状态 - 值预测和行为克隆中,上下文大小为 78。对于动作和状态 - 值预测,输出大小为 ,对于行为克隆,输出大小为 1968(所有可能合法动作的数量...……更多
腾讯最强!混元自研深度思考模型T1正式发布:吐字快、能秒回
...色的长文捕捉能力,混元T1能有效解决长文推理中常见的上下文丢失和长距离信息依赖问题。同时,混合Mamba架构针对长序列处理进行了专项优化,通过高效的计算方式,在确保长文本信息捕捉能力的同时大幅降低资源消耗,在...……更多
长上下文能力只是吹牛?最强GPT-4o正确率仅55.8%,开源模型不如瞎蒙
...lan【新智元导读】当今的LLM已经号称能够支持百万级别的上下文长度,这对于模型的能力来说,意义重大。但近日的两项独立研究表明,它们可能只是在吹牛,LLM实际上并不能理解这么长的内容。大数字一向吸引眼球。千亿参数...……更多
KIMI概念爆火,杭州这家上市公司连续20%涨停!
...,据月之暗面公众号消息,Kimi智能助手启动200万字无损上下文内测,相比之前扩大了10倍。不少尝鲜的用户都给出了这样的评价:“用起来不比ChatGPT差,更是吊打国内百度文心一言、科大讯飞星火、阿里通义千问等”。 据AI产...……更多
...的核心应用机制,是使用一个配置文件来综合描述Prompt、上下文和API等所有内容,通过提供“提示词+API+定制功能配置”的直观编排界面,使开发者编排出各种应用场景。用户也可以基于此模型进行个性化训练学习,将个人知识...……更多
【AI时刻】首届AI春晚!OpenAI野心也太大了吧!
...。当前可以使用的GPT-4 API模型的知识库截止到2021.92.扩大上下文窗口,可以在一个提示中包含更多文本,可以达到128K,也就是300页书的内容,有利于处理更复杂的问题。图片源自于互联网 当前对长文本支持较为强悍的Claude 2也...……更多
全面对标 OpenAI,智谱 AI 想要开发者 | 独家
...体性能相比上一代大幅增强,逼近 GPT-4。可以支持更长的上下文,具备更强的多模态能力,有着更快的推理速度、响应高并发的能力,推理成本得到了更进一步的降低,还对智能体能力进行了大幅增强。除了模型本身之外,智谱...……更多
更多关于科技的资讯:
厦门半导体显示产业孵化器揭牌
天马微电子已在厦建设5条先进生产线,助推厦门形成主流显示技术全覆盖的布局。图为参会代表参观天马微电子的展出产品。(厦门日报记者 林铭鸿 摄)厦门网讯(厦门日报记者 林露虹 通讯员 管轩 雷飏)打造新型显示产业高地
2025-12-11 08:18:00
Meta使用阿里千问优化其最新AI模型
12月10日晚间消息,据彭博社报道,美国科技巨头Meta在训练其代号为“牛油果”的新模型时,使用了阿里巴巴Qwen模型进行蒸馏优化
2025-12-11 08:34:00
当iPhone屏幕突然冻结在苹果标志上无法启动,或是在系统更新后陷入无限重启的循环,很多用户的第一反应是连接电脑使用iTunes恢复
2025-12-11 08:38:00
鲁网12月9日讯深耕新能源与电力装备产业20余年的制造业单项冠军企业——特锐德集团,顺应国家“双碳”战略与产业转型升级需求
2025-12-11 08:39:00
近日,华夏基金旗下股权投资平台——华夏股权宣布完成对杭州云深处科技的联合领投。此次投资不仅是华夏股权在机器人及智能装备产业链的关键战略布局
2025-12-11 09:42:00
纵览宠粉计划丨集福卡赢好礼!纵览新闻宠粉活动放大招啦~
纵览宠粉计划第四轮来啦!12月11日至18日福利拉满集齐八张福卡超多好礼带回家点击上图直达活动不管你是纵览的老粉还是刚加入的新朋友这场专属活动千万别错过在前两场活动广受欢迎的演出票
2025-12-11 09:48:00
近日,记者调查发现,美颜生鲜灯并未完全退出市场,而是以隐蔽姿态继续“发光”。在沿街商铺、小区周边门店内,有不少商家使用明令禁止的红罩红光生鲜灯
2025-12-11 09:53:00
以时光炼技能,以热爱赴荣光:华润万家第二届“万家工匠”全国技能大赛总决赛颁奖典礼温暖落幕
聚光灯照亮领奖台,掌声致敬每一份坚守,12月8日下午,第二届“万家工匠”全国技能大赛总决赛颁奖典礼圆满落幕。历经赛场的激烈角逐与专业的层层考量
2025-12-11 10:51:00
在心理健康日益受到全社会重视的背景下,广州勤圣伊科技有限公司(以下简称“勤圣伊科技”)凭借其“科技融合专业”的创新模式
2025-12-11 11:02:00
近日,专注于心理健康领域的广州勤圣亦科技有限公司(以下简称“勤圣亦科技”)宣布,其通过“科技+专业服务”的创新模式,在心理咨询服务数字化与普惠化方面取得显著进展
2025-12-11 11:04:00
12月9日,云深处科技宣布完成超5亿元人民币C轮融资。本轮融资由招银国际和华夏基金联合领投,中国电信、中国联通旗下基金参与战略投资
2025-12-11 11:15:00
以融资租赁之力,赋能产业升级 ——2025 PA“租赁节”拉开帷幕
2025年是“十四五”规划收官之年,我国产业结构转型进入深化攻坚阶段,融资租赁作为服务实体经济、产业转型升级中的重要力量
2025-12-11 11:22:00
依靠学习 走向未来——好书推荐书单:以书为帆 智行致远
01、《电动中国》作者:杨旭东、黄郑出版社:新华出版社书中将中国新能源科技发展置于能源革命与国际竞争的双重视角下,分析动力电池
2025-12-11 12:43:00
近年来,AI驱动的修复视频清晰度软件逐渐普及,无论是老旧的VHS录像、噪点明显的夜间视频,还是压缩导致的画质损失,都有机会被修复
2025-12-11 11:06:00
二手平台价格水涨船高 便利带来隐私权限风险商报讯 今年最火的行业是什么?无疑就是AI。现在不仅仅是下载AI App
2025-12-11 11:46:00