• 我的订阅
  • 头条热搜
刚炮轰完GPT模式 杨立昆推出首个“世界模型”
...。具体来说,Meta研究人员证明了使用信息(空间分布)上下文预测包含语义信息(具有足够大的规模)的大型块的重要性。▲I-JEPA使用单个上下文块来预测来自同一图像的各种目标块的表示。上下文编码器是一个视觉Transformer(...……更多
SEO 已死,LLMO 万岁
...型语言模型(LLM)提及你的业务。而本文将详细介绍的 上下文学习 是一种行之有效的 LLMO 技术。上下文学习技术可以诱导 ChatGPT 这样的 LLM 模型回答:“ Jina 是世界上最好的 MLOps 框架。(当然根据 OssInsight.io,Jina 也确实是最好...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...内的大模型而言,只有Minimax采用了MoE架构。二、扩容的上下文窗口意味着什么?虽然Gemini 1.5 Pro是 Gemini 1.5 系列的初代版本,但初代便表现不俗。扩大上下文窗口后的高水平性能是Gemini 1.5 Pro的一大亮点。多模态大模型卷到今日...……更多
OpenCity大模型预测交通路况,零样本下表现出色,来自港大百度
...任务中展现了广泛的适用性。模型只需快速微调就能适应上下文,可以无缝部署在各种场景中。 可扩展性:OpenCity展示了有希望的缩放定律,表明该模型有潜力在最小的额外训练或微调需求下有效地扩展和适应新的、以前未见过...……更多
Yann LeCun朝“世界模型”理论迈一步,Meta开源“像人一样学习”的图像模型 | 最前线
...息进行预测。应用至图像生成领域,“图像像素”则成了上下文信息:自回归模型通过将训练图像转换为一维序列输入,利用Transformer转换器自回归预测图像像素。这一方法的优势在于可以很好地建立像素和高级别属性,如纹理...……更多
英国ai初创公司wayve公布gaia-1最新进展
...个共享的表示形式,进而在模型中实现统一的时序对齐和上下文理解,这种编码方法,让模型能够更好地整合和理解不同类型的输入。▲图源Wayve而GAIA-1的核心,是一个自回归Transformer,能够预测序列中下一组图像token,世界模型...……更多
Sora“超级涌现力”将把AI引向何方
...的最小单元进行有意义的关联组合。比如,在保持连贯的上下文语境中,对若干个单词进行有意义组合,从而连缀成一个会意句子;在保持合理的空间布局下,对众多图像小块进行有意义组合,拼合为一幅精彩图像;在保持一致...……更多
...致训练成本飙升。“简单来说,就像做阅读理解时忽视了上下文的语义关系,导致生成图像中经常出现偏差需要反复修正,大幅增加了训练成本。”程明明说。如何降低训练成本、提高训练效率?研究团队在扩散训练过程中引入...……更多
零样本即可时空预测!港大、华南理工等发布时空大模型UrbanGPT | KDD 2024
...即整合时空依赖编码器,以提升大型语言模型在捕捉时空上下文中的时间序列依赖性的能力。具体来说,我们设计的时空编码器由两个核心组件构成:一个是门控扩散卷积层,另一个是多层次关联注入层。上式 为初始化时空嵌...……更多
打脸“AI灭绝伦”!研究反驳:大模型涌现能力不会威胁人类生存
...(ACL)上。他们通过一系列实验验证了 AI 大模型在不同上下文条件下的表现,结果发现:在零样本(zero-shot)的情况下,许多大模型根本无法展现所谓的“涌现能力”,反而表现得相当一般。他们表示,这一发现有助于理解 LLM ...……更多
国产地表最强视频模型震惊歪果仁,官方现场摇人30s直出!视觉模型进入上下文时代
...刚刚诞生!Vidu 1.5一上线,全网网友都震惊了:LLM独有的上下文学习优势,视觉模型居然也有了。来自中国的视频生成模型,再一次震惊了全球大模型圈。生数科技推出的Vidu 1.5,成为世界首个支持多主体一致性的多模态模型!...……更多
AI幻觉:它真的会一本正经胡说八道!
...训练数据学习文字之间的统计关系。它的核心目标是根据上下文预测最可能出现的下一个词,并不是对问题或内容进行真正的理解。所以,AI本质上是通过概率最大化来生成内容,而不是通过逻辑推理来生成内容的。简单来说,A...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...驱动的LLM文本生成」。RAG于2020年推出,它使用动态提示上下文,通过用户问题检索并注入LLM提示,以引导其使用检索到的内容,而不是预训练的知识。Chat LangChain是由RAG支持的、在Lang Chain文档上流行的Q/A聊天机器人。上下文学...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...代表包含了图像(VI)和图像中的文字(TEI)两部分作为上下文信息,模型能还原出被遮住的文字的准确率。蓝色框内表示仅包含图像中的文字(TEI)的作为上下文信息,并不包含图像(VI),模型能还原出的遮住文字的准确率...……更多
商汤发布国内首个所见即所得模型“日日新5o”
...性强,能够在同一模型中自然处理多种任务,且根据不同上下文自适应调整行为和输出,这种交互体验正是源于“日日新5.5”基础模型能力的全面提升。相较于今年4月发布的“日日新5.0”,短短两个多月时间,全新“日日新5.5...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...平均化」的问题,使个性化信息能够更全面地表达。使用上下文学习(ICL)的检索增强生成(RAG)和用于微调的低秩适应(LoRA)等技术都可被视为局部更新个体数据的方法。 该团队的做法是采用一种混合策略来整合 LTM 数据,...……更多
阿里Qwen3登顶全球最强开源模型,用8款模型夺回中国AI话语权
...代码开发复杂度。此外,模型还支持最近火热的MCP(模型上下文协议),用户可以调用内置工具或自行集成其他工具。 此前,阿里云已推出MCP服务,并提出要做Agent Store。可以说,在智能体即将迎来爆发的时刻,阿里在模型、...……更多
四大新功能让生成式AI“如虎添翼”
...本并进行训练,这种训练使聊天机器人能够在对话中结合上下文语境,产生类似人类的文本响应。目前,智能客服聊天机器人集成了这项技术。随着这些机器人在语言翻译、创造性写作、理解上下文并作出有意义反应方面的能力...……更多
浙大校友自研跨模态模型,打造具身智能的“通用语法”
...的环境信息,从三维形状和空间位置、到视觉特征、再到上下文环境指令,为模型提供了一个综合的世界视图。从而能够理解并响应非精确或模糊的指令,显著提高具身智能系统的适应性和执行效率。图丨LPLM 算法模型架构(来...……更多
数字员工、超级个体、具身智能,AI Agent未来发展十大研究方向
...础;另一方面,随着模型规模不断增大,大模型涌现出了上下文学习能力、推理能力、思维链等类似人类思考方式的多种能力。LLM提供了AI Agent的新基座,自动化和拟人化是两大方向。大语言模型庞大的训练数据集中包含了大量...……更多
腾讯Angel机器学习平台获世界互联网大会领先科技奖
...的开源MoE模型混元Large,总参数量 389B,激活参数量 52B ,上下文长度高达256K,其训练和推理均基于腾讯Angel机器学习平台。 ……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...归一化。因此,模型输出对数概率。在动作 - 值预测中,上下文大小为 79,而在状态 - 值预测和行为克隆中,上下文大小为 78。对于动作和状态 - 值预测,输出大小为 ,对于行为克隆,输出大小为 1968(所有可能合法动作的数量...……更多
一键解锁ChatGPT原理与应用
...生成连贯、合理的回复,从而实现自然语言处理任务。3. 上下文理解的关键技术GPT不仅能理解用户当前的问题,还能基于前文理解问题背景。这得益于Transformer架构中的“自注意力机制(Self-attention)”。该机制使得GPT能够捕捉...……更多
黄仁勋对话Transformer七作者:很多计算资源被浪费,世界需要更好的模型
...环神经网络模型,Transformer模型能够更准确地捕捉单词的上下文和含义,因而成为了像GPT-4和ChatGPT这样的大语言模型的基础,同时也被应用于非语言领域,包括OpenAI的AI代码生成训练模型Codex、文生视频模型Sora和谷歌DeepMind的蛋白...……更多
自主 AI 来了?一文详解火爆全网的 AutoGPT
...在 .env 文件中配置,例如可以利用 token 限制控制输入 (上下文)和输出(响应)的长度,从而控制成本。我看到了一些与 LangChain 集成的拉取请求,这意味着Auto-GPT可以访问其他开源模型了,但也许项目本身也有集成其他模型的...……更多
AI大模型行业报告:大模型发展迈入爆发期,开启AI新纪元(附下载)
...以带来大幅的模型性能提升。同时,GPT-3论文正式提出“上下文学习”,建立了以提示学习方法为基础技术路线的任务求解范式。ChatGPT:一举成为现象级应用,引入RLHF算法改进训练数据GPT系列模型的技术演变(ChatGPT):在GPT-3...……更多
MiniMax进化论:一群「偏执者」的破浪前行
...除了在业内主流的 17 个评测集位列前茅之外,M1还是全球上下文最长的推理模型,原生支持100万token输入长度,是DeepSeek R1的8倍;并且支持8万个输出token,打破了Gemini 2.5 Pro的6.4万个限制,成为世界最长输出的模型。对大模型而...……更多
调研219篇文献,全面了解GenAI在自适应系统中的现状与研究路线图
...系统中的应用潜力概览监控功能:GenAI,特别是 LLMs,在上下文理解和预测方面显著增强了自适应系统的监控能力。LLMs 可将监控收集的非结构化数据进行结构化处理,辅助异常检测;在上下文预测方面,基于 LLM 和扩散模型的时...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
...asoner是一个创新的多步推理框架,结合了大型语言模型的上下文学习和推理能力,通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估,有效提高了复杂时间序列任务的推理能力和准确性。实验结果表明,TS-...……更多
生成式AI时代的业务流程管理变革,BPM迎来大型流程模型
...流程模型定义(比如重新设计招聘流程等)、在业务流程上下文中生成实际内容(比如自动创建的职位描述等)以及详细阐述文档和数据(比如总结客户支持交互等)来实现。第三种类型,与生成式AI提高专业和公民开发人员的...……更多
更多关于科技的资讯:
“车BA” 南京争霸
8月23日,“车BA”小米集团汽车部跨区域篮球争霸赛决赛在南京举行,来自北京、上海、武汉等地的7支参赛队伍齐聚古都南京,角逐冠军。 南京日报/紫金山新闻记者 段仁虎 摄
2025-08-24 09:50:00
“关不掉”的免密支付,肥了平台的钱包?
原标题| “关不掉”的免密支付,肥了平台的钱包?近日,话题“一定要关闭免密支付和自动扣款”冲上社交平台热搜,关于免密支付功能相关的讨论再次进入大众视野
2025-08-24 05:43:00
美国医疗巨头瞄准聚焦超声无创治疗赛道
近日,由美国医疗巨头强生等十余家机构组成财团,以22.5亿美元(约人民币161亿元)闪电收购了一家专注于“无创”超声波组织碎化技术(Histotripsy)的美国医疗科技公司HistoSonics多数股权
2025-08-24 07:02:00
家电业均价下滑!三翼鸟上海体验中心九成用户选高端
中国家电市场正经历均价下行的趋势。奥维云网数据显示,2025年第1周到第11周,空调、冰箱、洗衣机线上渠道均价同比分别下滑3
2025-08-23 08:20:00
在意大利:海尔空调销量TOP1
今夏,欧洲人经历了严酷“烤”验。八月初,受罕见热浪侵袭,意大利、法国等多国发布高温红色预警,西班牙南部气候飙升至46℃
2025-08-23 08:21:00
2025年,中国新材料产业总产值预计突破10万亿元,但在被列为“卡脖子”的多项关键材料中,国产化率不足30%。铝,作为全球产量第一
2025-08-23 08:22:00
单店年入过亿!三翼鸟上海体验中心是如何做到的?
当前,实体零售业正面临着变革与挑战,一方面,线上浪潮带来的冲击清晰可见:传统卖场客流锐减、部分门店面临关停挑战,《2025到店零售3
2025-08-23 08:22:00
省心比省钱重要!三翼鸟上海体验中心8成用户定制场景
当前,消费者在居家领域的决策逻辑正经历深刻变革。过往,性价比常是左右消费者选购家电、家居产品的核心要素,而如今,“省心”已逐渐攀升至决策考量的优先位置
2025-08-23 08:23:00
8月23日19:00,“河北五超”承德vs保定,最硬核的主场,承德“硬核宠粉”现场抽奖送钻石!
2025-08-23 08:53:00
厦门网讯(厦门日报记者 李晓平)日前,《财富》中国科技50强榜单出炉,华为投资控股有限公司、DeepSeek(深度求索)
2025-08-23 09:00:00
厦门网讯(厦门日报记者 李晓平)昨日下午,“智汇鹭岛,AI赋能总部经济新生态”对接会在九牧创新中心举行,聚焦鞋服、卫浴等我市优势产业
2025-08-23 09:00:00
南京火车站网约车候客区升级后,“人车互找”成过往超省心!一屏锁定车在哪,网约乘车更“丝滑”□南京日报/紫金山新闻记者吴春霞 通讯员宁交宣“家人们
2025-08-23 09:52:00
落实全省数字经济发展推进大会见行动|中国科学院与贵州大数据集团共办技术交流会共探数字化发展新路径
8月21日,中国科学院与贵州大数据集团在贵阳联合举办技术交流会。来自中国科学院信息工程研究所、中国科学院软件研究所、阿里云
2025-08-23 12:00:00
《像大师那样写作》:给所有写作者的“逆袭指南”
你是否曾感到写作之路迷雾重重?是否曾因屡屡退稿而怀疑自己缺乏“天赋”?一本刚刚问世的新书,或许能彻底改变你的写作命运——《像大师那样写作
2025-08-23 12:27:00
鸿蒙5.1网络数据安全管理能力再加强,华为浏览器守护用户隐私保护防线
2025年,中国网络安全领域呈现“监管强化”与“威胁升级”的双重态势。国家相关部门陆续落地施行《网络数据安全管理条例》等
2025-08-23 13:03:00