• 我的订阅
  • 头条热搜
GPT-4劲敌,谷歌进入高能+高产模式
...内的大模型而言,只有Minimax采用了MoE架构。二、扩容的上下文窗口意味着什么?虽然Gemini 1.5 Pro是 Gemini 1.5 系列的初代版本,但初代便表现不俗。扩大上下文窗口后的高水平性能是Gemini 1.5 Pro的一大亮点。多模态大模型卷到今日...……更多
OpenAI劲敌来了!这款大模型多项测试超越GPT-4o,号称最强智能
...价为3美元,每生成百万token为15美元,并具有20万个token的上下文窗口,约合15万个单词。现在,用户可以通过Anthropic的网页客户端和iOS应用免费试用新模型,Claude Pro和Claude Team的订阅用户将获得五倍的速率限制。此外,新模型也...……更多
OpenCity大模型预测交通路况,零样本下表现出色,来自港大百度
...任务中展现了广泛的适用性。模型只需快速微调就能适应上下文,可以无缝部署在各种场景中。 可扩展性:OpenCity展示了有希望的缩放定律,表明该模型有潜力在最小的额外训练或微调需求下有效地扩展和适应新的、以前未见过...……更多
零样本即可时空预测!港大、华南理工等发布时空大模型UrbanGPT | KDD 2024
...即整合时空依赖编码器,以提升大型语言模型在捕捉时空上下文中的时间序列依赖性的能力。具体来说,我们设计的时空编码器由两个核心组件构成:一个是门控扩散卷积层,另一个是多层次关联注入层。上式 为初始化时空嵌...……更多
infini-attention:谷歌大内存机制
谷歌大改Transformer,“无限”长度上下文来了。现在,1B大模型上下文长度可扩展到1M(100万token,大约相当于10部小说),并能完成Passkey检索任务。8B大模型在500K上下文长度的书籍摘要任务中,拿下最新SOTA。这就是谷歌最新提...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
现在,长上下文视觉语言模型(VLM)有了新的全栈解决方案 ——LongVILA,它集系统、模型训练与数据集开发于一体。现阶段,将模型的多模态理解与长上下文能力相结合是非常重要的,支持更多模态的基础模型可以接受更灵活...……更多
梁文锋杨植麟论文撞题,“注意力机制”对大模型意味着什么
...于NSA(Natively Sparse Attention,原生稀疏注意力)。据DeepSeek,上下文建模对于下一代语言模型至关重要,但标准注意力机制的高计算成本带来了巨大的计算挑战。NSA(稀疏注意力)在提高效率同时,为提高模型能力提供新的方向,实...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
大模型的上下文长度快速增长,超长上下文解锁新应用,但推理计算代价高昂,上下文本身对于信息不会进行压缩,不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年,人工智能领域风起...……更多
陈天奇团队LLM结构化生成新引擎XGrammar:百倍加速、近零开销
...就是遵循某个特定格式(如 JSON、SQL 等)的数据。但使用上下文无关语法(CFG)来进行约束解码的方法并不高效。针对这个困难,陈天奇团队提出了一种新的解决方案:XGrammar。XGrammar 是一个开源软件库,可实现高效、灵活且可...……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
...据集:LooGLE,专门用于测试和评估大语言模型(LLMs)长上下文理解能力。该数据集既能够评估LLMs对长文本的处理和检索能力,又可以评估其对文本长程依赖的建模和理解能力。结果不评不知道,一评估发现这些模型在复杂的长...……更多
调研219篇文献,全面了解GenAI在自适应系统中的现状与研究路线图
...系统中的应用潜力概览监控功能:GenAI,特别是 LLMs,在上下文理解和预测方面显著增强了自适应系统的监控能力。LLMs 可将监控收集的非结构化数据进行结构化处理,辅助异常检测;在上下文预测方面,基于 LLM 和扩散模型的时...……更多
Anthropic再反击!发布Claude 3.5吊打GPT-4o,视觉、逻辑推理等方面表现更强
...kens收费3美元,每百万输出Tokens收费15美元,具有200K Tokens上下文窗口。Anthropic表示,目标是每隔几个月就大幅改善智能、速度和成本之间的权衡曲线。除了开发下一代模型系列外,还正在开发新模式和功能,以支持更多企业用例...……更多
京东率先推出行业首批高商业可用数字人,618向商家免费开放
...景需要复杂决策,则启动深度思考模式,依托1280K的超长上下文窗口,能完成多维度信息的关联与逻辑推演,在长文本1280K“大海捞针”评测中,实现接近100%的准确率。在大模型开发计算技术层面,京东探索研究院相关论文近期...……更多
北大林宙辰团队全新混合序列建模架构MixCon:性能远超Mamba
...层,相比 Mamba 可将 KV 缓存减少 32 倍。例如,在 256K 令牌上下文环境中,MixCon 仍能保持较小的 KV 缓存优势(如表 1 所示)。在吞吐量方面,处理长序列时,Conba 层计算效率更高,增加其比例可提高整体吞吐量。基本配置单位是 ...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...代表包含了图像(VI)和图像中的文字(TEI)两部分作为上下文信息,模型能还原出被遮住的文字的准确率。蓝色框内表示仅包含图像中的文字(TEI)的作为上下文信息,并不包含图像(VI),模型能还原出的遮住文字的准确率...……更多
AI赋能、短剧兴起,影视赛道 “一路生花“
...交互体验。Kimi智能助手的核心特点和功能包括:(1)长上下文处理:Kimi能够处理长达200万字的无损上下文,这意味着它可以理解和记忆大量信息,并在此基础上进行有效的交流和任务处理。(2)能力圈:Kimi的能力圈广泛,包...……更多
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...款面向C端的大模型产品。早前,该公司宣布在大模型长上下文窗口技术上取得新的突破,Kimi已支持200万字超长无损上下文,并开启产品内测,该能力在不到半年内提升9倍。市场的火爆,导致Kimi服务器一度瘫痪,无法回复用户...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...驱动的LLM文本生成」。RAG于2020年推出,它使用动态提示上下文,通过用户问题检索并注入LLM提示,以引导其使用检索到的内容,而不是预训练的知识。Chat LangChain是由RAG支持的、在Lang Chain文档上流行的Q/A聊天机器人。上下文学...……更多
EMQ 如何用DeepSeek大模型重构可观测性数据分析?
...升可观测性数据分析的智能化水平:·智能化推理:结合上下文对系统异常进行推理和判断,而非依赖硬编码规则。·自然语言处理:通过AI生成代码的方式灵活处理数据,满足特殊场景需求。·向量化知识库:利用AI推理能力,...……更多
10分钟速成专家,「Kimi智能助手」正式支持200万上下文,对话窗口提升10倍 | 最前线
...正式宣布,旗下的Kimi智能助手,已支持200万字超长无损上下文,并于即日起开启产品内测。Kimi智能助手是月之暗面(Moonshot AI)基于自研千亿参数大模型打造的对话式 AI 助手产品,在2023年10月正式发布。而月之暗面也是国内大...……更多
Kimi爆火出圈,国产大模型首次超越海外!
2024年3月18日,国产AI大模型Kimi将上下文无损输入长度提升至200万字,成为国内大模型首次在部分能力上超越海外主流产品的里程碑。上下文输入长度的增加能够帮助模型更好学习文本知识,从而更有针对性得与用户互动。在长...……更多
阿里云百炼上线Qwen2.5-Turbo模型,可支持100万超长上下文
...的Qwen2.5-Turbo已在阿里云百炼上线,该模型支持100万超长上下文,相当于100万个英文单词或150万个汉字,在多个长文本评测集上的性能表现超越GPT-4。即日起,所有用户可在阿里云百炼调用Qwen2.5-TurboAPI,百万tokens仅需0.3元。全新...……更多
AI大模型行业报告:大模型发展迈入爆发期,开启AI新纪元(附下载)
...以带来大幅的模型性能提升。同时,GPT-3论文正式提出“上下文学习”,建立了以提示学习方法为基础技术路线的任务求解范式。ChatGPT:一举成为现象级应用,引入RLHF算法改进训练数据GPT系列模型的技术演变(ChatGPT):在GPT-3...……更多
非Transformer架构站起来了!首个纯无注意力大模型,超越Llama 3.1
...每个单词(或 token)与文本中的每个单词进行比较来理解上下文,它需要更多的计算能力和内存需求来处理不断增长的上下文窗口。但是如果不相应地扩展计算资源,模型推理速度就会变慢,超过一定长度的文本就没法处理了。...……更多
鬼手操控着你的手机?大模型GUI智能体易遭受环境劫持
...两个目的找到了一个共同的操作。虽然框中的内容提供了上下文,指示了按钮的真实功能,但模型经常会忽略上下文的含义。(2)拒绝弹框的按钮被重写为情绪化表达。这种引导性的情绪有时可以影响甚至操纵用户决策。这种...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
...asoner是一个创新的多步推理框架,结合了大型语言模型的上下文学习和推理能力,通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估,有效提高了复杂时间序列任务的推理能力和准确性。实验结果表明,TS-...……更多
顺丰科技函证LaaS元能力碰撞数字生态
...应用级和服务级元能力的标准定义。通过界定领域实体与上下文界限、排线模型抽象设计等实践,重新定义函证LaaS的元能力,为加速数字生态构建奠定了坚实基础。LaaS元能力函证领域分析函证处理上下文(排线模型)函证领域...……更多
给小学数学题加句废话,OpenAI o1就翻车了,苹果论文质疑AI推理
...为。该观点还指出,人类在解决数学问题时通常有明确的上下文,而 LLM 在处理数学问题时可能没有这样的上下文。因此,如果通过适当的提示工程,向模型明确这是一个数学考试的环境,那么它们在添加多余子句时导致的性能...……更多
Mamba再次挑战霸主Transformer!首个通用Mamba开源大模型一鸣惊人
...有效地捕获其关系。这种通过比较文本中每个token来理解上下文的方式,需要更多的计算能力和内存来处理不断增长的上下文窗口。如果资源没有相应扩展,推理速度会变慢,最终无法处理超过某个固定长度的文本。为了解决这...……更多
零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源
...代码能力和数学能力专项的继续训练模型。全球最长200K上下文窗口Yi-34B模型将发布全球最长、可支持200K超上下文窗口(contextwindow)版本,可以处理约40万汉字超文本输入。上下文窗口是大模型综合运算能力的金指标之一,对于理...……更多
更多关于科技的资讯:
中新经纬8月8日电 据深交所微信公众号8日消息,8月5日,深交所在杭州举办第二十六期“创享荟”活动,围绕创新药的现状未来及资本市场支持行业高质量发展举办专题座谈交流
2025-08-08 19:27:00
一杯“秋奶”喝出节气新经济:益禾堂立秋单日总GMV破6700万!
当二十四节气与新茶饮浪漫邂逅,一杯奶茶如何成为秋日仪式感的代名词?8月7日立秋,益禾堂以“秋天宠你”为情感内核,成功引爆全民“秋天的第一杯奶茶”消费热潮
2025-08-08 19:34:00
2025跑步机选购榜单:减震技术如何守护你的膝盖舒适与运动健康?
跑步机的价值,最终由膝盖说了算!本榜聚焦长期使用下的膝盖舒适度与耐用性两大核心价值,评选真正懂呵护的跑步机。膝盖舒适度&
2025-08-08 19:34:00
2025最新进口纳豆激酶品牌排行榜!哪个牌子效果好又安全?科研实力+口碑双认证!
在当今健康意识不断提升的时代,纳豆激酶凭借其卓越的心血管保健功效,已成为众多家庭必备的营养补充品。面对市场上琳琅满目的产品选择
2025-08-08 19:34:00
中能拾贝深度赋能某上市发电企业,构建电力生产全链条数字化新范式
随着“双碳”目标的深入推进与数字技术的迅猛发展,能源电力行业正迎来绿色转型与智能升级的关键窗口期。中能拾贝深耕能源电力行业二十载
2025-08-08 19:34:00
2025采购与供应管理大会将于9月在厦门开幕
2025年9月14日—16日,全球供应链管理领域的目光将聚焦于福建省厦门市。在这座美丽的海滨城市,一场备受瞩目的国际盛会——“2025年采购与供应管理大会暨第六届中国供应链管理年会”即将拉开帷幕
2025-08-08 19:34:00
益禾堂“秋奶”狂潮席卷全国,立秋当日总GMV破6700万,创历史新高!
8月7日立秋,“秋天的第一杯奶茶”全民狂欢再度引爆!益禾堂以“益趣”为核心,主打“秋天宠爱”,推出轻乳茶新品,结合创意营销攻势
2025-08-08 19:34:00
在茶馆遇见茶的温度与品牌的厚度:解码小罐茶全新茶馆生态
在快节奏的城市生活中,逐渐兴起的“茶空间”逐渐成为人们逃离压力、精神栖息、社交娱乐的都市新场景。这种生活消费方式的转变
2025-08-08 19:34:00
北京最有人气的购物中心,要被卖了
近日,有市场知情人士透露,英格卡购物中心正计划打包出售国内的10座荟聚购物中心。首批将出售位于无锡、北京、武汉的三座荟聚购物中心
2025-08-08 09:16:00
李现也来参与的“观鸟”,在全球拥有千亿级市场|产品观察
作者 | 张子怡编辑 | 彭孝秋今年春天,明星李现带火一个小众赛道。他分享的观鸟vlog被生态环境部公开表扬,此后一连数日的热搜都跟“观鸟”
2025-08-08 11:22:00
商品多退少补太繁琐?小鹅通称重分拣功能上线,高效管理每一克!
小鹅发现,不少社区团购商家在用小鹅通卖生鲜时,采用的是先销后采的方式,缺少"称重分拣"的环节,销转过程低效还易出错。现在
2025-08-08 12:22:00
外卖大战背后,最直观的受益者当属消费者。数据显示,90后日均打开外卖App的频次已达3.2次,25-45岁人群贡献了82%的订单
2025-08-08 10:39:00
随着美团、饿了么、京东的官宣,这场外卖大战似乎会暂告一段落。其间出现各种意想不到的现象,也引起各方对外卖行业发展的反思
2025-08-08 10:39:00
外卖内卷,算得上今年的一个现象级话题。2月11日京东宣布入局外卖,一池春水即被搅动。美团升级“闪购”,饿了么联合淘宝闪购
2025-08-08 10:39:00
AI重塑南京钢铁产业新图景
从“钢花飞溅”到“数据奔流”,蹲点一线看“南钢+华为”元冶·钢铁大模型——AI重塑南京钢铁产业新图景南钢智慧中心内部。智能金相实验室
2025-08-08 07:14:00