• 我的订阅
  • 头条热搜
Yann LeCun说自回归要完,DeepMind论文证明自回归能实现通用计算
...究了自回归解码的一种自然泛化,其中在处理每个连续的上下文之后,输出的 token 都会被添加到序列末端 —— 只要输入能放入上下文窗口中,则该过程就会简化成标准的自回归解码。不过,该团队得到这一结果的过程比较复杂...……更多
Pokémon Go开发地理空间大模型,AR眼镜的高精地图?
...空间中的物体赋予了具体意义,让AR眼镜能够理解环境的上下文,将虚拟的3D物体合理地放置在真实空间的方位中。任天堂与Niantic合作的《皮克敏》AR手游,图/Niantic这一点也与现有视觉模型依赖二维图像识别技术不同,视觉模型...……更多
...88.2%的乘客咨询问题精准分类,支持连续多轮交互,确保上下文一致性,相较传统对话机器人提升70%。同时根据上下文分析监测用户情绪波动,并触发人工介入机制,使响应速度提升20%。“在模拟测试环境中,搭载DeepSeek大模型...……更多
谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
...发者提供了前段时间在I/O大会上官宣的Gemini 1.5 Pro的200万上下文窗口访问权限、Gemini API的代码执行功能,并在Google AI Studio中添加了Gemma 2。在最新的博客中,谷歌宣布向所有开发者开放了Gemini 1.5 Pro的200万token上下文窗口访……更多
自主 AI 来了?一文详解火爆全网的 AutoGPT
...在 .env 文件中配置,例如可以利用 token 限制控制输入 (上下文)和输出(响应)的长度,从而控制成本。我看到了一些与 LangChain 集成的拉取请求,这意味着Auto-GPT可以访问其他开源模型了,但也许项目本身也有集成其他模型的...……更多
没排上SearchGPT?比Perplexity更好用的国产开源平替了解一下?
...仔细阅读,汇总得出最终答案。MindSearch 中,LLM 如何管理上下文作为一个多智能体框架,MindSearch 为如何管理长上下文提供了全新尝试。当需要快速阅读大量网页时,由于最终答案只依赖 WebSearcher 的搜索结果,WebPlanner 将专注于...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...驱动的LLM文本生成」。RAG于2020年推出,它使用动态提示上下文,通过用户问题检索并注入LLM提示,以引导其使用检索到的内容,而不是预训练的知识。Chat LangChain是由RAG支持的、在Lang Chain文档上流行的Q/A聊天机器人。上下文学...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...2B输入图片的分辨率和长宽比不受任何限制,并且在128K的上下文窗口范围内,想放多少张图片都行!从论文的测试结果来看,Pixtral 12B明显优于其他类似大小的开源模型(比如Llama-3.2 11B和Qwen-2-VL 7B),甚至在一些评测中,表现比...……更多
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...言模型)和中文大模型榜单C-Eval排行榜已经爬升到1位。上下文窗口,意味着模型的“记忆力”。据介绍,Yi目前拥有200K上下文窗口,可处理约40万字的文本——这也是目前全球大模型中最长的上下文窗口。李开复提到,由于GPU紧...……更多
现场直击一文总结!OpenAI开发者大会,史上最强GPT-4 Turbo发布,AI圈地震
...4月的绝大部分世界事件。不仅如此GPT4 Turbo版还提供128k的上下文窗口,也就是说,它可以一次容纳相当于300多页文本内容的提示词(很难想象一下子有这么多提示词还能做到不崩溃)。相比原版GPT-4,Turbo版的收费做了大幅下降...……更多
Manus发布付费方案:最高每月199美元
...00积分同时运行任务:最多2个专属资源提升稳定性扩展的上下文长度高峰时段优先访问Manus Pro定价每月199美元,权益包括:每月积分:19900积分同时运行任务:最多5个使用高投入模式和其他测试功能专属资源提升稳定性扩展的上...……更多
“三巨头”杀疯了!开盘15分钟,微软、苹果、英伟达轮番角逐市值“一哥”!
...苹果展示的功能虽然有限,但却显得无缝且简单,如基于上下文搜索照片、分享定制表情符号等。由于微软在日常生活中的作用有限,使得其AI应用的实际用途受到限制。华泰证券最新研报分析指出,苹果在2024年WWDC首日推出了...……更多
Kimi K2 + SunwayLink,让智能倍增释放
...求。SunwayLink的企业应用集成能力得到进一步提升。② 长上下文优化128K上下文窗口结合SunwayLink的动态记忆管理,可处理超长合同、技术文档分析等场景。2.智能体能力提升效果1000+页的标书、合同、技术文档一次性读取分析,解...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...日常活动。评测结果表示,人类专家水平显著优于目前长上下文多模态模型中最厉害的Gemini Pro 1.5(85.0%对37.3%)。在多模态能力上,大模型们还任重而道远。HourVideo如何炼成? 之所以提出HourVideo,是因为研究人员发现目前长视...……更多
谷歌宣布旗下geminiai支持更多类型的文件
...GIF等格式的图像,提取文本、识别对象并为视觉内容提供上下文。音频:用户现在可以上传MP3、WAV和FLAC等格式的音频文件,让GeminiAI能够转录语音、识别发言人,并总结访谈、播客和讲座中的要点。视频:GeminiAI现在可以处理MP4...……更多
开源大模型新的里程碑!Llama 3.1 模型准时发布
...eta和Llama团队对开源的巨大贡献"。他表示:"Llama3.1增加了上下文长度和改进了功能,是送给每个人的奇妙礼物。"图源:网络总的来说,Llama3.1模型有以下几个特点:1.包含8B、70B和405B三个尺寸,最大上下文提升到了128K,支持多语...……更多
...准GPT-4的两倍,并具有扩展的32000个令牌(约25000个单词)上下文窗口。上下文窗口是指模型在生成附加文本之前考虑的文本,一般来说,具有大上下文窗口的模型不太可能“忘记”最近对话的内容。OpenAI此举无疑是为了减轻企业...……更多
科大讯飞星火大模型亮相北京车展
...项全栈自研的技术,它深度融合了大模型的概括、推理、上下文理解和复杂内容生成等能力,与行车、通信、娱乐等多种用车场景紧密集成,结合语音和视觉交互,可以用户带来更自然、自由、智能的座舱体验。凭借其创新设计...……更多
协同办公进入AI时代 金山办公张宁:不追求最强AI大模型,合适最重要
...技术之前,WPS只能针对单个单词进行拼写检查,无法根据上下文语境进行语句修改与润色。WPS通过Amazon Bedrock接入Anthropic Claude 3系列模型进行语义检查与文档润色。Claude基础模型拥有平均1.3秒到1.5秒的快速响应能力,可有效提升...……更多
RAG没有银弹!四级难度,最新综述覆盖数据集、解决方案,教你「LLM+外部数据」的正确使用姿势
...24文中还讨论了将外部数据集成到LLMs中的三种主要形式:上下文、小模型和微调,分析各自的优势、局限性以及适合解决的问题类型。级别1:显式事实查询(explicit fact queries)例:2024年夏季奥运会将在何处举行?Where will the 2024...……更多
智谱AI发布基座大模型GLM-4,发起大模型开源基金
...开放日上,智谱AI发布新一代基座大模型GLM-4,支持128K的上下文窗口长度,单次提示词能处理的文本可达300页,文生图和多模态理解得到增强,支持处理Excel、PDF、PPT等格式的文件,可自动调用代码解释器进行复杂的方程或微积...……更多
智谱AI的双轨驱动:从基座大模型出发,以共创理念推进商业落地
...型GLM-4,整体性能相比上一代大幅提升。GLM-4可支持128k的上下文窗口长度,与GPT-4 Turbo相当,同时具备更强多模态能力,效果超过开源SD模型,逼近DALLE-3。当然,在大模型竞争中,模型性能仅仅是其中一环。在头部厂商都已完成...……更多
周活过亿,GPT4再升级!OpenAI放出杀手锏:可自定义,更强大还便宜
...次发布的Turbo模型在多个方面取得了显著进步。首先,在上下文对话长度上,基于GPT4的ChatGPT最大只能处理8000个tokens(语言模型中用来表示单词或短语的符号,8000个tokens约等于6000个单词),而GPT企业版拥有32000个tokens的上下文窗...……更多
OpenAI没有放弃的机器人梦想
...决策速度也是一个很大的问题。”还有人会担心大模型的上下文长度限制以及“幻觉”问题,会对机器人行为产生影响。对此,刘智勇认为:“通过TokenLearner(一种视觉表征学习方法)来优化输入数据,可以解除上下文窗口限制...……更多
4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,性能秒杀FLUX
...M替换T5作为文本编码器,并设计了复杂的人类指令,通过上下文学习来增强图像-文本对齐。 高效的训练和采样:提出Flow-DPM-Solver来减少采样步骤,并通过高效的标题标注和选择来加速收敛。基于以上的算法创新,相较于领先扩...……更多
OpenAI举办“AI春晚”;李开复大模型破纪录 | 图灵周报
...的Baichuan2-192K大模型之后,李开复的Yi系列模型再次刷新上下文窗口长度纪录——参数量达340亿的Yi-34B,可支持200K超长上下文窗口,可处理约40万汉字超长文本输入,是目前全球最长的上下文窗口。目前,零一万物估值超过10亿美...……更多
Kimi概念股继续暴涨!多家上市公司回应,月之暗面致歉系...
...。 此前3月18日,月之暗面宣布其AI产品Kimi,在大模型长上下文窗口技术上取得新的突破,Kimi智能助手已支持200万字超长无损上下文,并于即日起开启产品内测。据了解,月之暗面成立于2023年4月,法定代表人杨植麟毕业于清华...……更多
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...LM 中,显式记忆是继隐式记忆(模型参数)和工作记忆(上下文键值)之后的第三种记忆形式。 具体而言,本文引入了一种新的记忆格式,即显式记忆,其特点是写入成本和读取成本相对较低。如图 1 所示,模型首先将知识库...……更多
全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型
...将具备多步骤推理能力。来源:谷歌谷歌的Gemini以超长的上下文窗口而出名。在大会上,谷歌重点强调了大模型Gemini 1.5 Pro的多模态和长文本能力,为其推出一系列更新。谷歌将向全球150多个国家地区的Gemini Advanced订阅者提供最...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
...asoner是一个创新的多步推理框架,结合了大型语言模型的上下文学习和推理能力,通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估,有效提高了复杂时间序列任务的推理能力和准确性。实验结果表明,TS-...……更多
更多关于科技的资讯:
CBD 新地标:Z3,未来办公引擎登场
北京,2025年9月24日——北京 CBD 核心区再添重磅力作!今日,备受瞩目的 Z3 超甲级写字楼项目正式揭开神秘面纱
2025-09-25 13:43:00
中国电信-海信日立联合实验室揭牌,共筑智慧家电产业新高地
9月19日,中国电信山东公司、天翼物联科技公司与青岛海信日立在青岛举行联合实验室揭牌仪式,标志着三方战略合作迈入全方位深度融合的新阶段
2025-09-25 13:43:00
2025云栖大会直击:云深处科技机器人矩阵亮相,多场景展示行业引领性!
9月24日至26日,全球云计算与 AI 领域年度旗舰盛会 ——2025 云栖大会在杭州云栖小镇盛大启幕。本届大会以“云智一体・碳硅共生”为核心主题
2025-09-25 13:44:00
为落实《个人征信电子授权安全技术指南》(JR/T 0299—2024)金融行业标准,规范金融机构在个人征信电子授权中的技术操作
2025-09-25 13:44:00
文玩新经济浪潮奔涌,2025全国文玩大会重塑行业生态与消费图景
秋意渐浓,北京迎来一场文玩行业盛会。9月24日至28日,以“国潮觉醒 文玩新生”为主题的2025全国文玩大会于潘家园市场(西区)盛大举行
2025-09-25 13:46:00
如今,微短剧已然从“内容新贵”成长为拉动数字经济的重要力量。因为“轻、快、密”的内容节奏,短剧得以迅速占领用户的碎片时间
2025-09-25 13:46:00
三榜齐登、实力认证!网易有道连续五年入选“北京民营企业百强”
日前,北京市工商联、通州区人民政府联合召开2025北京民营企业百强发布会。会上,网易有道凭借持续的创新能力和稳健的业绩表现
2025-09-25 10:06:00
济南爱尔眼科实施全国首批龙晶PR型有晶体眼人工晶状体植入术
近日,首批龙晶PR型有晶体眼人工晶状体植入手术在济南爱尔眼科医院完成,作为“尝鲜吃螃蟹”的人,患者脸上洋溢着发自内心满意的微笑
2025-09-25 11:20:00
观赛有了更佳的趣味性与沉浸感金科院数字科技赋能国际赛艇大赛南报网讯(通讯员陆慧记者姜静实习生黄佳琪)2025南京·大学生国际赛艇公开赛近日在外秦淮河畔举行
2025-09-25 07:38:00
提升“双盲”模式下的评标质效雄安新区面向评标专家智能问答系统正式上线河北日报讯(见习记者康晓博)只需轻点鼠标,远在外地的评标专家就能获得精准指引
2025-09-25 07:58:00
大模型算出爆款,红枣变致富“金枣”
大模型算出爆款,红枣变致富“金枣”——看沧县红枣及干坚果食品加工产业如何实现数字化转型9月18日,河北华聚食品有限公司的工人忙着打包红枣产品
2025-09-25 07:59:00
9月17日,兴业银行信用卡中心与美团企业版在上海签署战略合作协议,共同打造“金融+生活”开放生态。根据协议,双方将基于开放共享
2025-09-24 07:24:00
金洽会上51个重点产业项目签约,计划投资802.21亿元——一串串数字,见证企业对南京的高度认可□南京日报/紫金山新闻记者张甜甜9月23日
2025-09-24 08:11:00
5项科技创新成果案例发布芯片设计迎“超强大脑”多癌早筛一管血“搞定”南报网讯(记者张安琪)9月23日,2025南京金洽会开幕式重点发布环节
2025-09-24 08:12:00
在今年国庆、中秋双节消费旺季来临之际,济南122站以“客户体验感”为核心,从“环境优化、商品管理、客户拓展”三大维度精准发力
2025-09-24 08:50:00