• 我的订阅
  • 头条热搜
infini-attention:谷歌大内存机制
谷歌大改Transformer,“无限”长度上下文来了。现在,1B大模型上下文长度可扩展到1M(100万token,大约相当于10部小说),并能完成Passkey检索任务。8B大模型在500K上下文长度的书籍摘要任务中,拿下最新SOTA。这就是谷歌最新提...……更多
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...款面向C端的大模型产品。早前,该公司宣布在大模型长上下文窗口技术上取得新的突破,Kimi已支持200万字超长无损上下文,并开启产品内测,该能力在不到半年内提升9倍。市场的火爆,导致Kimi服务器一度瘫痪,无法回复用户...……更多
10分钟速成专家,「Kimi智能助手」正式支持200万上下文,对话窗口提升10倍 | 最前线
...正式宣布,旗下的Kimi智能助手,已支持200万字超长无损上下文,并于即日起开启产品内测。Kimi智能助手是月之暗面(Moonshot AI)基于自研千亿参数大模型打造的对话式 AI 助手产品,在2023年10月正式发布。而月之暗面也是国内大...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...内的大模型而言,只有Minimax采用了MoE架构。二、扩容的上下文窗口意味着什么?虽然Gemini 1.5 Pro是 Gemini 1.5 系列的初代版本,但初代便表现不俗。扩大上下文窗口后的高水平性能是Gemini 1.5 Pro的一大亮点。多模态大模型卷到今日...……更多
Kimi爆火出圈,国产大模型首次超越海外!
2024年3月18日,国产AI大模型Kimi将上下文无损输入长度提升至200万字,成为国内大模型首次在部分能力上超越海外主流产品的里程碑。上下文输入长度的增加能够帮助模型更好学习文本知识,从而更有针对性得与用户互动。在长...……更多
零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源
...代码能力和数学能力专项的继续训练模型。全球最长200K上下文窗口Yi-34B模型将发布全球最长、可支持200K超上下文窗口(contextwindow)版本,可以处理约40万汉字超文本输入。上下文窗口是大模型综合运算能力的金指标之一,对于理...……更多
《红楼梦》里有大量东北方言?实测AI大模型“长文阅读”
...,国内通用人工智能“初创明星”月之暗面宣布在大模型上下文窗口技术上取得新突破,旗下的Kimi智能助手可支持200万字超长无损上下文,并开启产品内测,随即引发市场关注和热议,并一度因过于火爆“宕机”。随后,阿里...……更多
王小川公布最新大模型,号称全球最长上下文,是GPT-4的14倍|钛媒体焦点
...模型公司“百川智能”宣布,推出Baichuan2-192K大模型,其上下文窗口长度高达192K,能够处理约35万个汉字。百川智能称,Baichuan2-192K是目前全球最长的上下文窗口,也是目前支持长上下文窗口最优秀大模型Claude2(支持100K上下文窗...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
大模型的上下文长度快速增长,超长上下文解锁新应用,但推理计算代价高昂,上下文本身对于信息不会进行压缩,不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年,人工智能领域风起...……更多
本周AI不得了!OpenAI的Sora“模拟世界”、Gemini 1.5“10M上下文”、Mistral的开源新贵同日出现
...质量令人着迷。总结:谷歌可能找到了某种新方法,将长上下文的架构理念与他们的 TPU 计算堆栈相结合,并取得了很好的效果。据 Gemini 长语境的负责人之一Pranav Shyam说,这个想法几个月前才刚刚萌芽。如果以小版本(v1.5)而...……更多
马斯克 xAI 推出 Grok-1.5 大语言模型
...Grok-1.5 大语言模型。Grok-1.5 具有改进的推理能力和 128k 的上下文长度,其中最显著的改进之一是其在编码和数学相关任务中的表现。Grok-1.5 将在未来几天内在 平台上向早期测试人员和现有的 Grok 用户推出。在官方测试中,Grok-1.5...……更多
Kimi引爆人工智能新风口,龙头连续20CM涨停!哪些公司可
...宣布,公司旗下的kimi智能助手,已支持200万字超长无损上下文,并已开启产品内测。继昨日爆发后,kimi概念股今天(3月21日)继续上涨。其中,龙头股华策影视(300133.SZ)再次涨停,连续收获两个20CM涨停,捷成股份(300182.SZ)...……更多
顺丰科技函证LaaS元能力碰撞数字生态
...应用级和服务级元能力的标准定义。通过界定领域实体与上下文界限、排线模型抽象设计等实践,重新定义函证LaaS的元能力,为加速数字生态构建奠定了坚实基础。LaaS元能力函证领域分析函证处理上下文(排线模型)函证领域...……更多
openai推出gpt-4turbo:比上代便宜三倍
...者而言“比上代GPT-4便宜三倍”。据悉,GPT-4Turbo支持128k上下文,输入价格比GPT-4便宜了三倍,速率限制翻倍,知识库更新到2023年4月,此外还添加了JSONMode,更新了多个函数调用能力。相对此前GPT-4性能更强、价格更便宜、开发成...……更多
智谱AI发布基座大模型GLM-4,发起大模型开源基金
...开放日上,智谱AI发布新一代基座大模型GLM-4,支持128K的上下文窗口长度,单次提示词能处理的文本可达300页,文生图和多模态理解得到增强,支持处理Excel、PDF、PPT等格式的文件,可自动调用代码解释器进行复杂的方程或微积...……更多
AI赋能、短剧兴起,影视赛道 “一路生花“
...交互体验。Kimi智能助手的核心特点和功能包括:(1)长上下文处理:Kimi能够处理长达200万字的无损上下文,这意味着它可以理解和记忆大量信息,并在此基础上进行有效的交流和任务处理。(2)能力圈:Kimi的能力圈广泛,包...……更多
黄仁勋对话Transformer七作者:很多计算资源被浪费,世界需要更好的模型
...环神经网络模型,Transformer模型能够更准确地捕捉单词的上下文和含义,因而成为了像GPT-4和ChatGPT这样的大语言模型的基础,同时也被应用于非语言领域,包括OpenAI的AI代码生成训练模型Codex、文生视频模型Sora和谷歌DeepMind的蛋白...……更多
商汤 AI 办公小程序“Raccoon 智能助手”上线:提炼文章重点
...幅提升。该模型基于超过 10TB tokens 训练,具备 200K 推理上下文窗口(相当于 36.5 万个汉字),推理时上下文窗口达到 200K 左右,提供自然语言处理、图片生成、自动化数据标注、自定义模型训练等多种大模型及能力。 ……更多
全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型
...将具备多步骤推理能力。来源:谷歌谷歌的Gemini以超长的上下文窗口而出名。在大会上,谷歌重点强调了大模型Gemini 1.5 Pro的多模态和长文本能力,为其推出一系列更新。谷歌将向全球150多个国家地区的Gemini Advanced订阅者提供最...……更多
OpenAI推出GPT商店,人人可0代码自制智能体,业界看好成为下一个苹果
...、更便宜的GPT-4——GPT-4 Turbo,做出六大升级——更长的上下文长度、更强的控制、知识升级、多模态、模型微调定制和更高的速率限制。GPT-4的付费服务将“加量不加价”。 OpenAI还宣布,ChatGPT每周用户数量已达到1亿。自3月发...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...专家架构,超10TB tokens训练,覆盖大量合成数据,推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中,用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4回答趣...……更多
国产大模型加速落地,争夺“中国版ChatGPT”心智定位
...答、对话、写作、翻译等功能,后者则可以完成处理200K上下文、多文档阅读理解,以及超长知识库构建等任务。 今年3月6日,零一万物官微宣布开源Yi-9B模型。据介绍,Yi-9B是目前Yi系列模型中代码和数学能力最强的模型,实际...……更多
OpenAI史诗级更新!最强大模型炸场,128K上下文、价格暴降2/3
...大方面更新重点值得关注和思考。1、GPT-4 Turbo:支持128k上下文,相当于300页文档,输入价格大降2/3,速率限制翻倍,知识更新到2023年4月,改进指令跟随和JSON Mode,更新多个函数调用能力。这意味着比GPT-4更强、更便宜、开发成...……更多
协同办公进入AI时代 金山办公张宁:不追求最强AI大模型,合适最重要
...技术之前,WPS只能针对单个单词进行拼写检查,无法根据上下文语境进行语句修改与润色。WPS通过Amazon Bedrock接入Anthropic Claude 3系列模型进行语义检查与文档润色。Claude基础模型拥有平均1.3秒到1.5秒的快速响应能力,可有效提升...……更多
GTC对话黄仁勋:我眼中的GPU,和别人有很大差别
...不是基于检索的。当然,这个生成过程必须是智能的、与上下文相关的。我相信,未来人们电脑上的几乎每一个像素、每一次交互都将通过生成过程产生,我相信 Sam 也这么认为。希望通过 Blackwell 新一代架构能为生成式 AI 这个...……更多
rtxai助手的进化
...Assist项目可接收玩家的语音或文字输入内容,游戏窗口的上下文信息,并通过AI视觉模型处理数据。这些模型增强了与游戏知识数据库相连的大语言模型(LLM)的上下文感知和对特定游戏及应用的理解,然后生成定制的回复,以文...……更多
开源社区分水岭:Meta大模型Llama 3发布,参数最高或达4000亿
...ama 3已经开放了80亿(8B)和700亿(70B)两个小参数版本,上下文窗口为8k。Meta表示,通过使用更高质量的训练数据和指令微调,Llama 3比前代Llama 2有了“显著提升”。未来,Meta将推出Llama 3的更大参数版本,其将拥有超过4000亿参...……更多
对标or颠覆?Anthropic让创业者狠狠共情
...能力为优势的大模型,Claude3 Opus版本支持了 200K Tokens 的上下文窗口,并且可以处理100万Tokens 的输入。对于许多自然语言处理任务来说,例如机器翻译、摘要生成、问答系统等,长期依赖性是一个关键挑战,因为文本的含义通常...……更多
一键解锁ChatGPT原理与应用
...生成连贯、合理的回复,从而实现自然语言处理任务。3. 上下文理解的关键技术GPT不仅能理解用户当前的问题,还能基于前文理解问题背景。这得益于Transformer架构中的“自注意力机制(Self-attention)”。该机制使得GPT能够捕捉...……更多
...效捕捉局部信息和短依赖信息,使模型能够更精准地掌握上下文之间的强语义关联,学习人类语言习惯范式本质,大幅提升数理逻辑、数学计算、代码生成能力。浪潮信息于2021年9月在业界率先推出了中文人工智能(AI)巨量模...……更多
更多关于科技的资讯:
人民网“福建金融舆情管理共享平台”上线 打造金融舆情服务新模式
本文转自:人民网金融是国民经济的血脉,是国家核心竞争力的重要组成部分。日前,中央金融工作会议要求,各地区各部门要扎实做好加强金融监管
2024-06-26 20:22:00
更轻更节能!全球首列商用碳纤维地铁列车在青岛发布
本文转自:人民日报客户端侯琳良6月26日,中车青岛四方机车车辆股份有限公司联合青岛地铁集团为青岛地铁1号线研制的碳纤维地铁列车“CETROVO1
2024-06-26 22:42:00
蔚来车主踩断加速踏板 官方回应:车辆曾发生严重碰撞事故
快科技6月26日消息,说一个很多人可能想不到的冷知识,汽车的加速踏板并非金属,是有可能被踩断的,特殊情况下也会自己断裂
2024-06-26 16:07:00
美团忽视的闲时生意:被抖音做火了
快科技6月26日消息,在本地生活服务领域,抖音通过创新的"错峰特惠"活动,巧妙捡起了美团忽视的闲时生意。想象一下,一家店有时候人头攒动
2024-06-26 16:07:00
@高考生,新能源汽车大佬们喊你来选专业啦
‍‍‍‍近日,工信部发布的《制造业人才发展规划指南》显示,到2025年,我国新能源汽车产业的人才缺口可达103万人。其中
2024-06-26 16:11:00
千余家企业参展 第27届青岛国际机床展览会启幕
宋祖锋青岛报道6月26日,第27届青岛国际机床展览会和第7届中日韩智能制造大会在青岛市即墨区启幕。本次展览会为期五天,将深度聚焦中日韩智能制造前沿
2024-06-26 16:12:00
青岛发布全球首列商用碳纤维地铁:重量更轻 年内载客
快科技6月26日消息,全球首列商业化运营的碳纤维地铁列车“CETROVO 1.0 碳星快轨”今日在青岛正式发布。该列车由中车四方股份公司与青岛地铁集团联合研制
2024-06-26 16:22:00
7分10秒!疑小米SU7纽北圈速曝光:比奔驰AMG GT R还快
快科技6月26日消息,小米SU7已经前往世界最为知名的纽北赛道测试,近日,有网友曝光了该车的成绩,其称自己就在现场观看
2024-06-26 16:22:00
腾讯QQ的“祖师爷”!聊天软件鼻祖ICQ今日正式停止服务
快科技6月26日消息,聊天软件鼻祖ICQ在5月份发表公告称,将于6月26日关闭,建议用户改用VK Messenger。ICQ官网今天显示“Service stopped working”
2024-06-26 16:22:00
探店经济激发消费新活力 短视频、直播让餐饮酒旅更巴适四川新闻网成都6月26日讯在数字化浪潮下,抖音等短视频和直播平台已成为人们获取信息
2024-06-26 16:22:00
设计大咖齐聚2024科勒 · 设计上海设计论坛
2024年6月19日(中国,上海)——亚洲权威设计盛会「设计上海」2024于上海世博展览馆盛大开幕,汇聚世界设计力量,见证全球设计新高度
2024-06-26 16:23:00
同一角色两套穿搭!美女COS老头环人物反差感十足
借着《艾尔登法环:黄金树幽影》发售后的热度,围绕游戏中的女角色,例如女武神玛莲妮亚、永恒女王玛莉卡、梅琳娜的COS作品在近期也涌现了出来
2024-06-26 16:37:00
光存储第一股!紫晶存储因欺诈发行退市被追偿10.86亿元
快科技6月26日消息,据媒体报道,紫晶存储发布公告称,收到中信建投、致同会计师事务所、容诚会计师事务所和广东恒益律师事务所等的诉讼材料
2024-06-26 16:52:00
万元折叠屏机皇降临!三星Galaxy全球发布会前瞻
三星公司官宣将于北京时间7月10日21点在法国巴黎举办Galaxy全球新品发布会。本次活动全程网络直播,将会发布Galaxy Z Fold6
2024-06-26 16:52:00
两栋大厦几乎搬空 完美世界回应大规模裁员
快科技6月26日消息,针对近期网络传言关于完美世界启动大规模裁员的消息,公司今日作出回应,确认此举为必要的人员结构优化
2024-06-26 16:52:00