• 我的订阅
  • 头条热搜
infini-attention:谷歌大内存机制
谷歌大改Transformer,“无限”长度上下文来了。现在,1B大模型上下文长度可扩展到1M(100万token,大约相当于10部小说),并能完成Passkey检索任务。8B大模型在500K上下文长度的书籍摘要任务中,拿下最新SOTA。这就是谷歌最新提...……更多
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...款面向C端的大模型产品。早前,该公司宣布在大模型长上下文窗口技术上取得新的突破,Kimi已支持200万字超长无损上下文,并开启产品内测,该能力在不到半年内提升9倍。市场的火爆,导致Kimi服务器一度瘫痪,无法回复用户...……更多
10分钟速成专家,「Kimi智能助手」正式支持200万上下文,对话窗口提升10倍 | 最前线
...正式宣布,旗下的Kimi智能助手,已支持200万字超长无损上下文,并于即日起开启产品内测。Kimi智能助手是月之暗面(Moonshot AI)基于自研千亿参数大模型打造的对话式 AI 助手产品,在2023年10月正式发布。而月之暗面也是国内大...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...内的大模型而言,只有Minimax采用了MoE架构。二、扩容的上下文窗口意味着什么?虽然Gemini 1.5 Pro是 Gemini 1.5 系列的初代版本,但初代便表现不俗。扩大上下文窗口后的高水平性能是Gemini 1.5 Pro的一大亮点。多模态大模型卷到今日...……更多
Kimi爆火出圈,国产大模型首次超越海外!
2024年3月18日,国产AI大模型Kimi将上下文无损输入长度提升至200万字,成为国内大模型首次在部分能力上超越海外主流产品的里程碑。上下文输入长度的增加能够帮助模型更好学习文本知识,从而更有针对性得与用户互动。在长...……更多
零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源
...代码能力和数学能力专项的继续训练模型。全球最长200K上下文窗口Yi-34B模型将发布全球最长、可支持200K超上下文窗口(contextwindow)版本,可以处理约40万汉字超文本输入。上下文窗口是大模型综合运算能力的金指标之一,对于理...……更多
《红楼梦》里有大量东北方言?实测AI大模型“长文阅读”
...,国内通用人工智能“初创明星”月之暗面宣布在大模型上下文窗口技术上取得新突破,旗下的Kimi智能助手可支持200万字超长无损上下文,并开启产品内测,随即引发市场关注和热议,并一度因过于火爆“宕机”。随后,阿里...……更多
王小川公布最新大模型,号称全球最长上下文,是GPT-4的14倍|钛媒体焦点
...模型公司“百川智能”宣布,推出Baichuan2-192K大模型,其上下文窗口长度高达192K,能够处理约35万个汉字。百川智能称,Baichuan2-192K是目前全球最长的上下文窗口,也是目前支持长上下文窗口最优秀大模型Claude2(支持100K上下文窗...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
大模型的上下文长度快速增长,超长上下文解锁新应用,但推理计算代价高昂,上下文本身对于信息不会进行压缩,不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年,人工智能领域风起...……更多
本周AI不得了!OpenAI的Sora“模拟世界”、Gemini 1.5“10M上下文”、Mistral的开源新贵同日出现
...质量令人着迷。总结:谷歌可能找到了某种新方法,将长上下文的架构理念与他们的 TPU 计算堆栈相结合,并取得了很好的效果。据 Gemini 长语境的负责人之一Pranav Shyam说,这个想法几个月前才刚刚萌芽。如果以小版本(v1.5)而...……更多
马斯克 xAI 推出 Grok-1.5 大语言模型
...Grok-1.5 大语言模型。Grok-1.5 具有改进的推理能力和 128k 的上下文长度,其中最显著的改进之一是其在编码和数学相关任务中的表现。Grok-1.5 将在未来几天内在 平台上向早期测试人员和现有的 Grok 用户推出。在官方测试中,Grok-1.5...……更多
Kimi引爆人工智能新风口,龙头连续20CM涨停!哪些公司可
...宣布,公司旗下的kimi智能助手,已支持200万字超长无损上下文,并已开启产品内测。继昨日爆发后,kimi概念股今天(3月21日)继续上涨。其中,龙头股华策影视(300133.SZ)再次涨停,连续收获两个20CM涨停,捷成股份(300182.SZ)...……更多
顺丰科技函证LaaS元能力碰撞数字生态
...应用级和服务级元能力的标准定义。通过界定领域实体与上下文界限、排线模型抽象设计等实践,重新定义函证LaaS的元能力,为加速数字生态构建奠定了坚实基础。LaaS元能力函证领域分析函证处理上下文(排线模型)函证领域...……更多
openai推出gpt-4turbo:比上代便宜三倍
...者而言“比上代GPT-4便宜三倍”。据悉,GPT-4Turbo支持128k上下文,输入价格比GPT-4便宜了三倍,速率限制翻倍,知识库更新到2023年4月,此外还添加了JSONMode,更新了多个函数调用能力。相对此前GPT-4性能更强、价格更便宜、开发成...……更多
智谱AI发布基座大模型GLM-4,发起大模型开源基金
...开放日上,智谱AI发布新一代基座大模型GLM-4,支持128K的上下文窗口长度,单次提示词能处理的文本可达300页,文生图和多模态理解得到增强,支持处理Excel、PDF、PPT等格式的文件,可自动调用代码解释器进行复杂的方程或微积...……更多
AI赋能、短剧兴起,影视赛道 “一路生花“
...交互体验。Kimi智能助手的核心特点和功能包括:(1)长上下文处理:Kimi能够处理长达200万字的无损上下文,这意味着它可以理解和记忆大量信息,并在此基础上进行有效的交流和任务处理。(2)能力圈:Kimi的能力圈广泛,包...……更多
黄仁勋对话Transformer七作者:很多计算资源被浪费,世界需要更好的模型
...环神经网络模型,Transformer模型能够更准确地捕捉单词的上下文和含义,因而成为了像GPT-4和ChatGPT这样的大语言模型的基础,同时也被应用于非语言领域,包括OpenAI的AI代码生成训练模型Codex、文生视频模型Sora和谷歌DeepMind的蛋白...……更多
全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型
...将具备多步骤推理能力。来源:谷歌谷歌的Gemini以超长的上下文窗口而出名。在大会上,谷歌重点强调了大模型Gemini 1.5 Pro的多模态和长文本能力,为其推出一系列更新。谷歌将向全球150多个国家地区的Gemini Advanced订阅者提供最...……更多
OpenAI推出GPT商店,人人可0代码自制智能体,业界看好成为下一个苹果
...、更便宜的GPT-4——GPT-4 Turbo,做出六大升级——更长的上下文长度、更强的控制、知识升级、多模态、模型微调定制和更高的速率限制。GPT-4的付费服务将“加量不加价”。 OpenAI还宣布,ChatGPT每周用户数量已达到1亿。自3月发...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...专家架构,超10TB tokens训练,覆盖大量合成数据,推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中,用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4回答趣...……更多
国产大模型加速落地,争夺“中国版ChatGPT”心智定位
...答、对话、写作、翻译等功能,后者则可以完成处理200K上下文、多文档阅读理解,以及超长知识库构建等任务。 今年3月6日,零一万物官微宣布开源Yi-9B模型。据介绍,Yi-9B是目前Yi系列模型中代码和数学能力最强的模型,实际...……更多
OpenAI史诗级更新!最强大模型炸场,128K上下文、价格暴降2/3
...大方面更新重点值得关注和思考。1、GPT-4 Turbo:支持128k上下文,相当于300页文档,输入价格大降2/3,速率限制翻倍,知识更新到2023年4月,改进指令跟随和JSON Mode,更新多个函数调用能力。这意味着比GPT-4更强、更便宜、开发成...……更多
GTC对话黄仁勋:我眼中的GPU,和别人有很大差别
...不是基于检索的。当然,这个生成过程必须是智能的、与上下文相关的。我相信,未来人们电脑上的几乎每一个像素、每一次交互都将通过生成过程产生,我相信 Sam 也这么认为。希望通过 Blackwell 新一代架构能为生成式 AI 这个...……更多
rtxai助手的进化
...Assist项目可接收玩家的语音或文字输入内容,游戏窗口的上下文信息,并通过AI视觉模型处理数据。这些模型增强了与游戏知识数据库相连的大语言模型(LLM)的上下文感知和对特定游戏及应用的理解,然后生成定制的回复,以文...……更多
开源社区分水岭:Meta大模型Llama 3发布,参数最高或达4000亿
...ama 3已经开放了80亿(8B)和700亿(70B)两个小参数版本,上下文窗口为8k。Meta表示,通过使用更高质量的训练数据和指令微调,Llama 3比前代Llama 2有了“显著提升”。未来,Meta将推出Llama 3的更大参数版本,其将拥有超过4000亿参...……更多
对标or颠覆?Anthropic让创业者狠狠共情
...能力为优势的大模型,Claude3 Opus版本支持了 200K Tokens 的上下文窗口,并且可以处理100万Tokens 的输入。对于许多自然语言处理任务来说,例如机器翻译、摘要生成、问答系统等,长期依赖性是一个关键挑战,因为文本的含义通常...……更多
...效捕捉局部信息和短依赖信息,使模型能够更精准地掌握上下文之间的强语义关联,学习人类语言习惯范式本质,大幅提升数理逻辑、数学计算、代码生成能力。浪潮信息于2021年9月在业界率先推出了中文人工智能(AI)巨量模...……更多
OpenAI举办“AI春晚”;李开复大模型破纪录 | 图灵周报
...的Baichuan2-192K大模型之后,李开复的Yi系列模型再次刷新上下文窗口长度纪录——参数量达340亿的Yi-34B,可支持200K超长上下文窗口,可处理约40万汉字超长文本输入,是目前全球最长的上下文窗口。目前,零一万物估值超过10亿美...……更多
Kimi概念股继续暴涨!多家上市公司回应,月之暗面致歉系...
...。 此前3月18日,月之暗面宣布其AI产品Kimi,在大模型长上下文窗口技术上取得新的突破,Kimi智能助手已支持200万字超长无损上下文,并于即日起开启产品内测。据了解,月之暗面成立于2023年4月,法定代表人杨植麟毕业于清华...……更多
...报基于声波能构建可重构光计算模块对人工智能高效解释上下文语义至关重要科技日报北京4月17日电 (记者张梦然)德国马克斯·普朗克光科学研究所与美国麻省理工学院研究人员合作,通过向光子机器学习添加声波维度,成功...……更多
更多关于科技的资讯:
许晨随着数字化转型的不断推进,公共资源交易领域也在进行着一场变革。青岛通过“数字开标直播间”的推广,有效地实现了公共资源交易的数字化转型
2024-08-16 14:36:00
□苏州广电暖视频您的浏览器不支持 video 标签。第一次见面的11天后,德国TENSOR AG旋翼飞行器大中华区研发制造销售运营总部项目
2024-08-16 14:59:00
赋能船舶智能升级,助力船舶绿色远航——青岛儒海圆满交付D-Performance船舶能效监测系统
为顺应船舶“绿色化、数字化、智能化”发展趋势,提升船舶数字化管理能力,以高质量提升客户的经济效益与社会效益。近期,青岛儒海在舟山某船厂圆满完成迪拜船东所属5万吨油轮的D-Performance船舶能效监测系统的加装工程
2024-08-16 15:26:00
ESG视角下,励展为所服务的本土行业创造多元化价值
作为现代服务业的重要组成部分,贸易展会拥有汇聚人流、贸易流和信息流的特有优势,是相关行业创新与发展的助推器,也被视为“经济晴雨表”
2024-08-16 15:46:00
多彩贵州网讯(通讯员 桂辉阳 孙浩)近日,中电协发布关于2024年电力企业水处理技术创新竞选结果,由南网超高压公司天生桥局选送的《换流站直流阀冷外冷水系统运维技术提升措施研究与应
2024-08-16 12:32:00
北京现代经销商近乎赔钱卖车 销售:卖10辆车9台亏
快科技8月16日消息,受国内价格战的影响,国内不少合资品牌经销商已经出现了赔钱卖车的局面。据懂车帝报道,他们采访了一位北京现代销售
2024-08-16 12:49:00
与新能源时代背道而驰!Nilu27超跑亮相:12缸动力搭配手动挡
快科技8月16日消息,在2024美国蒙特雷汽车周上,Nilu27品牌首款超级跑车首次亮相。外观方面,该超跑以其夸张的空气动力学造型和超大进气口
2024-08-16 12:49:00
骁龙8 Gen3小尺寸平板!联想拯救者Y700跑分曝光
游戏玩家们对小尺寸高性能平板的呼声从未断过,但除了苹果iPadmini,安卓阵营似乎只剩下联想拯救者Y700系列这颗独苗
2024-08-16 12:52:00
鸿蒙NEXT再次突破:预加载技术赋能,速度获得新飞跃!
虽然国内手机厂商之间的系统发展速度非常的快,但是想脱颖而出确实很困难,原因是竞争实在是太激烈了。一方面,国产各大手机厂商几乎都在基于Android操作系统定制UI
2024-08-16 12:52:00
喜欢中端机的用户有福了,4款新机已在路上,配置参数也基本清晰
五六年前,中低端手机的使用体验真的不够优秀,甚至可以用一般来形容,消费者想取得良好的使用几乎是一件不可能的事情,无论是配置参数还是外观优化都不够优秀
2024-08-16 12:52:00
智能手机市场周报出炉:vivo重回榜首,华为小米紧随其后!
智能手机市场无疑是最具活力和竞争性的领域之一,但是市场中的竞争也是会变得非常的激烈,这也让厂商之间的发展变得很残酷。有的手机厂商一直都在疯狂的发力
2024-08-16 12:53:00
五大手机系统同台竞技:安卓VS鸿蒙,大家对谁更感兴趣?
如今的新机在配置参数方面同质化非常的严重,这也就导致手机厂商想凭借出色的硬件脱颖而出几乎是一件不可能的事情。这也导致手机厂商开始在操作系统方面发力
2024-08-16 12:53:00
AMD或将推出锐龙5 5500X3D处理器
AMD的AM4平台还要发新U?这个真有可能。来自外媒的消息。AMD或将推出锐龙55500X3D处理器,一款面向游戏玩家
2024-08-16 12:53:00
华为擎云 C5e平板:让孩子暑期学习更省心的好装备
暑假已经过去四分之三,学生开始进入暑假作业“赶工”阶段,家长也被动开启监督模式。不过这几年暑假作业的形式越来越丰富,不再局限于传统的纸质作业
2024-08-16 12:53:00