• 我的订阅
  • 头条热搜
infini-attention:谷歌大内存机制
谷歌大改Transformer,“无限”长度上下文来了。现在,1B大模型上下文长度可扩展到1M(100万token,大约相当于10部小说),并能完成Passkey检索任务。8B大模型在500K上下文长度的书籍摘要任务中,拿下最新SOTA。这就是谷歌最新提...……更多
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...款面向C端的大模型产品。早前,该公司宣布在大模型长上下文窗口技术上取得新的突破,Kimi已支持200万字超长无损上下文,并开启产品内测,该能力在不到半年内提升9倍。市场的火爆,导致Kimi服务器一度瘫痪,无法回复用户...……更多
10分钟速成专家,「Kimi智能助手」正式支持200万上下文,对话窗口提升10倍 | 最前线
...正式宣布,旗下的Kimi智能助手,已支持200万字超长无损上下文,并于即日起开启产品内测。Kimi智能助手是月之暗面(Moonshot AI)基于自研千亿参数大模型打造的对话式 AI 助手产品,在2023年10月正式发布。而月之暗面也是国内大...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...内的大模型而言,只有Minimax采用了MoE架构。二、扩容的上下文窗口意味着什么?虽然Gemini 1.5 Pro是 Gemini 1.5 系列的初代版本,但初代便表现不俗。扩大上下文窗口后的高水平性能是Gemini 1.5 Pro的一大亮点。多模态大模型卷到今日...……更多
Kimi爆火出圈,国产大模型首次超越海外!
2024年3月18日,国产AI大模型Kimi将上下文无损输入长度提升至200万字,成为国内大模型首次在部分能力上超越海外主流产品的里程碑。上下文输入长度的增加能够帮助模型更好学习文本知识,从而更有针对性得与用户互动。在长...……更多
零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源
...代码能力和数学能力专项的继续训练模型。全球最长200K上下文窗口Yi-34B模型将发布全球最长、可支持200K超上下文窗口(contextwindow)版本,可以处理约40万汉字超文本输入。上下文窗口是大模型综合运算能力的金指标之一,对于理...……更多
《红楼梦》里有大量东北方言?实测AI大模型“长文阅读”
...,国内通用人工智能“初创明星”月之暗面宣布在大模型上下文窗口技术上取得新突破,旗下的Kimi智能助手可支持200万字超长无损上下文,并开启产品内测,随即引发市场关注和热议,并一度因过于火爆“宕机”。随后,阿里...……更多
王小川公布最新大模型,号称全球最长上下文,是GPT-4的14倍|钛媒体焦点
...模型公司“百川智能”宣布,推出Baichuan2-192K大模型,其上下文窗口长度高达192K,能够处理约35万个汉字。百川智能称,Baichuan2-192K是目前全球最长的上下文窗口,也是目前支持长上下文窗口最优秀大模型Claude2(支持100K上下文窗...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
大模型的上下文长度快速增长,超长上下文解锁新应用,但推理计算代价高昂,上下文本身对于信息不会进行压缩,不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年,人工智能领域风起...……更多
本周AI不得了!OpenAI的Sora“模拟世界”、Gemini 1.5“10M上下文”、Mistral的开源新贵同日出现
...质量令人着迷。总结:谷歌可能找到了某种新方法,将长上下文的架构理念与他们的 TPU 计算堆栈相结合,并取得了很好的效果。据 Gemini 长语境的负责人之一Pranav Shyam说,这个想法几个月前才刚刚萌芽。如果以小版本(v1.5)而...……更多
马斯克 xAI 推出 Grok-1.5 大语言模型
...Grok-1.5 大语言模型。Grok-1.5 具有改进的推理能力和 128k 的上下文长度,其中最显著的改进之一是其在编码和数学相关任务中的表现。Grok-1.5 将在未来几天内在 平台上向早期测试人员和现有的 Grok 用户推出。在官方测试中,Grok-1.5...……更多
Kimi引爆人工智能新风口,龙头连续20CM涨停!哪些公司可
...宣布,公司旗下的kimi智能助手,已支持200万字超长无损上下文,并已开启产品内测。继昨日爆发后,kimi概念股今天(3月21日)继续上涨。其中,龙头股华策影视(300133.SZ)再次涨停,连续收获两个20CM涨停,捷成股份(300182.SZ)...……更多
顺丰科技函证LaaS元能力碰撞数字生态
...应用级和服务级元能力的标准定义。通过界定领域实体与上下文界限、排线模型抽象设计等实践,重新定义函证LaaS的元能力,为加速数字生态构建奠定了坚实基础。LaaS元能力函证领域分析函证处理上下文(排线模型)函证领域...……更多
openai推出gpt-4turbo:比上代便宜三倍
...者而言“比上代GPT-4便宜三倍”。据悉,GPT-4Turbo支持128k上下文,输入价格比GPT-4便宜了三倍,速率限制翻倍,知识库更新到2023年4月,此外还添加了JSONMode,更新了多个函数调用能力。相对此前GPT-4性能更强、价格更便宜、开发成...……更多
智谱AI发布基座大模型GLM-4,发起大模型开源基金
...开放日上,智谱AI发布新一代基座大模型GLM-4,支持128K的上下文窗口长度,单次提示词能处理的文本可达300页,文生图和多模态理解得到增强,支持处理Excel、PDF、PPT等格式的文件,可自动调用代码解释器进行复杂的方程或微积...……更多
AI赋能、短剧兴起,影视赛道 “一路生花“
...交互体验。Kimi智能助手的核心特点和功能包括:(1)长上下文处理:Kimi能够处理长达200万字的无损上下文,这意味着它可以理解和记忆大量信息,并在此基础上进行有效的交流和任务处理。(2)能力圈:Kimi的能力圈广泛,包...……更多
黄仁勋对话Transformer七作者:很多计算资源被浪费,世界需要更好的模型
...环神经网络模型,Transformer模型能够更准确地捕捉单词的上下文和含义,因而成为了像GPT-4和ChatGPT这样的大语言模型的基础,同时也被应用于非语言领域,包括OpenAI的AI代码生成训练模型Codex、文生视频模型Sora和谷歌DeepMind的蛋白...……更多
全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型
...将具备多步骤推理能力。来源:谷歌谷歌的Gemini以超长的上下文窗口而出名。在大会上,谷歌重点强调了大模型Gemini 1.5 Pro的多模态和长文本能力,为其推出一系列更新。谷歌将向全球150多个国家地区的Gemini Advanced订阅者提供最...……更多
OpenAI推出GPT商店,人人可0代码自制智能体,业界看好成为下一个苹果
...、更便宜的GPT-4——GPT-4 Turbo,做出六大升级——更长的上下文长度、更强的控制、知识升级、多模态、模型微调定制和更高的速率限制。GPT-4的付费服务将“加量不加价”。 OpenAI还宣布,ChatGPT每周用户数量已达到1亿。自3月发...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...专家架构,超10TB tokens训练,覆盖大量合成数据,推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中,用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4回答趣...……更多
GTC对话黄仁勋:我眼中的GPU,和别人有很大差别
...不是基于检索的。当然,这个生成过程必须是智能的、与上下文相关的。我相信,未来人们电脑上的几乎每一个像素、每一次交互都将通过生成过程产生,我相信 Sam 也这么认为。希望通过 Blackwell 新一代架构能为生成式 AI 这个...……更多
国产大模型加速落地,争夺“中国版ChatGPT”心智定位
...答、对话、写作、翻译等功能,后者则可以完成处理200K上下文、多文档阅读理解,以及超长知识库构建等任务。 今年3月6日,零一万物官微宣布开源Yi-9B模型。据介绍,Yi-9B是目前Yi系列模型中代码和数学能力最强的模型,实际...……更多
OpenAI史诗级更新!最强大模型炸场,128K上下文、价格暴降2/3
...大方面更新重点值得关注和思考。1、GPT-4 Turbo:支持128k上下文,相当于300页文档,输入价格大降2/3,速率限制翻倍,知识更新到2023年4月,改进指令跟随和JSON Mode,更新多个函数调用能力。这意味着比GPT-4更强、更便宜、开发成...……更多
开源社区分水岭:Meta大模型Llama 3发布,参数最高或达4000亿
...ama 3已经开放了80亿(8B)和700亿(70B)两个小参数版本,上下文窗口为8k。Meta表示,通过使用更高质量的训练数据和指令微调,Llama 3比前代Llama 2有了“显著提升”。未来,Meta将推出Llama 3的更大参数版本,其将拥有超过4000亿参...……更多
对标or颠覆?Anthropic让创业者狠狠共情
...能力为优势的大模型,Claude3 Opus版本支持了 200K Tokens 的上下文窗口,并且可以处理100万Tokens 的输入。对于许多自然语言处理任务来说,例如机器翻译、摘要生成、问答系统等,长期依赖性是一个关键挑战,因为文本的含义通常...……更多
...效捕捉局部信息和短依赖信息,使模型能够更精准地掌握上下文之间的强语义关联,学习人类语言习惯范式本质,大幅提升数理逻辑、数学计算、代码生成能力。浪潮信息于2021年9月在业界率先推出了中文人工智能(AI)巨量模...……更多
OpenAI举办“AI春晚”;李开复大模型破纪录 | 图灵周报
...的Baichuan2-192K大模型之后,李开复的Yi系列模型再次刷新上下文窗口长度纪录——参数量达340亿的Yi-34B,可支持200K超长上下文窗口,可处理约40万汉字超长文本输入,是目前全球最长的上下文窗口。目前,零一万物估值超过10亿美...……更多
Kimi概念股继续暴涨!多家上市公司回应,月之暗面致歉系...
...。 此前3月18日,月之暗面宣布其AI产品Kimi,在大模型长上下文窗口技术上取得新的突破,Kimi智能助手已支持200万字超长无损上下文,并于即日起开启产品内测。据了解,月之暗面成立于2023年4月,法定代表人杨植麟毕业于清华...……更多
...报基于声波能构建可重构光计算模块对人工智能高效解释上下文语义至关重要科技日报北京4月17日电 (记者张梦然)德国马克斯·普朗克光科学研究所与美国麻省理工学院研究人员合作,通过向光子机器学习添加声波维度,成功...……更多
Sora“超级涌现力”将把AI引向何方
...的最小单元进行有意义的关联组合。比如,在保持连贯的上下文语境中,对若干个单词进行有意义组合,从而连缀成一个会意句子;在保持合理的空间布局下,对众多图像小块进行有意义组合,拼合为一幅精彩图像;在保持一致...……更多
更多关于科技的资讯:
国产超大规模智算平台“飞星二号”将在今年交付使用首批算力
大皖新闻讯 1月25日,科大讯飞董事长刘庆峰在公司年会现场透露了“飞星二号”的最新进展,表示该平台的首批算力将在2025年交付使用
2025-01-25 22:56:00
李楠点评iPhone 17系列:除了薄没什么意思
快科技1月25日消息,李楠发微博表示,iPhone 17系列不是unibody(一体成型),除了薄没什么意思。此前有博主爆料
2025-01-25 23:05:00
北京佛爷顶开始飘雪花了:今天夜间和明天有降雪
1月25日消息,据气象部门消息,1月25日20时20分降雪开始影响北京西部山区,延庆佛爷顶开始下雪了,近一小时降雪量不足1毫米
2025-01-25 23:05:00
余承东展示科幻一幕:智界新S7自己开过来接他
快科技1月25日消息,今天华为余承东展示了鸿蒙智行强大的智能驾驶功能之一——泊车代驾。视频中,余承东在手机APP上打开这一功能
2025-01-25 19:35:00
三星S25 Ultra在3DMark测试中击败iPhone 16 Pro Max:领先幅度达36%
快科技1月25日消息,三星Galaxy S25 Ultra在3DMark的Steel Nomad Light基准测试中以36%的领先优势击败了苹果iPhone 16 Pro Max
2025-01-25 19:35:00
首发自研芯片 谷歌Pixel 11系列曝光:4剑齐发
快科技1月25日消息,据报道,谷歌将在2026年下半年推出4款Pixel 11系列机型,包含Pixel 11、Pixel 11 Pro
2025-01-25 20:05:00
超百家企业参加新年浙江首批拓市场增订单团组 “千团万企”收获了什么
拓市场,增订单,新年首个工作日,浙江外贸已“开跑”。1月2日下午,浙江省2025年“千团万企拓市场增订单”行动正式启动
2025-01-25 20:17:00
小屏之王!三星Galaxy S25预售:尝鲜价6499元
快科技1月25日消息,三星将在2月11日发布Galaxy S25系列国行版,这次三星同时推出了Galaxy S25、Galaxy S25+和Galaxy S25 Ultra三款机型
2025-01-25 20:35:00
看好自己的物品!南京南站4天捡到1000个身份证
1月25日消息,据媒体报道,南京南站的遗失物品招领处引发关注。据了解,南京南站专门开辟了一个位置用于存放旅客遗失的物品
2025-01-25 20:35:00
零售商员工公然变黄牛!2倍价格倒卖RTX 5090
快科技1月25日消息,RTX 5090/5090D已经性能解禁,很快就会上市,这次供货之紧张绝对前所未有,比如英国顶级零售商OCUK就透露
2025-01-25 20:35:00
春节机票跳水!多条航线大降价:部分跌至百元
快科技1月25日消息,据报道,春节前夕,多条航线降价,部分航线低至百元。去哪儿数据显示,如天津-上海裸票价格最低145元
2025-01-25 20:35:00
最新爆料:苹果调动善战老将整顿AI业务 期盼能打翻身仗
知名科技爆料人马克·古尔曼周五表示,面对AI项目的现状,苹果公司决定先从人事问题下手。知情人士透露,擅长整顿“问题产品”和推动重大项目上市的项目管理副总裁金·沃拉斯(Kim Vorrath)
2025-01-25 21:05:00
中国台湾台南市再发5.1级地震:福建多地有震感 之前致台积电6万块晶圆报废
据中国地震台网正式测定,1月25日19时49分,在台湾台南市(北纬23.31度,东经120.46度)发生5.1级地震,震源深度11千米
2025-01-25 21:05:00
73岁喜当爹!张纪中哄四胎女儿睡觉引围观:网友直呼老当益壮
1月25日消息,近日,杜星霖在网上分享了张纪中哄娃睡觉的视频,引起了不少网友的讨论。张纪中在美国家中哄四胎女儿睡觉,尽管他已73岁
2025-01-25 21:05:00
男子学狗语驯狗:一开口就被咬穿脸
1月25日消息,据媒体报道,胡先生学习说狗语,跟家里的宠物犬交流,没想到刚一开口就被狗咬了。据了解,胡先生家的宠物狗是一条阿拉斯加犬
2025-01-25 21:35:00