• 我的订阅
  • 科技

Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文

类别:科技 发布时间:2024-03-23 14:00:00 来源:搜狐科技
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文

出品 | 搜狐科技

作者 | 梁昌均

近日,资本市场的Kimi概念爆火,多只传媒股持续大涨,华策影视、掌阅科技、中广天择、慈文传媒等概念股因此连续拉出三个涨停。

这背后是由一款叫Kimi的大模型产品催化,其是国内大模型初创公司月之暗面发布的一款面向C端的大模型产品。

早前,该公司宣布在大模型长上下文窗口技术上取得新的突破,Kimi已支持200万字超长无损上下文,并开启产品内测,该能力在不到半年内提升9倍。

市场的火爆,导致Kimi服务器一度瘫痪,无法回复用户诉求。对此,月之暗面称已多次采取扩容等措施保证流量异常增高后的稳定,这对Kimi推理算力、成本等也构成挑战。

实际上,长文本能力已是国内外大模型追逐热点。复旦大学计算机科学技术学院教授张奇对搜狐科技表示,很多大模型仅停留在长度和简单的事实检索能力方面,在更加重要的阅读理解和推理能力方面还有待加强。

上下文从20万到200万,Kimi半年内访问量或暴增55倍

Kimi所在公司月之暗面是目前国内估值最高的大模型独角兽公司,其成立于2023年3月,目前已完成两轮总额90亿元的融资。去年6月,月之暗面获得3亿美金融资,投资方包括红杉中国、真格基金。

今年2月,该公司又获得新一轮超10亿美金融资,投资方包括红杉中国、小红书、美团、阿里等,这是国内大模型公司获得的单轮最大金额融资,最新估值达25亿美元。

月之暗面创始人杨植麟是一位本科毕业于清华、博士毕业于卡内基梅隆大学的90后,先后师从清华教授唐杰,以及苹果AI负责人、深度学习奠基人之一Ruslan Salakhutdinov,是国内大模型浪潮中典型的技术派,信仰Scaling law(规模定律)。

去年10月,月之暗面推出基于千亿参数大模型、首个面向C端的产品Kimi智能助手(Kimi Chat),当时支持20万汉字的长文本输入。不到半年,Kimi的上下文窗口的支持能力就达到200万字。

这意味着,Kimi的上下文支持能力显著提升,可以一口气读200万字,相当于近三本《红楼梦》、14本《民法典》,或上千份简历,并可以根据用户需求,通过自然语言进行信息查询和筛选,提高信息处理效率,对需要整理查阅大量资料的人来说可以说是一大神器。

搜狐科技注意到,目前Kimi在网页端、移动端、小程度等都有布局,支持TXT、PDF、Word 、PPT 和 Excel等多种类型文件、图片,以及网址输入,并能够支持多文件、多个网址,小程序则支持语音输入等。同时,Kimi也实现联网,在缺乏信息时会调用搜索引擎的网页,从而保证信息的准确性。

搜狐科技以近日OpenAI CEO山姆·奥特曼(Sam Altman)接受莱克斯·弗里德曼(Lex Friedman)采访的万字长文实测,输入文章网址,并要求整理出文章核心观点和所在原文,支持20万长度的Kimi基本能理解指令要求,并就话题和观点、原文,在不到十多秒内就进行了输出。

Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文

就此实测通义千问,其也给出9个类似的观点总结,但对指令的理解似乎有些问题,仅第一个观点附出原文,其它原文举例在放在后面,且并不完整。因此就该案例来看,通义千问整体完成度不及Kimi,在响应时间上也相对较慢。

Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文

同时,Kimi可以指迅速找出指定的内容“伊利亚和小狗在玩的内容在哪里”,并对“奥特曼怎么看”进行了理解,还算准确。通义千问并未给出原文内容,但理解也比较准确。

Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文

不少网友实测反馈,在处理大量发票并进行分类和问答时,Kimi表现出更强的操作能力,对多篇论文总结时也有显著优势,而GPT-4表现不如Kimi精准。有调用Kimi的上市公司因赛集团表示,经其内部初步评测,Kimi中文处理能力接近ChatGPT 4 Turbo。

根据月之暗面发布的实测案例,将《甄嬛传》全集几十万字的剧本传给升级后的 Kimi,然后提问剧本中有哪些细节表明甄嬛的孩子是果郡王的。Kimi能在不同时间段、各个场景的故事情节中,深入挖掘甄嬛、果郡王的情感线以及和他们孩子的真相,堪比一个看了好几十遍电视剧的“甄”学家。

Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文

此外,有拿到Kimi上下文升级到200万内测资格的业内人士测试了《诛仙》《红楼梦》等小说有关的问题,表示“强的离谱”,认为模型能力可以没那么强,但是一定要有特色、有差异化,而Kimi的200万字是产品真正的刚需。

这背后则是Kimi技术的不断升级,而月之暗面并没有采用常规的渐进式提升路线。搜狐科技此前从百川智能方面了解到,目前业内有很多提升上下文窗口长度的方式,包括滑动窗口、降采样、小模型等。

这些方式虽然能提升上下文窗口长度,但对模型性能均有不同程度的损害,换言之都是通过牺牲模型其他方面的性能来换取更长的上下文窗口。因此,如何在提高上下文支持长度的同时,保证处理能力的提升是目前业界的一大难点。

月之暗面表示,为了达到更好的长窗口无损压缩性能,技术研发团队从模型预训练到对齐、推理环节均进行了原生的重新设计和开发,不走滑动窗口、降采样等技术捷径,攻克了很多底层技术难点。

此外,月之暗面提到,为提高无损上下文能力,还在指令遵循上进行了优化,让模型在多轮对话中能够始终遵循用户的指令,理解用户的需求,并可以遵循复杂指令。从用户反馈来看,Kimi的多轮交互和超长指令遵循能力也是一项核心优势。

这也让Kimi在上市后吸引了大量用户关注。据SimilarWeb数据,从去年10月到今年2月,Kimi访问量从16万增长到292万,仅次于文心一言和阿里通义,而从3月1日至3月18日的日均访问量超24万。同时,Kimi APP端下载量也快速提升,从2月初的效率类应用免费榜119名提升至3月20日的第10名,仅次于豆包与文心一言。

据非凡产研预测,Kimi在今年3月的访问量将介于750万到900万之间,意味着Kimi访问量在半年内有望暴增达55倍。

Kimi的爆火,也让其服务器一度奔溃。月之暗面在3月21日晚间表示,自3月20日9:30开始,观测到Kimi的系统流量持续异常增高,远超对资源的预期规划,导致有较多的SaaS客户遇到登陆异常问题,部分用户还遇到“Kimi忙不过来了”、“Kimi有点累了”等回复。

该公司表示,已经采取多项应急措施,包括已经进行5次扩容工作,保证推理资源会持续配合流量进行扩容,以尽量承载持续增长的用户量,同时设计一套更有效的SaaS流量优先级策略,以保障付费用户的调用稳定,预计3月25日前完成上线。

公开信息显示,Kimi的算力支持主要来自字节火山引擎,以英伟达为主,预训练需要1万多张卡。随着用户大量涌入,Kimi也需要更多推理算力支撑,这也意味着更高的成本投入。目前,Kimi网页端、移动端和小程序端都可正常使用。

国内外大模型都在卷长文本,但只卷数值没有意义

实际上,过去一段时间,国内外大模型都在卷超长文本的上下文窗口能力。

复旦大学计算机科学技术学院教授张奇对搜狐科技表示,大模型受限于输入长度,其在处理超长文本时面临挑战,难以进行更好完成生成和推理任务。因此,多家大模型公司都在拓展大模型的上下文长度。

去年10月,百川智能推出上下文窗口长度为192K的Baichuan2-192K,相当于35万个汉字,是当时全球最长的上下文窗口。阿里通义千问不久前推出免费的文档解析功能,针对单个文档能够处理超万页的极长资料,换算成中文篇幅约1000万字,同时支持100份不同格式的资料,还可解析在线网页。

GPT-3.5通过三次升级将上下文从4000token扩展到1.6万token,GPT-4达到32K,而GPT-4Turbo进一步提升到128K token,相当于10万汉字能力。有报道称,今年发布的GPT-4.5 Turbo的上下文窗口被设定为25.6万token,相当于约20万汉字的处理能力。

Anthropic最新推出的Claude 3的上下文从100K升级到200K token,相当于能够单次处理约16万汉字,并在测试该能力的大海捞针实验中实现对GPT-4的超越。开源模型LLaMA则从2K、4K持续升级到32K、256Ktoken。

在杨植麟看来,无损的长上下文将是AGI一个很关键的基础技术,是AGI登月工程的第一步。“上下文长度可能存在摩尔定律,但需要同时优化长度和无损压缩水平两个指标,才是有意义的规模化。”

张奇认为,AGI最核心的就是要具备语言知识、推理学习的能力。“千亿模型可能记住10万本书,万亿模型可能记住100万本书,但如果不能构建出来推理能力,那就是一个知识的压缩器和检索器,就不可能实现AGI。”

“但长文本其实很难做,它不仅要能检索出基本事实的知识,更重要的是还要能做阅读理解,做归纳总结,但现在很多大模型这种能力大幅度下降。”张奇认为,光看长度没什么意义,很多模型的长度就是纯属宣传性。

杨植麟此前也在接受采访时表示,在以Scaling law(规模定律)为第一性原理的情况下,不能只提升窗口,不能只看数字,要看它在这个窗口下能实现的推理能力、对原始信息忠实度的能力,以及遵循指令的能力,不应该只追求单一指标,而是结合指标和能力。

目前,业内对大模型长文本的能力都基本采用国外开发者Greg Kamradt设计的测评方法“Needle in A HayStack”,即“大海捞针”。

张奇对此表示,传统的“大海捞针”评测有一个很大的问题是就是,针和海如何配置非常关键,如果选一些特殊的针和海,那结果可能就会很高,因此需要相对科学的评测方法,且要将重点从简单的事实检索转移到更具挑战性的阅读理解任务。

目前,Kimi是国内少数不刷榜单的大模型“清流”。杨植麟表示,很多榜存在问题,刷榜意义很小,最好的榜就是用户,应该让用户投票。

不过,Kimi还能火爆多久面临不确定性,且有观点认为其技术门槛并不是特别高,随着多个大模型都纷纷发力,其也会面临越来越激烈的竞争。对于主攻C端的月之暗面来说,则需要更多投入,保持技术的领先和用户的增长,从而构建起商业化的能力。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-03-23 14:45:05

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

五大模型解高考数学:阿里通义千问、360智脑10题全错得0分;讯飞星火答对一半
...技选取了高考试卷前10道填空题,让百度文心一言、阿里通义千问、科大讯飞星火认知大模型、360智脑、ChatGPT进行回答。测试结果显示,这五款大模型在答数学题的能力上差异显著
2023-06-08 21:00:00
AI大模型也高考?成绩单出来了,星火综合第一
...智谱清言、字节豆包与讯飞星火则并列第三。Kimi、阿里通义、百川、海螺排名相对靠后。而在潇湘晨报的“AI写作”评测中,讯飞星火不仅平均分位居首位,且获得了全场最高分56分。潇
2024-06-12 09:29:00
阿里云推新 “杠”上讯飞
...企业供图“这不降维battle讯飞吗?”昨日,在朋友圈一张通义听悟的专属口令福利海报下,一位媒体工作者留言道。彼时在粤港湾大湾区的广州,阿里云CTO周靖人对通义听悟给出了如下
2023-06-02 17:45:00
阿里云AI绘画创作大模型来了!我们测了测“通义万相”的神通
本文转自:浙江日报潮新闻 记者 祝梅“通义千问”不能文生图?这可能是它“兄弟”的技能。7月7日,在上海召开的2023世界人工智能大会上
2023-07-07 19:00:00
字节、阿里云大降价之后,百度:两款主力大模型全面免费
...04元/千token,输出0.008元/千token。21日当天,阿里云也宣布通义千问GPT-4级主力模型Qwen-Long
2024-05-21 17:30:00
阿里万相视频生成大模型重磅开源!消费级显卡也能运行
...配”。进入2月,字节豆包、昆仑万维、百度文心、阿里通义千问等纷纷推出自家的开源模型,加入这场开源热潮。【本文结束】如需转载请务必注明出处:快科技责任编辑:拾柒文章内容举报
2025-02-26 00:34:00
我国首个大模型标准化专题组组长出炉,百度、华为、阿里联合担任
...。阿里云也在7月7日的2023世界人工智能大会上宣布了推出通义大模型家族新成员“通义万相”的消息,瞄准文字生成图像赛道。此前,阿里云在今年4月发布了AI大模型通义千问,并宣布
2023-07-09 00:31:00
...的羊毛,还能薅多久? 针对是否收费,北京商报记者在通义千问、讯飞星火、腾讯混元助手这类to C开放的生成式AI产品上分别提问,均得到了否定问答。通义千问回答:“作为一个AI
2023-11-02 00:18:00
福昕高调接入ChatGPT,技术革命还是虚张声势?
...等企业都宣布将会在旗下的应用生态中部署AI,从ChatGPT到通义千问再到文心一言,国内外的AI模型都已经做好了准备,即将进军办公市场。办公应用市场,似乎已经注定走向AI与应
2023-04-17 01:00:00
更多关于科技的资讯:
锦江国际集团启动马年春节多元促消费活动,激发假日市场新活力
马年春节临近,锦江国际集团依托“吃、住、行、游”全产业链优势,为海内外宾客准备了丰富的年娱、年味项目,陪伴大家一起过个精彩中国年
2026-02-10 17:24:00
潮新闻讯 目光所及,即是世界。此刻,我们站在迈向高水平科技自立自强的时代关口。“科技创新和产业创新深度融合”“概念验证”“中试平台”“职务科技成果赋权”“资产单列管理”“技术经理人”等成为了中国科技成果转化行业的热词
2026-02-10 18:06:00
中国消费者报北京讯(记者吴博峰)记者近日从江苏省储能行业协会获悉,即将于今年5月举办的CESC2026第四届储能大会主论坛将汇聚行业各方人士
2026-02-10 18:33:00
中国消费者报报道(记者何永鹏)近日,由市场监管总局发展研究中心、中国社会科学院财经战略研究院课题组联合完成的《2025直播电商行业发展白皮书》(以下简称《白皮书》)正式发布
2026-02-10 19:03:00
2025年池州市累计完成以旧换新交易11.24万笔 带动社会消费22.6亿元
大皖新闻讯 记者从2月9日召开的池州市提质增效实施消费品以旧换新政策新闻发布会上获悉,2025年,池州市累计完成消费品以旧换新交易11
2026-02-10 18:14:00
记者今天(2月10日)了解到,市场监管总局(国家标准委)批准发布一批重要国家标准。在新兴领域方面,发布脑机接口、数字孪生等5项国家标准
2026-02-10 14:15:00
滨州移动科技赋能年货盛会 铸就网络保障新典范
鲁网2月10日讯2026年2月6日至8日,“购在中国·2026滨州迎新春消费季暨乐购滨州年货大集”在滨州市全民健康文化中心体育场南广场盛大举办
2026-02-10 15:09:00
西北工业大学科研团队在脑机接口关键领域取得新突破
想象一下,当瘫痪者用意念操控机械臂,稳稳端起水杯;当失语者的思维被直接“翻译”成流畅语音;当帕金森患者的颤抖经神经调控逐渐平息……这些曾出现在科幻电影里的场景
2026-02-10 16:06:00
创新潮涌!温州乐清科技创新指数连续八年领跑全省
日前,位于温州乐清北白象镇中方智能园区的温州合力自动化仪表有限公司,成功研发出AI智能物联直行程电动执行器。作为流体控制领域的领军企业
2026-02-10 16:20:00
诺特兰德公益创新获认可,一举摘得公益节三项荣誉
鲁网2月10日讯1月22日至23日,第十五届公益节暨2025ESG影响力年会在北京举行。全球膳食营养品牌诺特兰德凭借其在公益领域的持续深耕与创新实践
2026-02-10 16:22:00
中国消费者报重庆讯(记者刘文新)2月6日,重庆举行低空经济重大成果发布会,发布《重庆市低空装备产业链产品名录》(2025版)
2026-02-10 16:03:00
中交一航局二公司检测中心研发一款基于若依结构的档案管理系统
鲁网2月10日讯近日,中交一航局二公司检测中心研发一款基于若依结构的档案管理系统,该系统依托若依架构精准破解行业痛点,集成RBAC权限管控
2026-02-10 15:09:00
量子技术赋能电网 安徽筑牢民生用电安全线
大皖新闻讯 今年1月,国内首个量子智慧台区在马鞍山市当涂县乌溪镇七房村正式投运。这是我国首次将量子技术与柔性互联技术规模化应用于乡村电网
2026-02-10 11:19:00
荣事达空气炸锅:温度旋钮仅为装饰 官网竟跳赌博网站
鲁网2月9日讯近日,鲁网记者收到网友关于荣事达空气炸锅的投诉。记者在抖音等社交平台看到,有关“荣事达空气炸锅调节温度的旋钮是假的”的消息在网上引发热议
2026-02-10 08:11:00
河北新闻网讯(吴萌、王冠喜)近日,在开滦集团钱家营矿业公司(简称“开滦钱矿公司”)1351工作面,一线工作20多年的老班长刘金华谈起新采用的单元支架时感触颇深
2026-02-10 09:41:00