• 我的订阅
  • 社会

《红楼梦》里有大量东北方言?实测AI大模型“长文阅读”

类别:社会 发布时间:2024-03-28 10:06:00 来源:金羊网

“想象一下,你正踏上一片遥远的沙漠星球,那里的沙丘像金色的海浪一样延绵不绝,而一场关于权力、背叛和复仇的史诗故事正缓缓展开。”这并非来自影评人的遐想,而是当下国内一家热门AI初创公司智能机器人的“阅读总结”。

3月18日,国内通用人工智能“初创明星”月之暗面宣布在大模型上下文窗口技术上取得新突破,旗下的Kimi智能助手可支持200万字超长无损上下文,并开启产品内测,随即引发市场关注和热议,并一度因过于火爆“宕机”。随后,阿里、百度、360也宣布将发力长文本。

2024年被视为人工智能应用的元年。被厂商“内卷”的长文本究竟是什么?为何突受关注?普通人可以用长文本做什么?效果如何?记者进行了实测。

好比“内存”

长文本其实并不稀奇

200万字是什么概念?一本《红楼梦》大约70多万字,《沙丘》系列六部曲加一起也不过115万字。当大模型具有200万文字的长文本技术,也意味着在一个窗口,智能机器“一口气读完”百万文字级的“大部头”只在瞬间,并能和其他人“侃侃而谈”。

《红楼梦》里有大量东北方言?实测AI大模型“长文阅读”

简单来说,如果把大模型比作操作系统,那么上下文长窗口就像操作系统中的内存。内存越大,应用开发就越简单。

今年2月,谷歌发布的Gemini 1.5Pro模型曾一度创下最长上下文窗口的纪录。

根据官方数据,谷歌Gemini1.5 Pro将上下文窗口容量提到了100万token(极限为1000万token)。这意味着机器可以一下子处理22小时的录音、超过十倍的完整的1440页的《战争与和平》以及四万多行代码、三小时的视频。

如果简单换算,100万token大约等于80万个汉字。这意味着月之暗面的上下文窗口容量是谷歌Gemini 1.5Pro模型的2.5倍。也或许可以理解,为何“Kimi概念”在国内为何突然火了一把。

3月22日,阿里通义千问宣布向所有人免费开放1000万字的长文档处理功能,号称是全球文档处理容量第一的AI应用。

1000万文字又是怎样的概念?《资治通鉴》为300多万字,一套《二十四史》大约超2000多万字,意味着机器最多只需“读”两次,就能看完。

《红楼梦》里有大量东北方言?实测AI大模型“长文阅读”

“要通往通用人工智能,无损的长上下文将会是一个很关键的基础技术。”月之暗面创始人、毕业于清华大学的明星级算法专家杨植麟对外表示,历史上所有的模型架构演进,本质上都是在提升有效的、无损的上下文长度。上下文长度可能存在摩尔定律,但需要同时优化长度和无损压缩水平两个指标,才是有意义的规模化。

也有投资人表示,长文本在技术圈实际上并不稀奇,但此前各家大厂没有“开卷”的主要原因是对算力消耗极大,成本比较高。

是否好用?

比较便捷但也张冠李戴

对于普通人的生活来说,“消费”千万级、百万级的长文本似乎并不多,那AI长文本能干什么?

记者实测了下,从易用性上来说,作为有“超长记忆”的AI助手,Kimi可直接用中文,还能上传doc、pdf、excel文件,甚至从微信聊天记录中选取文件,上手很方便。

比如,给它一个网址链接,它就可以用剧本中的人物角色,跟你聊天;把打车的交通发票扫描进文档,Kimi可以“整理”出报销表格;把录音文件整理成会议记录。

当长文本能力从20万字到200万字,也意味着AI应用“定制化”更前进了一步。长文本越长,意味着智能机器对相关背景就越熟悉。

按照月之暗面的介绍,像建筑工程的标书,可以一次性把前面的标书给Kimi,再设定好要求范围,就可能写出新的标书草稿;甚至长文本足够长,可将现有的文学作品续写。

不过,AI大模型作为“阅读神器”真的是万能吗?靠谱吗?

记者选择了包括Kimi和其他两家互联网大厂的大模型进行了“阅读题”评测,题目是《红楼梦》中对东北有哪些描述?

大模型A的答案之一是方言使用,A模型称《红楼梦》中运用了大量的东北方言,“这些方言语汇的使用,构成了《红楼梦》语言的一个独特特色,使得小说的对话更加生动传神。”

大模型B的答案更“惊人”:“东北人在《红楼梦》中通常被描绘为豪爽、直率、热情、重义气等特点。例如,贾宝玉的奶妈李嬷嬷、王熙凤的母亲刘姥姥等人都具有这些特点。”

至于大模型C则直接理解错误,介绍东北作为方位词的意思。

《红楼梦》里有大量东北方言?实测AI大模型“长文阅读”

除了文学上的貌似正经,却啼笑皆非的回答,大模型比拼“长”的能力后,在法律条文的解读上,也容易张冠李戴、模棱两可。

正如有参与测评的网友所言,“大模型最大的优势是对上下文的总结能力相当好,可以快速的帮助理解文章的重点,而其短板是,当我们需要快速定位文章的具体信息时,就无法满足需求了,依旧是总结,而不是给出确切的信息。”

实际上,近期备受关注的月之暗面在本月刚度过了一周岁的生日。这家明星AI公司成立于2023年3月,名字源于著名摇滚乐队平克·弗洛伊德的同名音乐专辑,时间刚好是“封神之作”发布50周年。

虽然成立仅1年,月之暗面已完成了至少三笔融资,投资方包括阿里、红杉中国、真格基金、小红书、美团等。公司估值从一年前的3亿美元飙升至现在的25亿美元,成为大模型领域的头部玩家之一。

值得一提的是,一个月前,月之暗面完成了最新一轮超10亿美元的融资,这是继ChatGPT掀起AI浪潮后,国内AI领域公司获得的单轮最大金额融资。有消息称,阿里巴巴在此次融资中领投,使这家年轻公司的估值在短短一年内增长了七倍。然而,阿里巴巴和月之暗面均未对此作出回应。

目前,各家大模型的在长文本的应用“钱”景包括金融、法律、科研、医疗、教育等领域,用于快速读研报、分析财报、读科研论文、医疗报告、解读法律条文、分析考试成绩等。这一切,都以长文本是否更智能、更准确为前提。未来“钱”景如何,仍有待市场检验。

文|记者 王丹阳

图|腾讯混元大模型

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-03-28 12:45:11

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...持能力显著提升,可以一口气读200万字,相当于近三本《红楼梦》、14本《民法典》,或上千份简历,并可以根据用户需求,通过自然语言进行信息查询和筛选,提高信息处理效率,对需要整
2024-03-23 14:00:00
枪战版《甄嬛传》?武打片《红楼梦》?AI“魔改”视频,逐渐有人管了
...“枪战片”的AI版《甄嬛传》,频频出现武打画面的AI《红楼梦》等。《管理提示》认为,这些视频为博流量,毫无边界亵渎经典IP,冲击传统文化认知,与原著精神内核相悖,且涉嫌构成侵
2024-12-11 21:02:00
暑期档尾声吐槽不断?沈腾逆鳞不走喜剧路线,红楼梦被黑排片低
...在《逆鳞》中展现出不一样的魅力!再说说风波不断的《红楼梦》。近日,导演胡玫转发了一篇支持电影《红楼梦之金玉良缘》的长文,文中提到了一些让人深思的问题。首映礼上,红学大神鼓掌称
2024-08-22 14:35:00
聊聊《红楼梦》与大运河的文化渊源
...雪芹也将清帝南巡所经过的城市、所发生的故事编织进《红楼梦》。“扬州旧梦久已觉”,大运河作为中国古代最重要的水运通道之一,连接着南北方的经济和文化交流,将曹雪芹、《红楼梦》、曹
2023-07-08 21:18:00
智谱AI再卷价格战:最低1毛线可买近200万tokens,相当于两本《红楼梦》文字量
...意味着,最低仅用1毛钱可买近200万tokens,相当于两本《红楼梦》的文字量。GLM-4-Flash 将支持超过128K(千字符)的文本输入
2024-06-05 16:34:00
蒋梦婕发文控诉被偷拍,视频浏览量过百万
...,认为数量庞大追责困难。蒋梦婕2010年凭借李少红版《红楼梦》出道,她在剧中饰演女主角林黛玉,当年这部戏的选角竞争非常激烈,就算是赵丽颖、杨幂等人,当时也只演了一些配角,而蒋
2023-04-20 11:10:00
一毛钱写两本红楼梦,智谱AI再降价,已服务30万企业用户
...钱/100万token。这意味着不到一毛钱就可以把四大名著如《红楼梦》写两遍。而在企业V3版的价格下,用CogView-3文生图模型生成一张图只要6分钱
2024-06-07 09:25:00
《红楼梦之金玉良缘》面临2亿巨亏,电影的惨败,22年前就已注定
《红楼梦之金玉良缘》可以说是这个暑期档最惨的电影,没有之一。截至发稿,电影上映5天,排片占比已跌至1%,上映5天票房才441万,平台给出的总票房预测,只有619万。这种收获和投入
2024-09-11 18:30:00
...新领域,让传统文化焕发出勃勃生机。和“曹先生”聊《红楼梦》,传统文化妙趣横生《红楼梦》中有什么美食?《红楼梦》中有哪些判词?如果你是宝玉,最终会选择黛玉还是宝钗呢?这些问题,
2025-06-06 08:19:00
更多关于社会的资讯:
阜南一男子捐献造血干细胞救子 当地志愿者献爱心
大皖新闻讯 11月23日,阜南县文明城市创建中心主任郑露带领10多名县心连心公益协会的志愿者,来到南关社区李刚家,送来了牛奶
2025-11-24 21:27:00
“小伙抽中3000元显卡要上交”事件被指与知名游戏公司有关联 公司回应:不实
大皖新闻讯 连日来,“小伙抽中3000元显卡要上交”事件在网上持续引发热议,并关联到了知名游戏公司——紫龙游戏。对此,紫龙游戏上海研发中心发布澄清公告称
2025-11-24 19:41:00
全椒这个三千余人的小村,90岁以上老人有一百多位
大皖新闻讯 年近80岁的李致兰说自己很幸福,都这个岁数了,不仅有“妈”叫,而且还被106岁老娘“管”着,不允许她出门太久在外“贪玩”
2025-11-24 18:33:00
热心大哥,你在哪里?合肥一老人雨夜摔倒获助,家人盼当面道谢
大皖新闻讯 11月7日傍晚,合肥长临河68岁的聂师傅在前往公交站准备乘车上夜班时不慎摔倒,无法起身,幸得一位热心大哥与恰好路过的妻子一同伸出援手
2025-11-24 19:06:00
弱骨藏坚志 廿载赴初心
在城郊的晨曦中,有那么一道瘦弱却坚定的身影,二十年来从未缺席。她就是舒春茶,她身形纤薄,言语温和,并非传统印象中雷厉风行的管理者形象
2025-11-24 18:32:00
实力再获认可!华润双鹤羚黄氨咖敏片、枣仁安神颗粒双双荣膺“家庭常备药奖”
近日,医药健康领域权威评选——“中国家庭常备药上榜品牌”活动结果正式揭晓。在此次评选中,华润双鹤旗下两大明星产品——羚黄氨咖敏片与枣仁安神颗粒
2025-11-24 15:53:00
“十四五”·大图景 小目标|老年人的“暖心饭”
11月18日中午,在石家庄市桥西区汇通街道社区助餐点,老人们正选择自己喜欢的菜品。 河北日报记者 崔丛丛摄石树晓抬头看了眼墙上的钟表——10时45分
2025-11-24 08:23:00
河北日报讯(记者肖煜)近日,由河北参与创拍的重大革命历史题材电视剧《浴血荣光》创作研讨会在北京举行。业内专家学者、主创代表
2025-11-24 08:24:00
我国基本医疗保险制度旨在为参保群众提供基础医疗保障。为保障基金合理使用与制度可持续运行,医保报销设有一系列科学、规范的政策规则
2025-11-24 08:28:00
“双碳”目标背景下,如何建设零碳园区、零碳工厂和“好房子”,又如何将看不见摸不着的碳排放和减碳量,变得可测、可观、价值可实现
2025-11-24 09:02:00
据中国消费者协会网站消息,近日,有媒体曝光了一批盗版剧App,这些App不仅盗用大量剧集资源,更会窃取用户个人隐私信息
2025-11-24 09:22:00
孩子没人看,我办看护班
赵子竣(右二)在村民家中走访。 (新合村村委会供图)2023年11月,我来到海南省文昌市文城镇新合村担任村党支部书记助理
2025-11-24 09:23:00
鲁网11月24日讯在数字化服务日益普及的今天,准确、完整的客户信息是高效、精准服务的基础,更是保障客户资金安全与合法权益的关键防线
2025-11-24 11:06:00
吉林省首例!吉大一院成功开展机器人导航肺部消融术
近日,吉林大学第一医院胸外一科成功运用穿刺手术导航定位系统,为5名肺结节病变患者实施穿刺活检及消融手术。这一突破标志着吉大一院在肺部疾病微创精准诊疗领域的技术实力再上新台阶
2025-11-24 11:36:00
西安市内首家免税店将于26日正式营业
试营业期间,身着汉服的工作人员向外籍游客介绍免税店特色商品。记者王梦凡陈克摄本报讯(记者王梦凡陈克)记者昨日实地探访试营业期间的西安市内首家免税店
2025-11-24 11:41:00