• 我的订阅
  • 科技

谢邀 这是知乎中文大模型给你的答案

类别:科技 发布时间:2023-04-19 10:34:00 来源:钛媒体

在中文问答语料最为丰富的社区知乎,有一个越来越重要的角色,它有一点那么不请自来,但是确实在意料之中。

这个角色就是AI。

在日前举办的“2023知乎发现大会”现场,知乎创始人、董事长兼CEO周源与知乎合伙人、CTO李大海,共同宣布了知乎与面壁智能在AI大模型上的最新合作与应用,正式发布了“知海图AI”中文大模型。

这是知乎首个大语言模型,应用至知乎热榜。它以“热榜摘要”的形式呈现,利用其语言理解能力,对知乎热榜上的问题回答进行抓取、整理和聚合,并把回答梗概展现给用户,给大家直观清晰的回答,目前已经开启内测。

面壁智能联合创始人、CTO曾国洋在大会演讲中表示,经过测试,在知乎热榜的应用场景下,知乎与面壁合作自研的大模型与GPT-4相比,达到了持平的效果。未来,“知海图AI”的能力还将逐步应用在对创作的赋能、对讨论场的赋能和对信息获取的赋能。

谢邀 这是知乎中文大模型给你的答案

面壁智能联合创始人、CTO曾国洋

01.知乎为何要做大模型?

ChatGPT一夜之间全球爆火,让AIGC成为一种潮流,围绕着人工智能的话题,再度成为大众的讨论的焦点。

从移动互联网时代行至 AI 时代,知乎以问答形式为主,搭建了一个专业、多元、有价值的“讨论场”。

之所以决心下场参与大模型领域,周源告诉钛媒体APP,公司在做业务时,首先应该思考自己的价值,能够给用户提供的价值,以及自己的定位是什么,在这个基础上,再与商业社会产生一个交集。

知乎本身是一个场景,场景代表的是用户需求。在周源看来,知乎最核心场景是“讨论”:用户通过“讨论”的方式,去交换信息,分享知识、经验和见解。

讨论也会形成一些目前用户熟悉的功能。比如说,内容热度由讨论而产生,最后聚集在某个地方,又有更多的用户看到它。这其中,AI可以自动生成“热榜摘要”的场景和功能,以提升用户体验。

事实上,早在十年前,知乎有一个产品功能是“回答总结”,类似于现在与面壁智能合作的“热榜摘要”。当时,知乎将此项功能开放给了所有用户,用户可以像维基百科那样编辑,把大家所有的回答做一个总结。

但后来,周源发现,这个事情太困难了。因为回答数量多了以后,人工编辑的成本非常高,而且实现的效果并不好。现在,有了AI的方式,当用户想要加入一个讨论时,可以通过“热榜摘要”迅速地了解某个事件的梗概,然后,再去阅读所有的讨论中,他认为相对有价值的内容。

找到自己想要的解答,这就意味着,可以收获到知乎所倡导的“获得感”,因为获得感也是因人而异的。

周源认为,在一个技术快速迭代的时代,反而更应该关注人,关注那些独特的个体,关注他们是否会因此而受益。

人才储备是入局大模型另一个重要的入场券。李大海对钛媒体APP说,大模型本身不是横空出世,忽然蹦出来的,而是在这之前,有非常多技术累积,这个过程并没有那么突兀。所以,知乎的工程师也可以迅速地去学习、消化、吸收,变成大模型领域的开发者、从业者。

谢邀 这是知乎中文大模型给你的答案

知乎合伙人、CTO李大海

李大海认为,在这方面,人类工程师都是非常聪明的。事实证明,知乎与面壁智能只花了一个多月的时间,就做出了非常多肉眼可见、很可喜的进展。也可以说,知乎在大模型上的人才储备是足够的。

知乎已经有了一个完整的算法中台来支撑整个公司的业务,知乎也早已经成为了一个技术驱动型的公司。并且,他们很早就提出了“智能社区”的概念,将AI应用在了社区内容的生产、流通、消费和治理等环节。

邀请AI加入“讨论场”,在周源看来,AI时代的生产力要素,可以从上至下分为三层:应用场景、专有数据、基础模型。

在基础模型层,以GPT为代表的大模型迭代速度非常快,性能不断地提升,同时,其成本也在不断下降。今天中国的AI生态才刚刚起步,对于中国的公司来说,可以先在应用层和数据层两方面夯实独特的优势,同时,也要在基础模型层去成为新生产力的开发者。

知乎基于问答的讨论场是天然的应用层场景,并且每天都有不断新增的优质内容,用户和用户之间,用户和内容之间进行的互动,构成了独一无二的专有数据。

02.“知海图AI”怎么炼成的?

以Chat-GPT为代表的大语言模型给世界带来了惊喜,但落地至中文互联网,大家发现,主流的大模型英文语言能力往往比中文语言能力更好、更快。

李大海对钛媒体APP表示,这其中主要有两个原因:第一,中文确实比英文要更复杂;第二,开放的英文语料相对于开放的中文语料来说质量更高,内容也更多。这也就意味着,开放的英文语料里面蕴含的知识更多,更容易被大模型学到。

这两个技术问题是客观存在的。中文的问题,中国的科技公司应该更有能力去解决。知乎拥有整个中文互联网最优质的讨论和回答。

数据显示,2022年第四季度月平均订阅会员数达到1300万,同比增长112.5%,2022年的平均MAU(月活用户)达到1.01亿。成立十年以来,知乎已经积累了超过4400万个问题和2.4亿个回答。

之所以选择与面壁智能合作,李大海坦言,除了公司开发模型强大之外,也看中了其背后,清华大学计算机自然语言处理和社会人文计算实验室在中文大语言模型领域有很深的积累。

从2020年开始,面壁智能就发布了全中文互联网首个中文大语言模型CPM-1,在后续的三年,又陆续发布了CPM-2,CPM-3和CPM-Ant等多个开源的模型,这些模型都可以在网上免费获得。

它们最新的大语言模型CPM-Bee,是李大海他们发现的最好的中文大语言模型之一。知乎还投资了面壁智能,很快,双方团队展开了大语言模型的深度共建的过程。

在研发业务中,双方团队利用了CPM大模型强大的内容理解能力,对知乎热榜问题中所有的回答进行要素抽取、观点梳理和内容聚合,最终在问题页面下,将知友们的所有回答的梗概呈现给用户,让大家能更快、更全面地了解热门讨论的热点与焦点,更好的参与到讨论中来。

不过,在开展工作的过程中,团队也面临一些困难。比如说,作为一个非常开放的社区,知乎用户的创造力、表达力很强,很多有趣的、专业的回答,即便是知乎资深的运营人员,也要花很长时间才能准确无误地梳理出核心观点。

而在调教大模型的过程中,在热榜问题下,需要把所有知友的回答观点抽取聚合。在这个具体场景里会涉及到难点是,一方面,对和问题相关的知友观点的抽取是否准确,另一方面,这些观点抽取以后聚合是否合适。而且,在知乎的答主的产出的内容千奇百怪,甚至有时候会有其他的观点呈现,而这个观点跟提问没有关系。

这些因素都训练整个大模型产生了很大的挑战。曾国洋对钛媒体APP说,团队做了很多的工作,花了不少的时间来调教大模型,让它在算法工程师的陪伴下,阅读了大量知乎中的优秀回答,最终才取得了不错的成果。

最近一个令他们欣喜的成绩是,在知乎特定的场景内,开发者选取了41个热门的话题,将“知海图AI”与OpenAI最新的GPT-4进行了一个横向对比,结果发现,目前知乎的大模型已经达到了和GPT-4持平的效果。

03.以AI辅助创作

在AIGC蓬勃发展的趋势之下,一个值得思考的问题在于,作为一个以人的问答交互为核心的社区,知乎在引入AI之后,是否会对原来的真人创作内容以及创作者形成冲击?而此前知乎上“抖机灵”式特色回答又是否会消失?

针对这一议题,周源对钛媒体APP表示,社区一定是人为本,知乎本质是人与人之间的讨论和分享,它的起点是人,它的终点也是人。但是AI不是人,而是一个环节,AI服务的对象主体是人,人是知乎社区里面的每一份子。

AI可以帮助社区中的创作者,提升他们的创造力,提升效率和质量,从而能够让更多的社区用户能够获得帮助,开阔眼界,产生共鸣,而这恰恰也是知乎提倡的“获得感”的内容价值观。

这是知乎一个非常重要的原则,他们也正按照这样的方式,在考虑产品迭代优化上,始终考虑最后的价值点落在哪里。只要清楚地坚持这个原因,AI创作与人类创作,并不会产生真正的冲突。

在周源看来,虽然不是所有人都有需求去写一篇图文并茂的文章,但有这个需求的人,一定会希望以更高效的方式,去产生出更好的内容。某种意义上来说,知乎的专业用户聚集度较高,他们会研究怎么用AI生成的图片,或者用大模型生成一段文字。

所以,知乎在今年初还上线了AI辅助创作的功能,其核心是想表达,用这样的工具创作,是没有问题的,因为这是一个大趋势。

在此次大会发布的“海盐计划5.0”中,知乎锚定职人创作者群体提升权重,最高可获得5倍流量及涨粉加权,并配合多渠道助力职人创作者变现。

谢邀 这是知乎中文大模型给你的答案

作为有专业的教育背景以及专业的职业身份,精通某项领域某种技能的群体,目前我国潜在的职人群体超过3亿,这些职人群体与知乎的用户群体高度吻合,他们很多都是活跃在一二线城市的职业工作者,在工作领域和兴趣爱好方面有着丰富的经验。

周源相信,每个人都有专业的一面。因为非常坚定定位,才能明确地把价值做深。从去年增长快速的会员业务(会员其实是从社区平台上再长出来比较深入的业务),以及围绕职业人群“职人”开展的职业教育业务,都是围绕社区把内容链做得更深、做得更坚实的过程。

社区以人为先,这是知乎在12年前出发点,现在,知乎有机会在技术助力之下,把这件事情做得更好。从去年开始,知乎开始深耕“生态第一”战略后,社区的数据增长,包括用户的留存、市场拓展,创作者数量和品类,这都来自于知乎非常清楚地坚守了自己的定位:专业讨论。

至于AI会如何识别文本是一本正经的专业讨论,还是属于抖机灵式回答,曾国洋对钛媒体APP说,“大家不要太小看大模型的能力。人能知道它在抖机灵,大模型也知道。”

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-04-19 11:45:17

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

知乎 AI 革命:智能搜索与实时问答的融合
...当下和未来,有三个基本的视角:它是大语言模型预训练中文语料最重要来源之一,例如最近现象级的大模型聊天应用 Kimi Chat,就以知乎为重要的训练资料来源(甚至是 80% 以
2024-03-31 21:00:00
史上最严中文真实性评估:OpenAI o1第1豆包第2,其它全部不及格
...速发展至关重要。近日,淘宝天猫集团的研究者们提出了中文简短问答(Chinese SimpleQA),这是首个全面的中文基准,具有“中文、多样性、高质量、静态、易于评估”五个特
2024-11-22 09:51:00
媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格
...MLU 和 C-Eval 等选择题形式的评测集。为了进一步同步推进中文社区对模型事实正确性的研究,淘天集团算法技术 - 未来生活实验室团队提出了Chinese SimpleQA
2024-11-21 09:43:00
国产大模型首发中文逻辑推理,「天工大模型4.0」o1版来了
...并开始在一些权威评测中取得领先。今天,国内首款具备中文逻辑推理能力的 o1 模型来了,它便是由昆仑万维推出的「天工大模型 4
2024-11-28 10:00:00
搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?
...言模型,主要面向文学创作、商业文案创作、数理推算、中文理解和多模态生成五个场景。会上,百度创始人、董事长兼首席执行官李彦宏通过问答演示展示了这五个场景下文心一言的表现。相比昨
2023-03-16 17:00:00
大模型的未来,快手在自己身上找答案
...」集成了快手在大语言模型领域的深厚积累,通过数十亿中文语料的训练,成为最懂中文的文生图模型,综合性能超越了 SDXL/SD3 等开源模型以及 Midjourney 等闭源模型
2024-07-11 14:20:00
百度文心一言发布会详细纪要
...个是商业文案的创作,第三个数理逻辑的推算,第四个是中文的理解,第五个是多模态的生成。第一个例子,是文学创作。我们看一个有关《三体》的例子,先问《三体》的作者是哪里人,它先要知
2023-03-17 12:00:00
ChatGPT强敌Claude发布全新版本:免费,记性还更好 | 最前线
...aude 2及其网页测试版。网页测试版可以免费使用,且支持中文对话,但目前仅对美国和英国用户开放。Anthropic还称
2023-07-13 13:00:00
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...-4V在奋力追平GPT-4V的同时,LLaVa-1.6也展现出强大的零样本中文能力。LLaVa-1.6不需要额外训练便具备杰出的中文理解和运用能力
2024-02-10 21:04:00
更多关于科技的资讯:
高端润滑油的智造密码
2月9日,润滑油北京有限公司员工加紧节前生产,确保高质量交付客户产品。本报记者 程阳 摄 郑德辉 文2月9日,中国石化报记者来到润滑油北京有限公司
2026-02-12 11:53:00
中新经纬2月12日电 据“北京市场监管”微信号12日消息,近日,北京市市场监督管理局组织携程、去哪儿、飞猪、同程、美团
2026-02-12 11:57:00
聚焦雄安新区丨“人工智能+”开拓产业发展新赛道
“人工智能+”开拓产业发展新赛道——2026年雄安新区“人工智能+”创新生态系列活动观察人工智能,是雄安新区大力发展的主导产业之一
2026-02-12 08:47:00
在多个短视频平台和电商平台上,不少账号公开发布视频,称可以绕开一些平台的人脸识别验证。这些视频中,有人遮挡住手机摄像头
2026-02-12 08:58:00
当前,健康中国战略深入实施,智能健身市场需求激增,舒华体育深化"AI运动科技"定位,推动奥运技术全面渗透至各类场景,让大众共享科学健身成果
2026-02-12 09:28:00
以旧换新激活潍坊消费新引擎:一场政策引领的绿色消费革命
鲁网2月11日讯(记者 王玉龙)2025年,潍坊市消费品以旧换新直接拉动消费160亿元,是2024年的4.2倍;129万人次享受到20
2026-02-12 09:56:00
“西湖纹样”小程序正式上线杭州日报讯 第十九届杭州文博会上,西湖区的展馆前天天大排长龙。纹样编织袋、纹样透卡、纹样茶点礼盒
2026-02-12 06:41:00
2月6日,上海超导科技股份有限公司向太原钢铁(集团)有限公司发出一封感谢信,披露太钢与该企业一场历时五年的联合攻坚结出的硕果
2026-02-12 07:31:00
李建南摘要:随着大模型在预测、生成与复杂模式识别中的广泛应用,统计建模范式正在经历深刻转变。相较于以概率假设与参数推断为核心的传统统计模型
2026-02-12 07:32:00
以科技自立自强构筑创新高地杭州日报讯 近日,在湖州莫干山高新区,灵心巧手(Linkerbot)年产3万套具身智能机器人灵巧手的超级工厂项目正在全速推进
2026-02-12 07:11:00
中新经纬2月11日电 据国家市场监督管理总局网站消息,2月4日,国务院反垄断反不正当竞争委员会印发施行《关于公用事业领域的反垄断指南》(以下简称《指南》)
2026-02-11 20:18:00
季季有主题,周周有优惠!2026年河北省电影惠民观影促消费活动启动
河北日报客户端讯(记者肖煜)为积极响应落实国家电影局全国电影惠民消费季安排,进一步激活河北电影市场消费潜力,丰富群众文化生活
2026-02-11 22:05:00
2025国际宠物博览会落幕:Benarmi倡导全生命周期健康管理
12月20日,2025国际宠物博览会在北京市平谷区博物馆、体育中心拉开帷幕,汇聚全球名宠、产业企业与创新项目,集中展现宠物经济的前沿动态与发展趋势
2026-02-11 20:08:00
“民生科幻”领军人吴楚新作《背叛文明》出版,聚焦星际外交博弈
如果高等文明的馈赠是一颗带毒的蜜糖,那人类是否有智慧拒绝唾手可得的诱惑?当思想需要向未来跨出一大步时,阅读科幻依然是当下最高效的途径
2026-02-11 17:22:00
随着云计算、大数据、人工智能等数智技术的迅猛发展,传统劳动形态正经历着前所未有的变革。工作场所的虚拟化、劳动时间的弹性化以及用工关系的多元化
2026-02-11 17:31:00