• 我的订阅
  • 科技

揭秘:如何寻找、设计大模型产品并落地发布?

类别:科技 发布时间:2023-12-06 16:02:00 来源:人人都是产品经理

AI技术的进步,给人们的工作场景带来了很大变化,越来越多企业开始尝试将AI技术融入到业务中,许多AI产品也应运而生。那么,产品经理要怎么寻找到可以和AI结合的场景?这篇文这里,作者介绍了大模型产品从0到1的落地经验,一起来看。

从2月份 OpenAI 发布以来,AI 已经席卷了各个应用场景,工作和生活。我们可以看到市场上越来越多的产品在 AI 化,有报告显示 76% 的 SaaS 公司正在使用或者测试将 AI 融入到他们业务中。22% 企业正在考虑如何将 AI 和业务场景结合,进行下一步的 AI 迭代升级。以前做不到的场景能力现在也变得可行。

此外,市场上很多 AI/AIGC 产品经理岗位的需求,也旺盛了起来。

揭秘:如何寻找、设计大模型产品并落地发布?

这一整个行业的技术变革对创业者和产品经理都提出了一个重要挑战:你的业务/产品和 AI 之间有什么关系?如何设计出你的下一代 AI 产品?

从市场目前的应用数据量来看,市场目前并不是“只在找钉子,而找不到应用场景”的阶段。也不是“AI 不只是在第一阶段,还没法证明价值”。根据麦肯锡的报告,已经有非常多的企业和产品落地 AI 应用。

不过这并不意味着 AI 的整合应用,一切都已经成熟。

揭秘:如何寻找、设计大模型产品并落地发布?

Alex Singla 指出:

要迈出下一步,让生成式人工智能从实验变成业务引擎,并确保获得丰厚的投资回报,企业需要解决一系列广泛的问题。这些问题包括:确定组织内生成式人工智能的具体机会、治理和运营模式应该是什么、如何最好地管理第三方(如云和大型语言模型提供商)、管理各种风险需要什么、了解对人员和技术堆栈的影响,以及清楚如何在银行近期收益和发展规模所需的长期基础之间找到平衡。这些都是复杂的问题,但却是释放真正巨大价值的关键所在。

作为 AIGC 产品经理,今天给大家介绍一下整体大模型从 0 到 1 的落地经验。分为:怎么找到可以和 AI 结合的场景如何做 AI 的可行性验证算账,引入AI 后,企业挣不挣钱寻找潜在客户 POC(proof of concept) 演示落地应用并规模化

这 1-5 步想要跑得快,就需要有人熟悉 AI 大模型 + 垂直用户场景。所以对产品经理和企业 CEO 来说,也提出了新的挑战。

一、怎么找场景

这一步是产品基本功,我们需要朝外看,先看行业的用户,需要完成哪些任务,核心痛点是什么。这里面哪些可以使用 AI 大模型技术能完成。

创新之父克里斯坦森有一个「任务理论」,他介绍了这么一个经典例子:

20 世纪 90 年代中期,底特律的两位顾问造访克莱顿·克里斯坦森教授在哈佛商学院的办公室,深入学习颠覆性创新理论。鲍勃·莫埃斯塔和他当时的合伙人瑞克·佩迪正在发展一项利基业务,为面包店和零食公司提供建议。

莫埃斯塔分享了为一个快餐连锁品牌打造的方案:贩卖更多的奶昔。这家连锁公司花了数月,极尽细致地研究这个问题。几个月后,营销人员付出了很多努力,奶昔的销量却一点儿变化也没有。

因此,教授教他们从另外一种角度来思考问题:这些消费者的生活中出现什么样的任务,才会促使他们来到这家餐厅“雇用”奶昔呢?

以这个视角为出发点,营销团队选了一天,在餐厅里站了18个小时来观察顾客:人们是在何时购买奶昔的?他们穿着什么样的衣服?是独自一人吗?除了奶昔之外,他们还会买其他食品吗?他们是在餐厅里把奶昔喝完,还是开车带走呢?

原来,很大一批奶昔是在上午9点之前卖出的,买者则是独身来到快餐店的人。这些人大多只会购买一杯奶昔,他们不会待在餐厅把奶昔喝完,而是钻进自己的车里开车带走。因为清早的消费者都有一项需要完成的任务:他们不得不百无聊赖地花很长时间开车上班,因此想要用什么东西让旅途变得有趣一些。

原来,这项任务的竞争者有许多,但没有一位能把任务完成得无懈可击。有的消费者雇用香蕉来完成任务,但香蕉几口就吃完了。还有的消费者购买了甜甜圈,但是面包屑太多,让他们手指变得黏黏的,弄脏衣服和方向盘。贝果面包则又干又没味,让开车的人不得不一边用膝盖转方向盘,一边往面包上涂抹奶酪和果酱。还有人购买士力架。但他觉得,早餐就吃甜点实在太罪恶了,所以再也没有这样做过。”但是奶昔呢?它可以算是诸多选项中的最优项。用纤细的吸管喝完一杯浓稠的奶昔需要花很长时间,而且奶昔还能帮助抵挡上午10点左右袭来的饥饿。

由此可见,这种奶昔能比其他竞争者更好地满足需求。在消费者的眼里,其他竞争者不仅包括其他连锁店的奶昔,还包含香蕉、贝果、甜甜圈、早餐棒、思慕雪和咖啡等。

研究团队还发现:这些奶昔和消费者之间的共同点与他们的个人状况没什么关系,这些消费者的共同点是他们必须要在早上完成一项任务。

每个人的日常生活中都会出现需要完成的任务,这个时候,我们便会雇用产品或服务来完成。

此外,从任务的视角去理解用户,你会发现什么才是你真正的竞争对手。你关注的其实更应该是客户在解决任务中的替代方案,而不是你以为的对手。

「任务」的定义

那到底什么是用户需要完成的任务呢,其定义是指:一项任务是指个人在特定背景下想要实现的进步。成功的创新可使用户取得理想的进步、解决困难、实现未完成的梦想。这些创新可以完成缺少有效解决方法或不存在解决方法的任务。任务绝不仅仅涉及功能,社会和情感因素也占有很大比例,而这两者,有时甚至要比功能因素更重要。任务是在日常生活中出现的,因此背景对于其定义至关重要,这也是创新任务中不可或缺的一个环节。用户特征、产品特征、新科技和流行趋势,这些都不是创新任务的关键环节。需要完成的任务是不断发展和重复出现的,几乎不可能是独立存在的“事件”。

任务比「需求」的概念要清晰,容易定义很多。因为需求是模糊、宽泛、且无处不在的。

你可以列出你的行业场景中,目标用户需要完成哪些任务,然后进行挑选,优先寻找 quick win(快速赢) 的解决方案。quick win 的特征是:博弈方少,项目阻力小。大家普遍吐槽不愿意做的事情。可以短平快的切入,客户快速感知价值。你能够悄悄地赢,同时也意味着你可以悄悄地输(可选,这点取决于对事情成功率的把握)。

还有一种做法,是看现在 AI 产品/竞品集成场景有哪些,哪些是可以迁移复制到自己的业务中的。不过这种类型的迁移,有可能是一片竞争血战,因为大家都看得到。比如电商场景里的聊天对话。对于产品来说,切入点很重要,大家可以多思考还有哪些场景可以和 AI 做整合(可以轻松地闷声发财)。

二、大模型可行性验证

有了场景后,接下来需要你对大模型基本原理有一定的了解和大致判断,哪些场景任务是有可行性的。准备一些测试数据,选择一个大模型平台进行实验,可以是百川、OpenAI,或者微软 OpenAI。

以下以微软 OpenAI 能力举例,抛砖引玉。实验主要分为三个部分进行实验:写 Prompt —→ 此步骤是最重要的(如果效果不理想,那么就增加 example)。调节参数,主要考虑稳定性和模型最大 token 数量。输入测试数据,查看对话效果,并且不断调整 1 和 2 步。

揭秘:如何寻找、设计大模型产品并落地发布?

最终基于可行性实验,需要验证的是:AI 在此场景下是否能够解决问题。需要什么版本的大模型能较好地解决你客户的问题,(因为模型成本会非常不一样)。效果是否满意。效果是否稳定。

通过找场景 + AI 平台验证,现在你已经知道了哪些场景有明显优势,哪些在 AI 的技术下仍然不够成熟。基于上面场景的特征,可以挑选出可行的场景。

三、算笔账,AI 业务到底挣不挣钱

接下来就是业务场景的 ROI 了,俗称算笔账。

你的这个场景到底在 AI 的加持下,挣不挣钱。因为大模型的 API 调用是线性增长的,你调用的越多,你的成本越贵。

下图是微软 Azure OpenAI 的收费模式,根据你实际调用的 token 数进行收费。其中 Prompt 指的是向模型输入的 token 数量;Completion 指的是模型输出的 token 数量。token 数量多少在 Azure 上会列出,所以不用担心不知道怎么计算 token。

揭秘:如何寻找、设计大模型产品并落地发布?

如果你的场景里面,单次调用的成本要压在 0.0015刀以内,那么你的这个场景肯定是不挣钱,也不适合大模型的。我们需要在回归到第一步里面,找到用户花代价较大的场景价值中,用大模型实验。

因为在成本的计算中,你需要考虑,现在用户花多少代价解决这个问题,你能帮助他减少多少。减少的这部分,你能收多少钱,能否覆盖大模型的成本费用(如云成本)和你的开发费用。

算账成本可以分为:大模型成本;云成本,一般分为存储成本,带宽成本,机器成本(如 GPU)等;三方服务 API 调用成本;人工 QA 成本(AI 一般少不了这部分,不然你无法做准确率的验证);研发开发成本。四、如何评价 AI 的工作,响应速度、准确率、稳定性?

通过以上实验,你已经可以知道 AI 的能力。但是怎么去评估 AI 的工作,响应速度、准确性、稳定性、鲁棒性,需要多少数据集进行验证?这就是接下来如何把 AI 工作量化和下一步规模化的时候需要关心的部分。

揭秘:如何寻找、设计大模型产品并落地发布?

上图是艾瑞咨询列出得大模型服务能力评估体系。非常的全面。不过我们实际在使用的过程中,不会这么使用。右侧其实是产品怎么去找场景、价值;左侧目前业界常用的 AI 也是准确率(可以进一步拆分为 Precision 和 Recall。你可以通过构建一些测试数据集,来验证你的场景在 AI 大模型下的准确率。这里会需要进行人工验证。

五、完成产品 MVP 和工程化工作

完成了场景的可行性验证,接下来我们需要考虑产品化。有人会问:“如何设计 AI 原生体验产品?”“AI 是一个 feature 还是一款产品?“

这其实很好回答,回到你的用户故事中去。在用户需要完成某个任务的场景中,用户是怎么解决他的问题的,他的流程是怎么样的。流程里面你的业务/产品扮演什么角色,是一个端到端的解决方案,还是里面某个环节部分,如何融入到客户的用户故事中去,是一个 App/Web/API?

AI 的应用设计,产品经理需要着重考虑三个方面:客户体验:AI 的用户体验和及时反馈常做的不好,用户是否有及时反馈规模化:目前大模型的调用有 Rate limit 限制。一个Region GPT-4,8k token 的服务调用限制是20K/min。你需要考虑如果你有海量的数据和用户,需要怎么解决 Rate limit 限制数据隐私和安全:做企业 SaaS 服务的基本绕不开数据隐私的话题,业界比较好的案例可以参考 Notion 和微软 Azure 的安全能力,基于各个企业自己的安全机制来处理此部分。

揭秘:如何寻找、设计大模型产品并落地发布?

https://www.notion.so/help/notion-ai-security-practices

接下来根据这些关键信息,去全局地设计的产品。又回归到传统的产品设计了。

AI 是一次技术的升级,它可能全部颠覆以前传统的方法,也可能是传统方法的加持。但是不管如何,对于产品经理来说,整体的设计流程并没有改变。但是里面多了一个重要变量:AI。

此外,大家如果做大模型项目/应用的时候需要注意,如果 AI 整合进业后务,有可能会去颠覆一个行业。作为产品经理和创业者,除了产品方案本身,其实我们还要考虑很多对行业、对企业组织运营的影响。推荐大家阅读本专栏相关创新的文章。

为我投票

我在参加人人都是产品经理2023年度评选,希望喜欢我的文章的朋友都能来支持我一下~

点击下方链接进入我的个人参选页面,点击红心即可为我投票。

每人每天最多可投30票,投票即可获得抽奖机会,抽取书籍、人人都是产品经理纪念周边&起点课堂会员等好礼哦!

投票传送门:https://996.pm/YNx1o

专栏作家

圈圈,微信公众号:lovepm,人人都是产品经理专栏作家,专注与热爱产品工作。

本文原创发布于人人都是产品经理,未经许可,禁止转载。

题图来自Unsplash,基于 CC0 协议。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-12-06 18:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

追一科技吴悦:一家做了7年NLP的公司,如何抓住大模型浪潮? | 36氪专访
...球热潮,仅仅一年,这波新AI浪潮就迅速快进到在企业侧落地——从AI大厂、创业公司到企业客户,大家都急切地想探索出一条可行的,让大模型落地的路径。但对追一科技而言,这已经不是新
2023-12-06 14:07:00
国产大模型加速落地,争夺“中国版ChatGPT”心智定位
从创业狂潮到争相落地,国产大模型进入了新的竞争阶段。5月7日,零一万物官宣了一站式AI工作平台——万知。据官方介绍,万知可以帮助用户做会议纪要、周报、写作助手,还可以解读财报、论
2024-05-07 18:33:00
制造业AI也迎来大模型时刻? | 智造观察
...部的信息智能,如人机交互。在工业制造领域,大模型的落地存在哪些难题?目前普遍一个共识是,参数越高、模型越大,模型的泛化能力就越强,但在训练这样一个大模型的初期算力成本非常之高
2023-04-20 20:00:00
超星未来梁爽:软硬件协同优化,赋能AI 2.0新时代
...I2.0新时代》。 大模型是AI2.0时代的“蒸汽机” AI+X应用落地及边缘计算将成为关键 自ChatGPT发布以来
2024-07-22 13:00:00
灵宝CASBOT首款人形机器人产品—CASBOT 01发布,应用级产品搅动千亿市场
...发布首款全尺寸双足人形机器人“CASBOT 01”,一款多场景落地的通用类脑智能机器人。这是灵宝CASBOT在成立不到1年的时间内交出的一份亮眼的答卷,也标志着人形机器人赛道
2024-11-14 09:43:00
用AI修图、修视频,美图发布AI视觉大模型 | 最前线
...盖了美学趋势研究、美学评估系统、美学创作者生态三个落地场景。在技术层面上,MiracleVision采用了更高容量的扩散模型,从绘画、设计、影视、摄影、游戏、3D、动漫等视觉
2023-06-19 18:10:00
第三届美图影像节发布6款产品 开启“AI工作流”新阶段
...、AI音效、自动字幕等功能串联素材并实现成片。这个能落地的AI视频产品,就是AI短片创作工具MOKI。与常规文生视频产品不同,MOKI深度理解视频创作者需求,实现内容和成本的
2024-06-12 17:11:00
百度AI基因明星创业公司,卓世科技破局大模型商业落地
...,在巨大市场空间的另一面却是人们对大模型未来商业化落地的担忧,从23年初疯狂融资追赶OpenAI,到后来奔涌而出的百模大战,再到今年上半年众多应用的百花齐放,如今的市场有兴奋
2024-11-20 14:06:00
...白质结构。中国信息通信研究院近日发布的《2023大模型落地应用案例集》评选出52个大模型商业落地优秀示范,覆盖智能制造、教育教学、科技金融、文娱传媒、医疗、交通等各个行业。“
2023-12-31 09:21:00
更多关于科技的资讯:
AI竞技场,河南加速度!
大河网讯 在2025世界人形机器人运动会上,“行者二号”在1500米项目中勇夺小组第一;内乡县牧原肉食产业综合体通过24小时巡检机器人与AI算法
2025-09-05 19:46:00
河北新闻网讯(王杨、曹莹莹)河钢集团张宣科技聚焦“近零碳排”冶炼全流程,通过持续优化生产工艺,充分释放设备效能。近日,该公司成功开发的高品质汽车用材料
2025-09-05 18:00:00
Baseus倍思强强联合Bose发布三大年度旗舰新品,高端专业音频迈入全民化时代
2025 年 9 月 5 日 14:00,全球新生活移动数码品牌 Baseus倍思举办线上新品发布会, 正式发布其年度旗舰音频新品——倍思 Inspire系列
2025-09-05 18:31:00
引领健康储鲜,澳柯玛风冷变频冷柜斩获“云鼎奖”
鲁网9月5日讯近日,奥维云网2025数字生态大会在杭州闭幕。作为家电行业极具影响力的年度盛会,现场汇聚了众多家电领军品牌
2025-09-05 13:38:00
周黑鸭携四大产品线矩阵破局全场景消费,构建卤味行业新范式
齐鲁晚报·齐鲁壹点 记者 张召旭在近期举办的行业展会上,周黑鸭凭借前瞻性战略布局引发行业广泛关注——品牌首次系统推出针对多元消费需求与渠道特性开发的四大产品线
2025-09-05 11:00:00
当“保温杯里泡枸杞”从段子变成日常,当“中药房下午茶”取代美式咖啡成为年轻人新宠,老字号品牌们逐渐发现:年轻人不是在买一杯饮料
2025-09-05 11:02:00
本报记者 魏 静 □ 忽 艳在国内鼓励创新、倡导在世界舞台展示中国实力产品与个人实力的大环境下,越来越多中国品牌凭借创新精神与卓越品质
2025-09-05 11:02:00
近日,阳光人寿秦皇岛中支在益寿园开展“银发课堂”特色活动,为老年群体送上内容丰富的金融知识。活动现场,工作人员通过生动的案例
2025-09-05 09:36:00
36氪首发|掘金“微醺”社交经济,精酿品牌「TAGSIU」获近千万 Pre-A 轮融资
作者 | 李小霞36 氪获悉,精酿品牌「TAGSIU 醍宿酿造」(下称“TAGSIU”)已完成近千万 Pre-A轮融资
2025-09-04 22:09:00
从形态突破到生态跃迁:华为三折叠的「鸿蒙时刻」
三折叠这个赛道,或许只有华为能够超越华为。华为Mate XT 非凡大师发布一年之后,三折叠这片“无人区”,仍然只有华为的身影
2025-09-05 00:13:00
大众网记者 张田夏荫 实习记者 张智尧 报道海信集团总裁、海信视像科技股份有限公司董事长于芝涛正式以大赛形象大使与推介大使的身份
2025-09-04 10:04:00
第26届GOPS全球运维大会落幕,AI Infra赋能运维转型
2025年6月28日,为期两天的第26届GOPS全球运维大会暨研运数智化技术峰会在北京市圆满落幕。作为国内首个运维行业盛会
2025-09-04 11:33:00
三联家电“伙拼9.12”权益全解析!三重补贴省心省钱嗨购金秋
鲁网9月4日讯金秋家装季撞上三联家电第十一季“伙拼9.12”大型内购福利会!这场被万千家庭期待的消费盛宴即将引爆全城!多重补贴
2025-09-04 11:33:00
灵动集团旗下欢米粒心理:新学期,为青少年心理护航——以专业体系构建成长防护网
在青少年心理健康服务需求进入 “刚性增长期” 的当下,资质与专业双轮驱动成为行业发展的核心支撑。灵动生活集团作为《互联网心理服务・心理测评服务通用规范》国家标准制定委员单位
2025-09-04 11:55:00
金秀之光,宏瑶传承千年瑶浴的现代创新之路
金秀大瑶山的采药人每日清晨踏遍青山,采集当地草药。这些草药通过广西宏瑶生物科技股份有限公司(以下简称“宏瑶股份”)的现代研发与技术加工
2025-09-04 11:55:00