• 我的订阅
  • 科技

对话王小川:国内在技术理想上拼不过OpenAI,但应用落地会跑得更快

类别:科技 发布时间:2023-08-09 15:00:00 来源:搜狐科技
对话王小川:国内在技术理想上拼不过OpenAI,但应用落地会跑得更快

出品 | 搜狐科技

作者 | 梁昌均

6月15日、7月11日、8月8日。这是王小川自4月10日官宣创办百川智能入局AI大模型创业以来,先后推出三个大模型的时间。

过去的四个月里,百川智能的团队已增加到110多人,且先后推出7B、13B和53B三个不同参数规模的大模型,速度之快超出外界想象。

Baichuan-53B是王小川昨日发布的新一代大模型,它在预训练数据、搜索增强、对齐能力等方面进行了优化。王小川称,这是一款通用大模型,在文本创作等文科能力上表现突出。

但不同于之前开源的7B、13B,王小川表示,从53B大模型之后就不再开源,因为部署成本较高。目前,这款模型已开启内测,下个月会开放API,甚至开放组件,优先把2B的服务做起来。

王小川透露,此前开源的7B和13B模型已有超过150家企业申请使用。对于为何要先做开源,王小川对搜狐科技解释称,开源一定程度是营销行为,可以后发制人,同时开源也是为商业化做储备,有各种用途和生态后,就有了收费的可能。

同时他判断,可能未来80%的企业都会用开源模型,闭源能力强,但成本非常高,而开源模型在很多地方非常好用。“开源闭源不是竞争关系,而是不同场景下的互补的关系。”

随着百川智能继续做更大规模的闭源模型,也会面临不少挑战。王小川表示,需要把模型做得足够好,同时要把推理成本降下来。“这是世界性难题,作为新手还要摸索,但我们有能力做到极致优化。”

在算力层面,王小川表示国产芯片一定要顶上来,光英伟达还不够,这是整个行业面临的问题。他透露,目前百川智能的算力是通过云厂商实现,腾讯、阿里都在为其提供云服务。

“我们说要做到中国最好的对标 GPT 的模型,这意味着对于预训练模型的追求不会停止,未来还会继续去做更大的模型。”王小川表示,百川智能既要做更大参数模型,后面还要做出差异化。

此前7月底,王小川的前合作伙伴洪涛加盟百川智能。王小川表示,这来代表公司在商业层面开始布局。“不管7B还是13B,还是53B,更多是为2B行业做准备,团队也已经部署2C的超级应用,且未来不只有一款。”

而在今年6月考察了美国后,王小川也将百川智能的发展策略从“理想上比OpenAI慢半步,落地上快半步”改成“理想上慢一步,落地上快三步”。他认为,国内在技术理想上拼不过OpenAI,国内离GPT-4都有距离,但应用落地会跑得更快。

对于目前的百模大战,王小川依然相信未来的五张船票会有百川智能的一席之地。他表示,钱非常重要,但最终决定能力的还是人才团队,尤其是组织能力,钱、组织能力是关键。据他透露,百川智能初始估值5亿美金,第二轮可能就是10亿美金,目前融资也非常顺利。

“大厂钱多、人多、算力多,但组织效率不一定够好。组织效率对我们不是挑战,也有大厂相对完整的经验,如果钱能保证的话,能力会很强。”王小川表示,中国谁能做最好的大模型现在没有结论,还无法确定大厂小厂谁能取胜,做应用也是,都有争取的机会。

以下是媒体对话节选(经编辑整理)

谈开源:53B大模型后闭源,未来80%的企业都会用到开源

媒体:此前发布的7B和13B开源大模型落地应用情况怎么样?

王小川:我们是新兵,作为后发者进入市场,开源对我们来讲,能给中国的开源生态作一些贡献,同时展现我们的技术实力,开源后只要持续不断技术迭代,就会有自己的商业模式。

现在有超过150家企业申请使用百川模型,很多都是行业头部企业。商业化工作也会开展起来,借助开源引擎,还有更好的参数模型,以及整套组件也在研发当中,能统一提供部署。

媒体:有观点称,今天在国内做开源带有营销的目的,百川为什么要先做开源?

王小川:开源应该有几层意义。第一层就是营销行为,要告诉我行不行,有用没用,后发者可以后发制人,更容易使朋友多多,能够让大家迅速去评测了解。第二层的话,开源有时是为了商业化做储备,有了各种用途和生态之后,就有了收费的可能。这在国外有探索,中国虽然之前不成功,但依然可以借鉴。

媒体:OpenAI的GPT-1和GPT-2是开源,GPT-3之后就闭源,百川从开源走向闭源的标准是什么?

王小川:我觉得和模型大小相关,参数大的部署成本已经开始增加,这种情况下我们就选择走闭源。但原来说开源是开放论文、代码,GPT-1和GPT-2就是这样,让别人去复刻,我们只是开放模型的能力,让B端都能够用到,和OpenAI是不一样的模式。

媒体:百川现在既有开源也有闭源的大模型,开源和闭源未来会是怎样的应用前景?

王小川:从2B角度看,开源闭源都需要。我们认为可能未来80%的企业会用到开源模型,闭源没办法对场景做特别好的适配,能力是强,但成本非常高。但开源模型可以做到非常小巧,很多地方非常好用。开源闭源不是竞争关系,而是不同场景下的互补的关系。我们更关心2C怎么做,2B怎么做,而不是纠结开源闭源的问题,这个共识在逐步形成当中。

媒体:闭源成本很高,怎么能有竞争力?

王小川:主要是两个事,一是把模型做得足够好,拼的是模型的能力。二是得把推理的成本降下来,这是世界性难题。作为新手还要摸索,把闭源的推理成本降下来。我们有能力做到极致优化,其他人能做到我们也能,甚至做得更好。

谈落地:B端C端都会布局,有信心同时打好几场仗

媒体:现在是百模大战,竞争对手很多,公司落地应用的思路是什么?

王小川:我们认为一家公司不可能把所有赛道都做完。B端我们选择先做开源模型,B端企业和中间层的公司,做二次开发的公司,可以基于开源模型去适用场景,保持足够开放。

内部团队也开始部署C端的超级应用,思考如何追上GPT-4,能带来哪些C端应用,预计网信办发牌照放行的工作今年会放开。我们在两头都走得更远一点,OpenAI目前B端就是API调用,C端就是ChatGPT。

媒体:百川在商业化层面已经开始布局?跟火山引擎和合作能否理解成LLaMA和微软的合作?

王小川:洪涛过来代表我们在商业层面开始布局。我们做模型做得蛮快,在商业化上可能也会跑得挺快,每件事情都争取做得越快越好。闭源本身在2B里面也有服务,包括2C,多条线里面都有很多机会。我对团队过往的能力、经验有信心,能同时打好几场仗。

LLaMA通过微软云向全球企业提供服务,国内除了火山引擎,后面会看到阿里云、腾讯云也会有类似模式。美国只有微软在做,国内云厂商都会有类似战略,都会开放跟模型厂商合作。

谈算力:对模型的追求不会停止,国产算力要顶上

媒体:百川后面会用什么节奏做预训练,会不会用更多的资源做算力集群去提升模型能力?

王小川:预训练的能力,包括搜索的能力,强化的能力,能共同推动大模型的进步。从实操角度讲,搜索效果最明显,强化比较有难度,预训练是在提高模型的综合能力。

我们讲要做到中国最好的对标 GPT 的模型,这意味着对于预训练模型的追求不会停止,未来还会继续去做更大的模型。我们对于搜索和强化也有自己的技术追求,让我们既能做万亿参数,后面还能做出差异化。现在对标的就是OpenAI,那么大模型不可避免会出现同质化,后面就要看是否有独有的技术能力。

媒体:现在大模型的成本中,算力占到多大的比例?算力会是瓶颈吗?

王小川:算力分两部分,训练和推理。训练阶段算力成本挺贵,行业40%以上可能都得给算力。百川可能在40%到70%,包括GPU网络联通。中国要想解决好算力这件事,一定要有国产算力,光英伟达我觉得不够,这是整个行业的问题。我们目前的算力是通过云厂商实现,腾讯、阿里都在给我们提供云服务。

谈百模大战:技术理想不如OpenAI,无法确定谁能取胜

媒体:今年国内大模型这半年有通用也有垂直,整体水平怎么样?您也去了硅谷,他们怎么看?

王小川:今天不管是十家、百家、千家,最后一定看两件事,第一能否拿出足够好的AGI来,能否跟GPT-3.5、GPT-4比肩,现在大家都有距离,哪些企业能达到,现在很难去判断。第二能否做出超级应用来,大模型很烧钱,是否有超级应用场景也还看不清。

我6月去美国,是去感知和对话,了解他们的技术思路。第一个收获是对齐认知,之前大家是两套语言体系。第二个收获是他们做技术确实不错,但做应用的能力不行。去之前,我当时提“理想上比OpenAI慢半步,落地上快半步”,回来后改成“理想上慢一步,落地上快三步”。他们不是往落地方向走,国内技术理想确实拼不过,但落地上会跑得快。

媒体:创业公司在里面该怎么玩,钱是不是最重要的?

王小川:美国通用闭源大模型的几家头部已经定下来,OpenAI、Google等,资本也不会再去投。但中国谁能做最好的大模型现在并没有结论,大家都有争取的机会,现在还无法确定大厂小厂谁能取胜,做应用也是。

钱非常重要,但最终决定能力的还是人才团队,尤其是组织能力,所以钱、组织能力应该是关键环节。大厂钱多、人多、算力多,但组织效率不一定够好。组织效率对我们不是挑战性的事情,也有大厂相对完整的经验,如果钱能保证的话,我们的能力还是很强。

媒体:之前说大模型有五张船票,现在还有几张?

王小川:船票的话现在依然还是有5张,如果只有2张我们也会在这个船上。这5张并不扣除大公司,但创业者没有5张船票。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-08-09 17:45:16

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

王小川:大模型创业挺快乐,最好的大模型未必来自大厂
...潮中,王慧文成立的光年之外就在这里办公;而原搜狗CEO王小川,则将百川智能的创业地选在了与其一路之隔的赛尔大厦。站在这里,甚至可以看清对楼窗边的办公环境。不到一年时间,大模型
2023-08-17 17:45:00
让大模型“外挂硬盘”,百川智能发布新API系列,企业定制成本大大降低
...硬盘。而基于搜索增强技术推出的API系列,用百川智能CEO王小川的话来说:“就像硬盘一样,让大模型可以挂上外部知识库。”大模型成为AI时代的基础设施底座,已成为行业不少人的共
2023-12-21 15:32:00
王小川公布最新530亿百川大模型,阿里腾讯等超150家企业已使用
百川智能创始人兼CEO 王小川成立120天,王小川的大模型公司百川智能又有了新动作。钛媒体App获悉,8月8日下午,百川智能在北京发布530亿参数通用大模型Baichuan-53B
2023-08-09 15:00:00
GPT革命:王小川向左,Sam Altman向右|钛媒体焦点
...创业风潮。4月10日下午,身着橙色帽衫的搜狗公司创始人王小川,走进搜狐网络大厦二层一间近30平米的会议室,在这里他宣布了自己即将投入创业的大模型新项目,名叫“百川智能”,旨在
2023-04-14 14:00:00
被认可的大模型价格战
...一次大模型的“追星”现场。当天,杨植麟和百川智能CEO王小川、智谱AI CEO张鹏、面壁智能CEO李大海进行了一场尖峰对话。这是内行爱听的门道。两个场景,是中国AI市场由表及
2024-06-16 23:38:00
AI大模型诸神之战:总有人要成功,为什么不能是我们?
...技圈大佬争相加入大模型竞赛的境况,王慧文、李开复、王小川......一串串如雷贯耳的名字纷纷入局,经历了三年疫情之后,科技圈又迎来了久违的创业热潮。这些连续创业者们成名已久,
2023-04-13 10:35:00
ChatGPT一周年,机会在大厂还是小公司?
...、生活方式会有天翻地覆的变化。”百川智能创始人、CEO王小川在12月1日的2023腾讯ConTech大会中谈到。大会上
2023-12-07 09:42:00
【科技早报】比亚迪宣布第500万辆新能源汽车下线;环境减灾二号 06 星发射
...星4. 我国《匿名订阅通信服务技术规范》标准正式发布5. 王小川:国内在技术理想上拼不过OpenAI,但应用落地会跑得更快【大厂要闻】支付宝上线机票比价功能,已接入携程、飞
2023-08-10 10:00:00
王小川归来 跑步入局大模型创业
...了AI大模型的创业风潮。4月10日,淡出公众视线近两年的王小川,带着他的新公司“百川智能”亮相,正式宣布进入AI模型创业赛道。王小川被人熟知的,是他理科学霸和搜狗创始人的身份
2023-04-14 10:47:00
更多关于科技的资讯:
河北新闻网讯(赵静静、陈立君)日前,开滦集团铁拓公司(简称“开滦铁拓公司”)自主研制出一台液压支架连杆焊接机器人,并在支护设备厂生产车间正式投入应用
2026-01-06 21:24:00
中新经纬1月6日电 据极目新闻报道,1月5日下午,三星电子会长李在镕现身北京京东MALL双井店购物。此前,李在镕出席了由中国贸促会
2026-01-06 21:31:00
江南时报讯 近日,第五届江苏资本市场峰会在南京召开。本次峰会围绕“聚合资本力量,助力产业创新”主题展开,通过多维度量化评价
2026-01-06 22:12:00
河北新闻网讯(闫丽颖、唐福刚)1月2日,在开滦股份范各庄矿井下600多米深处的三水平中央变电所,一位特殊的“新员工”——轨道式智能巡检机器人正式上岗
2026-01-06 21:35:00
1月6日,记者从盒马鲜生总部获悉,山西首店开业筹备已进入最后冲刺阶段。自7日起,线上配送服务陆续开启,这意味着以“盒区房生活”为代表的新零售方式正式步入太原人的生活日常
2026-01-06 20:06:00
2026成长新启示:张德芬《遇见未知的自己》解锁“爱你老己”,让自我陪伴成为终身底气
“亲爱的,外面没有别人,只有你自己。”张德芬在《遇见未知的自己》中写下的这句经典箴言,于2026年岁末年初再度引爆社交平台
2026-01-06 17:17:00
中国消费者报海口讯(记者董芳忠)近日,在海南省海口市举办的全国信标委人工智能分委会“标准周”活动期间,国内首张大模型高阶通用能力国家标准符合性测试证书正式颁发
2026-01-06 18:25:00
更名、AI巨头探访、股价大幅上涨,喜临门开门红!
近期,喜临门宣布更名“睡眠科技”,在资本市场与全球舆论场同步引发回响。国内市场方面,其股价稳步上扬并获资金持续买入,新年开盘第一个交易日打开涨停
2026-01-06 19:42:00
海尔三筒洗衣机越南热卖,夯实高端第一地位
海尔三筒洗衣机自10月登陆越南市场后,凭借独特设计与卓越性能迅速实现热卖。不仅赢得当地中产群体广泛认可,更推动在当地2000越南盾以上高端价位段实现0到13%的份额突破
2026-01-06 19:46:00
2026国家补贴已上线,河北廊坊消费者顺利签收省内冰箱国补首单
河北新闻网讯(记者 李春炜)2026年伊始,国家新一轮家电补贴政策于元旦起正式生效,各地消费者纷纷抓住机遇。其中,河北省廊坊市的王女士成为首批受益者
2026-01-06 17:06:00
乐佳善优品牌全指南:知名高端母婴营养品牌的成长与内核
乐佳善优,一个在中国母婴营养品领域深耕超过 16 年的知名品牌,凭借其 “专注营养,健康无忧”的核心理念,已成为众多中国家庭信赖的健康伙伴
2026-01-06 14:23:00
2026年初,人工智能已不再只是科技圈的热词,而是加速渗透进千行百业的真实生产力工具。据多家研究机构预测,今年将成为AI应用“规模化落地”的元年——企业对AI的需求正从“要不要用”转向“怎么用好”
2026-01-06 14:46:00
长白时评评论员 唐小兰当车厘子零售价从每斤数百元跌至百元以内,消费者在社交媒体上欢呼“车厘子自由”的同时,一种新的烦恼正在蔓延——价格是下来了
2026-01-06 15:59:00
随着生成式AI技术全面重塑信息检索生态,企业如何在新型搜索场景中有效触达目标受众,已成为区域经济发展中的重要课题。以山东同风起信息科技有限公司为代表的优秀山东GEO优化企业
2026-01-06 16:09:00
激活情感IP 1314爱购节北京启幕新质消费新范式
1月3日至1月4日,为响应国家扩大内需、培育新质消费战略,由中国通信工业协会指导、中国通信工业协会平台经济创新专委会主办
2026-01-06 16:14:00