• 我的订阅
  • 科技

对话王小川:国内在技术理想上拼不过OpenAI,但应用落地会跑得更快

类别:科技 发布时间:2023-08-09 15:00:00 来源:搜狐科技
对话王小川:国内在技术理想上拼不过OpenAI,但应用落地会跑得更快

出品 | 搜狐科技

作者 | 梁昌均

6月15日、7月11日、8月8日。这是王小川自4月10日官宣创办百川智能入局AI大模型创业以来,先后推出三个大模型的时间。

过去的四个月里,百川智能的团队已增加到110多人,且先后推出7B、13B和53B三个不同参数规模的大模型,速度之快超出外界想象。

Baichuan-53B是王小川昨日发布的新一代大模型,它在预训练数据、搜索增强、对齐能力等方面进行了优化。王小川称,这是一款通用大模型,在文本创作等文科能力上表现突出。

但不同于之前开源的7B、13B,王小川表示,从53B大模型之后就不再开源,因为部署成本较高。目前,这款模型已开启内测,下个月会开放API,甚至开放组件,优先把2B的服务做起来。

王小川透露,此前开源的7B和13B模型已有超过150家企业申请使用。对于为何要先做开源,王小川对搜狐科技解释称,开源一定程度是营销行为,可以后发制人,同时开源也是为商业化做储备,有各种用途和生态后,就有了收费的可能。

同时他判断,可能未来80%的企业都会用开源模型,闭源能力强,但成本非常高,而开源模型在很多地方非常好用。“开源闭源不是竞争关系,而是不同场景下的互补的关系。”

随着百川智能继续做更大规模的闭源模型,也会面临不少挑战。王小川表示,需要把模型做得足够好,同时要把推理成本降下来。“这是世界性难题,作为新手还要摸索,但我们有能力做到极致优化。”

在算力层面,王小川表示国产芯片一定要顶上来,光英伟达还不够,这是整个行业面临的问题。他透露,目前百川智能的算力是通过云厂商实现,腾讯、阿里都在为其提供云服务。

“我们说要做到中国最好的对标 GPT 的模型,这意味着对于预训练模型的追求不会停止,未来还会继续去做更大的模型。”王小川表示,百川智能既要做更大参数模型,后面还要做出差异化。

此前7月底,王小川的前合作伙伴洪涛加盟百川智能。王小川表示,这来代表公司在商业层面开始布局。“不管7B还是13B,还是53B,更多是为2B行业做准备,团队也已经部署2C的超级应用,且未来不只有一款。”

而在今年6月考察了美国后,王小川也将百川智能的发展策略从“理想上比OpenAI慢半步,落地上快半步”改成“理想上慢一步,落地上快三步”。他认为,国内在技术理想上拼不过OpenAI,国内离GPT-4都有距离,但应用落地会跑得更快。

对于目前的百模大战,王小川依然相信未来的五张船票会有百川智能的一席之地。他表示,钱非常重要,但最终决定能力的还是人才团队,尤其是组织能力,钱、组织能力是关键。据他透露,百川智能初始估值5亿美金,第二轮可能就是10亿美金,目前融资也非常顺利。

“大厂钱多、人多、算力多,但组织效率不一定够好。组织效率对我们不是挑战,也有大厂相对完整的经验,如果钱能保证的话,能力会很强。”王小川表示,中国谁能做最好的大模型现在没有结论,还无法确定大厂小厂谁能取胜,做应用也是,都有争取的机会。

以下是媒体对话节选(经编辑整理)

谈开源:53B大模型后闭源,未来80%的企业都会用到开源

媒体:此前发布的7B和13B开源大模型落地应用情况怎么样?

王小川:我们是新兵,作为后发者进入市场,开源对我们来讲,能给中国的开源生态作一些贡献,同时展现我们的技术实力,开源后只要持续不断技术迭代,就会有自己的商业模式。

现在有超过150家企业申请使用百川模型,很多都是行业头部企业。商业化工作也会开展起来,借助开源引擎,还有更好的参数模型,以及整套组件也在研发当中,能统一提供部署。

媒体:有观点称,今天在国内做开源带有营销的目的,百川为什么要先做开源?

王小川:开源应该有几层意义。第一层就是营销行为,要告诉我行不行,有用没用,后发者可以后发制人,更容易使朋友多多,能够让大家迅速去评测了解。第二层的话,开源有时是为了商业化做储备,有了各种用途和生态之后,就有了收费的可能。这在国外有探索,中国虽然之前不成功,但依然可以借鉴。

媒体:OpenAI的GPT-1和GPT-2是开源,GPT-3之后就闭源,百川从开源走向闭源的标准是什么?

王小川:我觉得和模型大小相关,参数大的部署成本已经开始增加,这种情况下我们就选择走闭源。但原来说开源是开放论文、代码,GPT-1和GPT-2就是这样,让别人去复刻,我们只是开放模型的能力,让B端都能够用到,和OpenAI是不一样的模式。

媒体:百川现在既有开源也有闭源的大模型,开源和闭源未来会是怎样的应用前景?

王小川:从2B角度看,开源闭源都需要。我们认为可能未来80%的企业会用到开源模型,闭源没办法对场景做特别好的适配,能力是强,但成本非常高。但开源模型可以做到非常小巧,很多地方非常好用。开源闭源不是竞争关系,而是不同场景下的互补的关系。我们更关心2C怎么做,2B怎么做,而不是纠结开源闭源的问题,这个共识在逐步形成当中。

媒体:闭源成本很高,怎么能有竞争力?

王小川:主要是两个事,一是把模型做得足够好,拼的是模型的能力。二是得把推理的成本降下来,这是世界性难题。作为新手还要摸索,把闭源的推理成本降下来。我们有能力做到极致优化,其他人能做到我们也能,甚至做得更好。

谈落地:B端C端都会布局,有信心同时打好几场仗

媒体:现在是百模大战,竞争对手很多,公司落地应用的思路是什么?

王小川:我们认为一家公司不可能把所有赛道都做完。B端我们选择先做开源模型,B端企业和中间层的公司,做二次开发的公司,可以基于开源模型去适用场景,保持足够开放。

内部团队也开始部署C端的超级应用,思考如何追上GPT-4,能带来哪些C端应用,预计网信办发牌照放行的工作今年会放开。我们在两头都走得更远一点,OpenAI目前B端就是API调用,C端就是ChatGPT。

媒体:百川在商业化层面已经开始布局?跟火山引擎和合作能否理解成LLaMA和微软的合作?

王小川:洪涛过来代表我们在商业层面开始布局。我们做模型做得蛮快,在商业化上可能也会跑得挺快,每件事情都争取做得越快越好。闭源本身在2B里面也有服务,包括2C,多条线里面都有很多机会。我对团队过往的能力、经验有信心,能同时打好几场仗。

LLaMA通过微软云向全球企业提供服务,国内除了火山引擎,后面会看到阿里云、腾讯云也会有类似模式。美国只有微软在做,国内云厂商都会有类似战略,都会开放跟模型厂商合作。

谈算力:对模型的追求不会停止,国产算力要顶上

媒体:百川后面会用什么节奏做预训练,会不会用更多的资源做算力集群去提升模型能力?

王小川:预训练的能力,包括搜索的能力,强化的能力,能共同推动大模型的进步。从实操角度讲,搜索效果最明显,强化比较有难度,预训练是在提高模型的综合能力。

我们讲要做到中国最好的对标 GPT 的模型,这意味着对于预训练模型的追求不会停止,未来还会继续去做更大的模型。我们对于搜索和强化也有自己的技术追求,让我们既能做万亿参数,后面还能做出差异化。现在对标的就是OpenAI,那么大模型不可避免会出现同质化,后面就要看是否有独有的技术能力。

媒体:现在大模型的成本中,算力占到多大的比例?算力会是瓶颈吗?

王小川:算力分两部分,训练和推理。训练阶段算力成本挺贵,行业40%以上可能都得给算力。百川可能在40%到70%,包括GPU网络联通。中国要想解决好算力这件事,一定要有国产算力,光英伟达我觉得不够,这是整个行业的问题。我们目前的算力是通过云厂商实现,腾讯、阿里都在给我们提供云服务。

谈百模大战:技术理想不如OpenAI,无法确定谁能取胜

媒体:今年国内大模型这半年有通用也有垂直,整体水平怎么样?您也去了硅谷,他们怎么看?

王小川:今天不管是十家、百家、千家,最后一定看两件事,第一能否拿出足够好的AGI来,能否跟GPT-3.5、GPT-4比肩,现在大家都有距离,哪些企业能达到,现在很难去判断。第二能否做出超级应用来,大模型很烧钱,是否有超级应用场景也还看不清。

我6月去美国,是去感知和对话,了解他们的技术思路。第一个收获是对齐认知,之前大家是两套语言体系。第二个收获是他们做技术确实不错,但做应用的能力不行。去之前,我当时提“理想上比OpenAI慢半步,落地上快半步”,回来后改成“理想上慢一步,落地上快三步”。他们不是往落地方向走,国内技术理想确实拼不过,但落地上会跑得快。

媒体:创业公司在里面该怎么玩,钱是不是最重要的?

王小川:美国通用闭源大模型的几家头部已经定下来,OpenAI、Google等,资本也不会再去投。但中国谁能做最好的大模型现在并没有结论,大家都有争取的机会,现在还无法确定大厂小厂谁能取胜,做应用也是。

钱非常重要,但最终决定能力的还是人才团队,尤其是组织能力,所以钱、组织能力应该是关键环节。大厂钱多、人多、算力多,但组织效率不一定够好。组织效率对我们不是挑战性的事情,也有大厂相对完整的经验,如果钱能保证的话,我们的能力还是很强。

媒体:之前说大模型有五张船票,现在还有几张?

王小川:船票的话现在依然还是有5张,如果只有2张我们也会在这个船上。这5张并不扣除大公司,但创业者没有5张船票。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-08-09 17:45:16

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

王小川:大模型创业挺快乐,最好的大模型未必来自大厂
...潮中,王慧文成立的光年之外就在这里办公;而原搜狗CEO王小川,则将百川智能的创业地选在了与其一路之隔的赛尔大厦。站在这里,甚至可以看清对楼窗边的办公环境。不到一年时间,大模型
2023-08-17 17:45:00
让大模型“外挂硬盘”,百川智能发布新API系列,企业定制成本大大降低
...硬盘。而基于搜索增强技术推出的API系列,用百川智能CEO王小川的话来说:“就像硬盘一样,让大模型可以挂上外部知识库。”大模型成为AI时代的基础设施底座,已成为行业不少人的共
2023-12-21 15:32:00
王小川公布最新530亿百川大模型,阿里腾讯等超150家企业已使用
百川智能创始人兼CEO 王小川成立120天,王小川的大模型公司百川智能又有了新动作。钛媒体App获悉,8月8日下午,百川智能在北京发布530亿参数通用大模型Baichuan-53B
2023-08-09 15:00:00
GPT革命:王小川向左,Sam Altman向右|钛媒体焦点
...创业风潮。4月10日下午,身着橙色帽衫的搜狗公司创始人王小川,走进搜狐网络大厦二层一间近30平米的会议室,在这里他宣布了自己即将投入创业的大模型新项目,名叫“百川智能”,旨在
2023-04-14 14:00:00
被认可的大模型价格战
...一次大模型的“追星”现场。当天,杨植麟和百川智能CEO王小川、智谱AI CEO张鹏、面壁智能CEO李大海进行了一场尖峰对话。这是内行爱听的门道。两个场景,是中国AI市场由表及
2024-06-16 23:38:00
AI大模型诸神之战:总有人要成功,为什么不能是我们?
...技圈大佬争相加入大模型竞赛的境况,王慧文、李开复、王小川......一串串如雷贯耳的名字纷纷入局,经历了三年疫情之后,科技圈又迎来了久违的创业热潮。这些连续创业者们成名已久,
2023-04-13 10:35:00
ChatGPT一周年,机会在大厂还是小公司?
...、生活方式会有天翻地覆的变化。”百川智能创始人、CEO王小川在12月1日的2023腾讯ConTech大会中谈到。大会上
2023-12-07 09:42:00
【科技早报】比亚迪宣布第500万辆新能源汽车下线;环境减灾二号 06 星发射
...星4. 我国《匿名订阅通信服务技术规范》标准正式发布5. 王小川:国内在技术理想上拼不过OpenAI,但应用落地会跑得更快【大厂要闻】支付宝上线机票比价功能,已接入携程、飞
2023-08-10 10:00:00
王小川归来 跑步入局大模型创业
...了AI大模型的创业风潮。4月10日,淡出公众视线近两年的王小川,带着他的新公司“百川智能”亮相,正式宣布进入AI模型创业赛道。王小川被人熟知的,是他理科学霸和搜狗创始人的身份
2023-04-14 10:47:00
更多关于科技的资讯:
鲁网1月27日讯为助力制造业高质量发展,聚焦单项冠军企业及科创型企业发展需求,2025年以来,邮储银行滨州市分行通过专项政策倾斜
2026-01-27 16:56:00
故宫同款徐州造!“清洁神器”领跑全国细分赛道
新华报业・中国江苏网讯 能守护故宫、布达拉宫等文化地标御道洁净,也能攻克城市背街小巷精细化清洁难题,这些实力与口碑兼具的“清洁神器”
2026-01-27 16:59:00
为深入贯彻中央金融工作会议精神,落实党中央提振消费的决策部署,青岛银行紧扣居民消费升级与生活品质提升需求,2025年创新推出线上数字信贷品牌“青易融”
2026-01-27 14:33:00
硬核登场,焦点汇聚 星梭科技重磅亮相2026北京国际商业航天展
1月23日至25日,2026北京国际商业航天展览会在北京亦庄隆重举行。星梭科技(北京)有限公司(展位号A260)以全新姿态重磅登场
2026-01-27 14:33:00
近日,由中国医药新闻信息协会指导、健识局主办的2025第六届论健·年度星榜发布。抗流感1类创新药——玛硒洛沙韦片(商品名
2026-01-27 14:36:00
海外网1月27日电 据美国哥伦比亚广播公司1月26日报道,谷歌公司已同意支付6800万美元(约合人民币4.73亿元),以解决一项集体诉讼案
2026-01-27 14:45:00
欧洲超级食物营养理念兴起,Myowellness超级食物受到关注
近年来,随着消费者对天然饮食与日常营养管理的重视不断提升,以植物来源为核心的超级食物(SuperFood)逐渐在欧洲市场形成稳定的消费认知
2026-01-27 15:05:00
两会快评|给最好的创意搭配最强的算力
创意是创新的源头,算力是创新的助推器。两者双向奔赴,能够催生璀璨的创新之花。综合算力指数全国第一,13个大模型通过国家备案
2026-01-27 15:20:00
打造中国版Open Evidence,蚂蚁阿福 PC端上线DeepSearch功能
今日,蚂蚁阿福升级其 PC 端,并上线DeepSearch(深度搜索)功能打造中国版“Open Evidence”,免费为医生
2026-01-27 15:47:00
15省国补上线京东秒送,换新机最高立省1500元还有叠加优惠
河北新闻网讯(记者 李春炜)近日,京东旗下即时零售平台京东秒送宣布已全面承接2026年国补落地,北京、上海、广东、江苏
2026-01-27 16:03:00
孙小荣:2026,拥抱“液态旅游”的崛起
中国文旅产业正处在“百花齐放”与“激烈聚变”交织的关键阶段。一面是消费需求的多元爆发,一面是行业形态的深度重构。“乱花渐欲迷人眼”的表象下
2026-01-27 13:58:00
中国网1月27日讯 据国家安全部微信公众号消息,国安部发布提示:生物数据安全藏隐患,警惕生物数据跨国泄露。警惕这类数据跨国泄露跨国生物合作能有效整合全球资源
2026-01-27 11:52:00
橙友“飞舞精灵”向橙柿直通车反映:请问为啥把公交充值补登功能从原自行车租用点统一放到地铁内的杭州通自助服务机上呢?试想一下
2026-01-27 11:59:00
限量20名!贵州普瑞眼科全城招募EVO+ ICL(V5)首批摘镜体验官
多彩贵州网讯(本网记者 罗晟鸣)近日,记者从贵州普瑞眼科医院获悉,与欧美同步的第六代EVO+ICL(V5)晶体植入手术正式登陆贵州
2026-01-27 12:06:00
三墩镇后陡门,因“十个勤天”成为青年心中的“奋斗符号”。昨天,一场兼具青春活力与务实成效的创新招聘会在这里火热进行——“种地星球·2026禾伙人 新春offer见面会”通过“综艺IP+招聘服务”的创新模式
2026-01-27 12:29:00