• 我的订阅
  • 科技

对话IDEA张家兴:AI离成为普通人的工具就差一步|36氪专访

类别:科技 发布时间:2023-08-03 08:29:00 来源:36氪

文|林炜鑫

编辑|邓咏仪

ChatGPT打了一个共鸣的响指,大洋两岸的AI行业都为之震颤。短短几个月,许多知名人士宣布投身大模型创业,即便有人离AI很远,对大模型一知半解,也愿意拿出令人惊叹的热情和金钱,小步快跑挤进这条赛道。

“仿佛回到了10年前深度学习刚出来那会,”张家兴告诉36氪,“全社会各行各业积极拥抱新的技术。”

近期,36氪专访了这位科学家创业者,他坦言现在是自己职业生涯最兴奋的阶段,“我完整经历过深度学习从学术界诞生到产业界落地的技术周期,现在我感觉在经历第二个技术周期。”

张家兴是粤港澳大湾区数字经济研究院(IDEA研究院)认知计算与自然语言研究中心讲席科学家与负责人。加入IDEA研究院前,他先后就职于百度、阿里巴巴、360等大厂,带领团队进行AI相关的项目研究和技术落地。

两年前,张家兴加入IDEA研究院,开始带领团队做大模型的深入研究,是国内最早一批专注于预训练大模型的团队之一。他带领团队开源了第一个以中文为主的AI绘画模型“太乙”,还创建了名为“封神榜”的大模型开源计划,截止目前共开源超过100个模型。

作为行业专家,张家兴第一时间关注到ChatGPT的发布。他承认最初低估了GPT-3.5所带来的技术突破,直到团队上手体验,他的内心“受到很大的冲击”。

在他看来,颠覆性的变化在于,从过去强调模型结构创新,走向了强调训练方法创新。OpenAI为国内外同行指出一条明路:把通用大模型当作产品,引入更先进的训练方法,一遍遍打磨和调试。因此,训练方法将是大模型生产商的核心竞争优势。

对张家兴来说,大模型创业最难的环节不是资金和算力,而是人才。这不是单纯靠钱能解决的要素。在国内,AI学界和工业界存在一定程度的脱钩,学界诞生的前沿成果往往很难快速应用到工业界。“在青年研究者跟工程师之间,以前大家忽视了一层,是用工程能力做模型的人。”

在未来,各行各业都需要大模型——这已是显著的发展趋势。目前,很多公司还在调用通用大模型的API,但不是每家公司都有能力和资源去从零开始建大模型模型。“只有当每个公司拥有自己的大模型时,模型-场景的闭环才有可能得以成立,商业化实践才有可能获得成功,我想在中国将这层能力补齐,并打出影响力。”张家兴表示。

如今,张家兴的团队也在这条道路上进行实践——专注于生产垂直领域的大模型,并与各个行业的企业客户合作,帮助客户量身定制合适的模型,落地到具体应用场景中。

谈及AI发展的未来,张家兴是坚定的乐观派,他相信AI能帮助提高人类的数字生产力。接下来的十年,是属于生成式AI和通用式AI的。对普通人来说,学会利用AI工具,其实不是一件难事。

对话IDEA张家兴:AI离成为普通人的工具就差一步|36氪专访

张家兴

以下是36氪和张家兴的对话,经36氪编辑整理:

OpenAI证实了大模型的价值

36氪:2014年,其实你在深度学习领域已经发表了相当前沿的研究成果,当时想象过会出现ChatGPT这样的产品吗?

张家兴:2014年有一个技术叫LSTM(长短期记忆网络),在学术界出现了一些让人惊艳的成果。当时我印象很深刻的例子是,它可以直接生成一个网页代码,格式完全正确,网页也能展示。因此今天我们看到的生成式人工智能,其实在2014年已经看到了萌芽,但是在工业界迟迟无法落地。一个很重要的原因是,当年的模型规模太小,跟今天没法比。今天技术ready了,有更多更好的数据和算力,曾经我们寄予厚望的生成式模型终于实现了。

36氪:两年前,你就已经开始在IDEA研究院对大模型做深入研究了,当时,你对大模型的判断是怎么样的,学界对大模型的研究大概是什么状态?

张家兴:我对AI发展一直很乐观。两年前,随着GPT3的问世,我们已经认识到未来认知智能必须基于基础设施——预训练模型,做任何自然语言任务,都是要从预训练模型开始,不可能一切都是从零开始。

当时我组建认知计算与自然语言研究中心,就是生产预训练模型。跟现在不同的是,当时模型结构并没有像今天这样收敛到GPT这样的结构,当时还是百花齐放的状态。

36氪:那会你们做的预训练模型是什么样的?

张家兴:那个时候我们团队就在推出“封神榜”体系,“体系”这个词也意味着要做很多基础的训练模型,当时我们就是中文最大的开源体系。我们希望下游可以拿着我们的模型再进一步微调,实现他们具体场景中的应用。这件事情做了两年,开源了接近100个预训练模型,直到ChatGPT的出现,打破了传统模型的效果。

36氪:技术层面,ChatGPT具体最让你感到惊讶或震撼的是什么?

张家兴:令我很惊讶的还是在基于一定知识之下,它可以进行复杂的推理,得出正确的结论。

此前我们有两大很难解决的问题。一个是知识的结构化,为此耗费了巨大人力,也难以保障准确率,维护成本也很高。现在只要对包含知识的文本做预训练,就能让大模型真的去理解、记住这些知识。

另一个是推理,之前我们认为推理需要通过符号系统再加上结构化的知识才能实现,而今天我们看到,ChatGPT可以完全通过自然语言的训练,并未显示出现符号和知识就具备这个能力,颠覆了我们对这个问题的认知。

36氪:具体来说,OpenAI推动的最重要的技术变化是什么?

张家兴:终于从过于强调模型结构创新走向了强调训练方法创新。训练方法变得更重要起来了。

ChatGPT4模型跟两年前的GPT3模型结构是一模一样的,但是为什么效果就提升了这么大?因为这里面引入了很多更先进的训练方法,比如说指定微调,让机器更懂得人类的指令;比如人类反馈学习,能够调整模型的偏好,全都是训练方法上的创新。

我们团队目前也将这些创新性训练方法应用于模型训练过程,实际应用证明,这些方法确实能够显著提升模型的表现。因此,我们深刻认识到,训练方法的创新在实现更强大的AI系统中起到了关键性作用。即使把模型结构开源了,但训练方法是你藏起来的核心竞争力,这也使得在这个时代做通用模型训练这件事情有商业价值。

同时,OpenAI也让大家认识到,不要追求用一次性的训练就能得到一个效果很好的模型。模型效果提升是靠一遍又一遍的打磨,不断的迭代升级。

36氪:这是不是意味着把模型当成产品?

张家兴:对,当我的模型进行一次训练迭代,我会看到模型的优点跟缺点,针对缺点,我找补救的方法,再继续进行训练,当所有的缺陷都补齐,优点都加强之后,模型就变成今天大家看到的样子。我们团队当下在做的姜子牙大模型就在持续地作为产品打磨,接下来也会不停地进行版本升级。

36氪:OpenAI刚起步时,因为技术路线比较小众,创始人Sam Altman回忆说他们遭受到很多白眼。你刚开始做IDEA的时候,当时国内行业氛围是怎么样的?

张家兴:当时,这个领域(预训练大模型)没有那么受重视,因为大家传统的思路都是AI的价值一定要跟某个行业结合,一定要有直接在具体场景中的产业落地。我们只生产预训练模型,可能别人不理解,觉得通用的东西又有什么用呢?

但是ChatGPT的出现,让大家知道一个做通用模型的公司,在整个产业生态中具有非常重要的价值。AI产业需要有上下游这样的生态体系,而不是每一家都自己去垂直造烟筒——从预训练模型到产业落地,恨不得把一整个系统都做出来。

OpenAI证实了大模型的价值,我们做这个事情的价值也终于得到证实。

36氪:现阶段去追赶OpenAI,做出一个跟ChatGPT差不多的东西,还有没有意义?

张家兴:还是有意义的。OpenAI这样提供一个超级大模型,一个通用API,指望大家来调用,这不是产业落地的唯一方式。很多商业公司有需求针对自己场景的定制化模型,但又没办法从头去做这件事情,代价太大,就需要生产通用大模型的公司来帮助他们。

36氪:这也就是你们团队要做的事情?

张家兴:我们具备了生产通用大模型的能力,还能给用户提供一些工具,帮助用户基于我们的模型继续生产他们垂直应用场景里的模型,再通过这种方式就能够让用户的模型跟场景形成迭代。我认为这是这是接下来大模型能够商业化成功的关键。

让模型落地到场景中,是商业化的关键

36氪:相信你最近的工作状态特别忙碌,能跟我们说说你的一天怎么过的吗?

张家兴:我的一天,一方面是跟团队研究探讨最前沿的技术问题,另一方面现在会见大量的客户,主要也听听大家想拿大模型做什么,这样好让我们的通用模型去提供大家所需要的能力。

比如,我们接下来会开源各个不同侧重能力的模型,也是因为发现每个客户对于大模型的需求不同。通过这些开源模型,我们希望能推动中国AGI的应用层迸发。

36氪:两年间,“封神榜”开源体系已经推出了近百个开源模型。你的团队最近刚刚开源了130亿参数的通用模型“姜子牙”,这个大模型具体是怎么样的?

张家兴:“姜子牙”是我们针对通用大模型推出的新开源系列,而第一个开源的“姜子牙”通用大模型v1也是我们封神榜开源系列的第99个开源模型。

在最新的SuperCLUE测评榜单中,我们的姜子牙v-1的测评结果也是开源模型里的第一。接下来,我们还会侧重各种能力开源不同的模型,比如多模态模型就会在本周推出。

36氪:目前企业对于大模型的需求,都有哪些?

张家兴:我接触的这些企业几乎横跨了所有领域。比较典型的是这几件事情:第一是生成文章和代码。第二是对文本做完全开放式、预先不设定具体任务、精准的理解。第三就是推理类的,比如说我要做一道题,能不能提示这个问题怎么解决。

36氪:大模型比较理想的商业模式,应该是怎么样的?

张家兴:根据以往经验,很多商业成功需要一个商业实体(如公司、团队和机构等),在技术产品的基础上建立应用场景,形成迭代的闭环。在这一闭环的生态里,更好的产品技术会吸引更多的用户和数据,产品和技术得以迭代更新、变得更好。

但在AI产业,目前很多公司还在调用通用大模型的API,无法建立闭环,大模型的商业化进程缓步不前。只有当每个公司拥有自己的大模型时,模型-场景的闭环才有可能得以成立,商业化实践才有可能获得成功。

我们团队的目标就是,用通用大模型去帮助每个企业甚至每个个人,让他们能够拥有并不断优化自己的大模型,和应用场景形成闭环,在商业化道路上走得更好。

36氪:商业化这个事情,会如何改变整个AI产业?

张家兴:未来的AI产业一定是巨大生态体系,既有处于下游的各个企业在各自场景中引用大模型技术,又有处于上游的模型生产商为整个生态提供预训练模型。云厂家和解决方案公司也在整个生态系统中扮演重要的角色。

36氪:你之前在大厂也有过多年的技术转化业务落地的经验,现在在 IDEA研究院进行科研转化的实践。从科研到转化落地中,你有哪些想分享的体会?

张家兴:如果作为科学家,更多的精力会放在前沿技术的思考和解决问题的创新上,会比较少去关注具体这个技术如何能给市场和社会带来价值,以及能带来多大的价值。

而作为科学家创业者,则更需要去关注市场的需求。从技术的前沿创新研究到最后的落地市场商业化,有很多鸿沟需要跨越,包括了解市场,了解客户,了解实现落地的每一步。我相信每一位科学家都有一个自己的梦想,而如何将这个梦想实现出来,是创业家需要去完成,也是现在特别让我兴奋的一个角色。

36氪:做大模型的几个核心要素:算力、人才、数据等等,从难到易,你会怎么排序?

张家兴:我认为最困难的是人才,目前在国内做大模型的团队还是稀缺资源。算力实际上只要有资本的认可、有钱,就会有。数据虽然需要长时间积累,但它是线性增长,有多少投入就有多少数据。人才不是单纯用钱可以解决的,并且还需要很长时间的积累。我们团队也是基于通过生产近百个大模型,才逐渐磨合出来的。

36氪:当下,AI人才的竞争是否已经到了一个白热化的程度?

张家兴:可能会有这样的趋势。但从另一个方面来说,大模型团队的建设不仅仅是把人聚在一起,还需要一个好的方式把大家组织好做好模型。

AI离成为普通人的工具就差一步

36氪:现阶段的AI研究进度会使你感到害怕吗?

张家兴:我对AI对社会的影响一直比较乐观。AI发展减少一些工作机会的同时也创造出更多工作机会,甚至它创造的工作机会正好适合于那些可能丢了工作的人。

以我们算法工程师为例,曾经我们每个人都是垂直造烟筒,什么都做。现在AI产业有上下游的健全的生态体系,那么算法工程师必然会分层,有些在做上游的预训练模型,有些拿着预训练模型,基于上游提供的工具,在做下游的更广泛的落地。下游对算法工程师的需求量会更大,所以说AI创造了更多的就业机会。

从宏观来说,AI为社会创造更多数字生产力。现在世界的人口可能走向稳定,甚至人口会减少,但是美好生活需要有更多生产力,我们就靠通用人工智能增加更多数字生产力。

36氪:今年三月你公开表示,将来10年是属于生成式AI和通用式AI。对我们普通人来说,将来10年应该做好什么准备?

张家兴:对于普通人来说,就是要学会怎么利用AI的工具,这是对每个人都有用的。另外一点,作为具体在每个场景中的人要努力去想,在我的场景中,我该如何积极拥抱AI的技术,然后对我的场景进行AI升级。

36氪:一个不懂AI的人,是否有可能被淘汰?

张家兴:未来只要会用AI工具的人,就不会被淘汰,使用AI工具其实并不是一件难的事情。 所以我希望大家都要积极拥抱AI,把它作为提升自己生产力的工具。

36氪:你觉得现在我们已经进入AGI时代了吗?学术界可能还有一些争论。

张家兴:我认为这个叫做AGI时代1.0。其实是如何理解“通用”这个词,现在终于有一个模型可以具备所有的能力,这已经是一种通用。

36氪:你认为,下一次AGI的突破会是什么?

张家兴:AGI当下表现出来的是特征,是用自然语言来交互,但还欠缺的能力是自然语言学习。如果未来AGI模型都跟人一样,通过自然语言就能教会它各种知识技能,那么它就会真的变成普通人的AI工具。在更远的未来,或许AGI可以像人一样融入社会,跟人类一起交流、学习、成长。

欢迎交流

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-08-03 11:45:25

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

用GPT提效,这个产品要用AI生成爆款小红书笔记|我爱黑「可颂」路演项目专访
...降本的。”由GPT所带来的工具创造了现象级的AI 应用,让普通人使用 AIGC 的门槛逐渐降低,AI 的通用落地性也大大提升
2023-12-21 15:32:00
谁能最早看见AIGC的未来?专访昆仑万维董事长兼CEO方汉丨文娱行业AI巡礼
...平台Club Koala 也即将上市。近日,娱乐资本论·视智未来专访昆仑万维董事长兼CEO方汉,深入探讨了公司在AI方面的最新动向及未来愿景
2023-10-12 17:44:00
2023服贸会|专访百融云创陈昀彰:“模型-行业理解-应用”决定大模型企业的成败
...司(以下简称“百融云创”)AI创新负责人陈昀彰进行了专访。陈昀彰直言,当前大模型应用还存在诸多难点,提升算力、优化算法等技术手段之外,从业机构还需要充分的行业Know-how
2023-09-06 10:42:00
作为一家16岁AI公司的董事长,思必驰创始人高始兴在今年初第一次使用ChatGPT时依旧难掩惊艳,“至少,发言稿可以不用专人写作了。”然而,伴随惊艳而来的,还有当时外界对几乎所有
2023-07-27 11:54:00
36氪专访 | 来也科技CTO胡一川:大语言模型让RPA涅槃
过去两年,企服赛道颇为动荡,但RPA始终保持超快的进化速度。2022年RPA市场同比由23亿美元增长到28亿美元,尽管增速在放缓,但依然远超全球软件市场11%的平均增长率。去年下
2023-09-06 09:43:00
大模型助力健康管理,通过认知行为疗法改变知易行难|我爱黑「可颂」路演项目专访
“腰间的赘肉咔咔掉,人鱼线马甲线我想要。”无论你是否跟着刘畊宏跳过健身操,你一定听过这一句台词。后疫情时代,大众的健康意识进一步提高,具体表现为从过去的寻医问药转向更为全面的健康
2023-12-05 19:57:00
用大模型生成Lofi音乐,这款应用要做年轻人的情绪「疗养剂」|我爱黑「可颂」路演项目专访
相较于主流音乐所追求的高保真、高质量,Lofi(Low Fidelity:低保真)音乐正在成为年轻人心灵疗愈的良方。在上世纪五十年代,受限于当时的音乐录制设备和场地要求,一些音乐
2023-12-14 19:02:00
...新华社新华社北京2月14日电 题:AIGC应用持续升温,将给普通人生活带来哪些改变?新华社“新华视点”记者近日,AIGC——即人工智能生成内容,再一次引发公众关注:一款名为C
2023-02-15 09:21:00
对话美图创始人吴欣鸿:“妙鸭们”昙花一现,我们要做中国的Midjourney | 36氪专访
文 | 周鑫雨编辑 | 邓咏仪怎么才能做出爆款?这个问题放在15年前,美图公司创始人、董事长兼CEO吴欣鸿会快速给出答案:接地气、档期、精气神。总结“美图秀秀”在2008年成为“
2023-10-20 09:36:00
更多关于科技的资讯: