• 我的订阅
  • 科技

对话IDEA张家兴:AI离成为普通人的工具就差一步|36氪专访

类别:科技 发布时间:2023-08-03 08:29:00 来源:36氪

文|林炜鑫

编辑|邓咏仪

ChatGPT打了一个共鸣的响指,大洋两岸的AI行业都为之震颤。短短几个月,许多知名人士宣布投身大模型创业,即便有人离AI很远,对大模型一知半解,也愿意拿出令人惊叹的热情和金钱,小步快跑挤进这条赛道。

“仿佛回到了10年前深度学习刚出来那会,”张家兴告诉36氪,“全社会各行各业积极拥抱新的技术。”

近期,36氪专访了这位科学家创业者,他坦言现在是自己职业生涯最兴奋的阶段,“我完整经历过深度学习从学术界诞生到产业界落地的技术周期,现在我感觉在经历第二个技术周期。”

张家兴是粤港澳大湾区数字经济研究院(IDEA研究院)认知计算与自然语言研究中心讲席科学家与负责人。加入IDEA研究院前,他先后就职于百度、阿里巴巴、360等大厂,带领团队进行AI相关的项目研究和技术落地。

两年前,张家兴加入IDEA研究院,开始带领团队做大模型的深入研究,是国内最早一批专注于预训练大模型的团队之一。他带领团队开源了第一个以中文为主的AI绘画模型“太乙”,还创建了名为“封神榜”的大模型开源计划,截止目前共开源超过100个模型。

作为行业专家,张家兴第一时间关注到ChatGPT的发布。他承认最初低估了GPT-3.5所带来的技术突破,直到团队上手体验,他的内心“受到很大的冲击”。

在他看来,颠覆性的变化在于,从过去强调模型结构创新,走向了强调训练方法创新。OpenAI为国内外同行指出一条明路:把通用大模型当作产品,引入更先进的训练方法,一遍遍打磨和调试。因此,训练方法将是大模型生产商的核心竞争优势。

对张家兴来说,大模型创业最难的环节不是资金和算力,而是人才。这不是单纯靠钱能解决的要素。在国内,AI学界和工业界存在一定程度的脱钩,学界诞生的前沿成果往往很难快速应用到工业界。“在青年研究者跟工程师之间,以前大家忽视了一层,是用工程能力做模型的人。”

在未来,各行各业都需要大模型——这已是显著的发展趋势。目前,很多公司还在调用通用大模型的API,但不是每家公司都有能力和资源去从零开始建大模型模型。“只有当每个公司拥有自己的大模型时,模型-场景的闭环才有可能得以成立,商业化实践才有可能获得成功,我想在中国将这层能力补齐,并打出影响力。”张家兴表示。

如今,张家兴的团队也在这条道路上进行实践——专注于生产垂直领域的大模型,并与各个行业的企业客户合作,帮助客户量身定制合适的模型,落地到具体应用场景中。

谈及AI发展的未来,张家兴是坚定的乐观派,他相信AI能帮助提高人类的数字生产力。接下来的十年,是属于生成式AI和通用式AI的。对普通人来说,学会利用AI工具,其实不是一件难事。

对话IDEA张家兴:AI离成为普通人的工具就差一步|36氪专访

张家兴

以下是36氪和张家兴的对话,经36氪编辑整理:

OpenAI证实了大模型的价值

36氪:2014年,其实你在深度学习领域已经发表了相当前沿的研究成果,当时想象过会出现ChatGPT这样的产品吗?

张家兴:2014年有一个技术叫LSTM(长短期记忆网络),在学术界出现了一些让人惊艳的成果。当时我印象很深刻的例子是,它可以直接生成一个网页代码,格式完全正确,网页也能展示。因此今天我们看到的生成式人工智能,其实在2014年已经看到了萌芽,但是在工业界迟迟无法落地。一个很重要的原因是,当年的模型规模太小,跟今天没法比。今天技术ready了,有更多更好的数据和算力,曾经我们寄予厚望的生成式模型终于实现了。

36氪:两年前,你就已经开始在IDEA研究院对大模型做深入研究了,当时,你对大模型的判断是怎么样的,学界对大模型的研究大概是什么状态?

张家兴:我对AI发展一直很乐观。两年前,随着GPT3的问世,我们已经认识到未来认知智能必须基于基础设施——预训练模型,做任何自然语言任务,都是要从预训练模型开始,不可能一切都是从零开始。

当时我组建认知计算与自然语言研究中心,就是生产预训练模型。跟现在不同的是,当时模型结构并没有像今天这样收敛到GPT这样的结构,当时还是百花齐放的状态。

36氪:那会你们做的预训练模型是什么样的?

张家兴:那个时候我们团队就在推出“封神榜”体系,“体系”这个词也意味着要做很多基础的训练模型,当时我们就是中文最大的开源体系。我们希望下游可以拿着我们的模型再进一步微调,实现他们具体场景中的应用。这件事情做了两年,开源了接近100个预训练模型,直到ChatGPT的出现,打破了传统模型的效果。

36氪:技术层面,ChatGPT具体最让你感到惊讶或震撼的是什么?

张家兴:令我很惊讶的还是在基于一定知识之下,它可以进行复杂的推理,得出正确的结论。

此前我们有两大很难解决的问题。一个是知识的结构化,为此耗费了巨大人力,也难以保障准确率,维护成本也很高。现在只要对包含知识的文本做预训练,就能让大模型真的去理解、记住这些知识。

另一个是推理,之前我们认为推理需要通过符号系统再加上结构化的知识才能实现,而今天我们看到,ChatGPT可以完全通过自然语言的训练,并未显示出现符号和知识就具备这个能力,颠覆了我们对这个问题的认知。

36氪:具体来说,OpenAI推动的最重要的技术变化是什么?

张家兴:终于从过于强调模型结构创新走向了强调训练方法创新。训练方法变得更重要起来了。

ChatGPT4模型跟两年前的GPT3模型结构是一模一样的,但是为什么效果就提升了这么大?因为这里面引入了很多更先进的训练方法,比如说指定微调,让机器更懂得人类的指令;比如人类反馈学习,能够调整模型的偏好,全都是训练方法上的创新。

我们团队目前也将这些创新性训练方法应用于模型训练过程,实际应用证明,这些方法确实能够显著提升模型的表现。因此,我们深刻认识到,训练方法的创新在实现更强大的AI系统中起到了关键性作用。即使把模型结构开源了,但训练方法是你藏起来的核心竞争力,这也使得在这个时代做通用模型训练这件事情有商业价值。

同时,OpenAI也让大家认识到,不要追求用一次性的训练就能得到一个效果很好的模型。模型效果提升是靠一遍又一遍的打磨,不断的迭代升级。

36氪:这是不是意味着把模型当成产品?

张家兴:对,当我的模型进行一次训练迭代,我会看到模型的优点跟缺点,针对缺点,我找补救的方法,再继续进行训练,当所有的缺陷都补齐,优点都加强之后,模型就变成今天大家看到的样子。我们团队当下在做的姜子牙大模型就在持续地作为产品打磨,接下来也会不停地进行版本升级。

36氪:OpenAI刚起步时,因为技术路线比较小众,创始人Sam Altman回忆说他们遭受到很多白眼。你刚开始做IDEA的时候,当时国内行业氛围是怎么样的?

张家兴:当时,这个领域(预训练大模型)没有那么受重视,因为大家传统的思路都是AI的价值一定要跟某个行业结合,一定要有直接在具体场景中的产业落地。我们只生产预训练模型,可能别人不理解,觉得通用的东西又有什么用呢?

但是ChatGPT的出现,让大家知道一个做通用模型的公司,在整个产业生态中具有非常重要的价值。AI产业需要有上下游这样的生态体系,而不是每一家都自己去垂直造烟筒——从预训练模型到产业落地,恨不得把一整个系统都做出来。

OpenAI证实了大模型的价值,我们做这个事情的价值也终于得到证实。

36氪:现阶段去追赶OpenAI,做出一个跟ChatGPT差不多的东西,还有没有意义?

张家兴:还是有意义的。OpenAI这样提供一个超级大模型,一个通用API,指望大家来调用,这不是产业落地的唯一方式。很多商业公司有需求针对自己场景的定制化模型,但又没办法从头去做这件事情,代价太大,就需要生产通用大模型的公司来帮助他们。

36氪:这也就是你们团队要做的事情?

张家兴:我们具备了生产通用大模型的能力,还能给用户提供一些工具,帮助用户基于我们的模型继续生产他们垂直应用场景里的模型,再通过这种方式就能够让用户的模型跟场景形成迭代。我认为这是这是接下来大模型能够商业化成功的关键。

让模型落地到场景中,是商业化的关键

36氪:相信你最近的工作状态特别忙碌,能跟我们说说你的一天怎么过的吗?

张家兴:我的一天,一方面是跟团队研究探讨最前沿的技术问题,另一方面现在会见大量的客户,主要也听听大家想拿大模型做什么,这样好让我们的通用模型去提供大家所需要的能力。

比如,我们接下来会开源各个不同侧重能力的模型,也是因为发现每个客户对于大模型的需求不同。通过这些开源模型,我们希望能推动中国AGI的应用层迸发。

36氪:两年间,“封神榜”开源体系已经推出了近百个开源模型。你的团队最近刚刚开源了130亿参数的通用模型“姜子牙”,这个大模型具体是怎么样的?

张家兴:“姜子牙”是我们针对通用大模型推出的新开源系列,而第一个开源的“姜子牙”通用大模型v1也是我们封神榜开源系列的第99个开源模型。

在最新的SuperCLUE测评榜单中,我们的姜子牙v-1的测评结果也是开源模型里的第一。接下来,我们还会侧重各种能力开源不同的模型,比如多模态模型就会在本周推出。

36氪:目前企业对于大模型的需求,都有哪些?

张家兴:我接触的这些企业几乎横跨了所有领域。比较典型的是这几件事情:第一是生成文章和代码。第二是对文本做完全开放式、预先不设定具体任务、精准的理解。第三就是推理类的,比如说我要做一道题,能不能提示这个问题怎么解决。

36氪:大模型比较理想的商业模式,应该是怎么样的?

张家兴:根据以往经验,很多商业成功需要一个商业实体(如公司、团队和机构等),在技术产品的基础上建立应用场景,形成迭代的闭环。在这一闭环的生态里,更好的产品技术会吸引更多的用户和数据,产品和技术得以迭代更新、变得更好。

但在AI产业,目前很多公司还在调用通用大模型的API,无法建立闭环,大模型的商业化进程缓步不前。只有当每个公司拥有自己的大模型时,模型-场景的闭环才有可能得以成立,商业化实践才有可能获得成功。

我们团队的目标就是,用通用大模型去帮助每个企业甚至每个个人,让他们能够拥有并不断优化自己的大模型,和应用场景形成闭环,在商业化道路上走得更好。

36氪:商业化这个事情,会如何改变整个AI产业?

张家兴:未来的AI产业一定是巨大生态体系,既有处于下游的各个企业在各自场景中引用大模型技术,又有处于上游的模型生产商为整个生态提供预训练模型。云厂家和解决方案公司也在整个生态系统中扮演重要的角色。

36氪:你之前在大厂也有过多年的技术转化业务落地的经验,现在在 IDEA研究院进行科研转化的实践。从科研到转化落地中,你有哪些想分享的体会?

张家兴:如果作为科学家,更多的精力会放在前沿技术的思考和解决问题的创新上,会比较少去关注具体这个技术如何能给市场和社会带来价值,以及能带来多大的价值。

而作为科学家创业者,则更需要去关注市场的需求。从技术的前沿创新研究到最后的落地市场商业化,有很多鸿沟需要跨越,包括了解市场,了解客户,了解实现落地的每一步。我相信每一位科学家都有一个自己的梦想,而如何将这个梦想实现出来,是创业家需要去完成,也是现在特别让我兴奋的一个角色。

36氪:做大模型的几个核心要素:算力、人才、数据等等,从难到易,你会怎么排序?

张家兴:我认为最困难的是人才,目前在国内做大模型的团队还是稀缺资源。算力实际上只要有资本的认可、有钱,就会有。数据虽然需要长时间积累,但它是线性增长,有多少投入就有多少数据。人才不是单纯用钱可以解决的,并且还需要很长时间的积累。我们团队也是基于通过生产近百个大模型,才逐渐磨合出来的。

36氪:当下,AI人才的竞争是否已经到了一个白热化的程度?

张家兴:可能会有这样的趋势。但从另一个方面来说,大模型团队的建设不仅仅是把人聚在一起,还需要一个好的方式把大家组织好做好模型。

AI离成为普通人的工具就差一步

36氪:现阶段的AI研究进度会使你感到害怕吗?

张家兴:我对AI对社会的影响一直比较乐观。AI发展减少一些工作机会的同时也创造出更多工作机会,甚至它创造的工作机会正好适合于那些可能丢了工作的人。

以我们算法工程师为例,曾经我们每个人都是垂直造烟筒,什么都做。现在AI产业有上下游的健全的生态体系,那么算法工程师必然会分层,有些在做上游的预训练模型,有些拿着预训练模型,基于上游提供的工具,在做下游的更广泛的落地。下游对算法工程师的需求量会更大,所以说AI创造了更多的就业机会。

从宏观来说,AI为社会创造更多数字生产力。现在世界的人口可能走向稳定,甚至人口会减少,但是美好生活需要有更多生产力,我们就靠通用人工智能增加更多数字生产力。

36氪:今年三月你公开表示,将来10年是属于生成式AI和通用式AI。对我们普通人来说,将来10年应该做好什么准备?

张家兴:对于普通人来说,就是要学会怎么利用AI的工具,这是对每个人都有用的。另外一点,作为具体在每个场景中的人要努力去想,在我的场景中,我该如何积极拥抱AI的技术,然后对我的场景进行AI升级。

36氪:一个不懂AI的人,是否有可能被淘汰?

张家兴:未来只要会用AI工具的人,就不会被淘汰,使用AI工具其实并不是一件难的事情。 所以我希望大家都要积极拥抱AI,把它作为提升自己生产力的工具。

36氪:你觉得现在我们已经进入AGI时代了吗?学术界可能还有一些争论。

张家兴:我认为这个叫做AGI时代1.0。其实是如何理解“通用”这个词,现在终于有一个模型可以具备所有的能力,这已经是一种通用。

36氪:你认为,下一次AGI的突破会是什么?

张家兴:AGI当下表现出来的是特征,是用自然语言来交互,但还欠缺的能力是自然语言学习。如果未来AGI模型都跟人一样,通过自然语言就能教会它各种知识技能,那么它就会真的变成普通人的AI工具。在更远的未来,或许AGI可以像人一样融入社会,跟人类一起交流、学习、成长。

欢迎交流

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-08-03 11:45:25

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

用GPT提效,这个产品要用AI生成爆款小红书笔记|我爱黑「可颂」路演项目专访
...降本的。”由GPT所带来的工具创造了现象级的AI 应用,让普通人使用 AIGC 的门槛逐渐降低,AI 的通用落地性也大大提升
2023-12-21 15:32:00
谁能最早看见AIGC的未来?专访昆仑万维董事长兼CEO方汉丨文娱行业AI巡礼
...平台Club Koala 也即将上市。近日,娱乐资本论·视智未来专访昆仑万维董事长兼CEO方汉,深入探讨了公司在AI方面的最新动向及未来愿景
2023-10-12 17:44:00
2023服贸会|专访百融云创陈昀彰:“模型-行业理解-应用”决定大模型企业的成败
...司(以下简称“百融云创”)AI创新负责人陈昀彰进行了专访。陈昀彰直言,当前大模型应用还存在诸多难点,提升算力、优化算法等技术手段之外,从业机构还需要充分的行业Know-how
2023-09-06 10:42:00
作为一家16岁AI公司的董事长,思必驰创始人高始兴在今年初第一次使用ChatGPT时依旧难掩惊艳,“至少,发言稿可以不用专人写作了。”然而,伴随惊艳而来的,还有当时外界对几乎所有
2023-07-27 11:54:00
36氪专访 | 来也科技CTO胡一川:大语言模型让RPA涅槃
过去两年,企服赛道颇为动荡,但RPA始终保持超快的进化速度。2022年RPA市场同比由23亿美元增长到28亿美元,尽管增速在放缓,但依然远超全球软件市场11%的平均增长率。去年下
2023-09-06 09:43:00
中新健康|专访哈佛大学刘军:AI医疗是人类医生的助手而非对手
...面尚存在一定欠缺。”即使AI能够提供具体的概率预测,普通人在面对这些具有强烈不确定性的问题时往往感到无助。刘军提出疑问,“当患者被告知有1%的概率患某种癌症,且这个概率是普通
2024-12-26 17:33:00
大模型助力健康管理,通过认知行为疗法改变知易行难|我爱黑「可颂」路演项目专访
“腰间的赘肉咔咔掉,人鱼线马甲线我想要。”无论你是否跟着刘畊宏跳过健身操,你一定听过这一句台词。后疫情时代,大众的健康意识进一步提高,具体表现为从过去的寻医问药转向更为全面的健康
2023-12-05 19:57:00
蚂蚁“灵光”来了:30秒生应用 让复杂变简单
...、即用即分享。这种快速生成日常生活小应用的功能,让普通人也能零门槛享受AI Coding带来的生产力变革。如用户咨询“溏心蛋要煮多久?”灵光可生成一个“溏心蛋时间计算器,用户
2025-11-19 14:13:00
用大模型生成Lofi音乐,这款应用要做年轻人的情绪「疗养剂」|我爱黑「可颂」路演项目专访
相较于主流音乐所追求的高保真、高质量,Lofi(Low Fidelity:低保真)音乐正在成为年轻人心灵疗愈的良方。在上世纪五十年代,受限于当时的音乐录制设备和场地要求,一些音乐
2023-12-14 19:02:00
更多关于科技的资讯:
近来,“包挂热”在年轻消费者群体中持续升温。社交平台上,有关“包挂”“包搭子”等相关话题的浏览量超过亿次。数据显示,今年上半年
2025-11-25 08:41:00
摘要:在全球市场飞速发展、竞争日趋激烈的当下,企业获得并保持核心竞争力是长远发展的动力源泉。企业的静态核心竞争力易随着技术的进步与市场的变换而失去光彩
2025-11-25 07:04:00
摘要:随着大数据技术的快速发展,传统中小企业的管理模式面临前所未有的挑战与机遇。大数据的应用使得中小企业能够通过数据分析
2025-11-25 07:04:00
外卖大战在不久前刚刚告一段落,市场就又有了新的动作:京东上线了独立App京东外卖,同时还发布了京东点评。而11月以来,也多次传出阿里的外卖平台“饿了么”要更名为淘宝闪购的消息
2025-11-25 07:22:00
在高度媒介化的社会环境中,社交媒体作为关键基础设施,其算法推荐机制催生的“信息茧房”现象日益凸显。本研究聚焦大学生群体
2025-11-25 07:04:00
猛犸世纪AI智能体训练营开课,引爆“一人公司”新范式
AI时代,企业的核心竞争力是什么?在2025年11月19日至20日于深圳南山成功举办的“猛犸AI智能体增长训练营”上,答案被清晰地指向了同一个方向
2025-11-24 14:18:00
澳柯玛多款产品获市长杯工业设计大赛金、银、铜奖
鲁网11月24日讯近日,青岛市2025年第八届“市长杯”工业设计大赛获奖名单正式公布,澳柯玛生活电器凭借卓越的设计实力
2025-11-24 14:44:00
嘉必优捷报频传,瞄定中国生物制造踏新阶
近日,《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》正式发布,明确提出,推动生物制造、量子科技、氢能和核聚变能等成为新的经济增长点
2025-11-24 15:18:00
为规范大型网络平台个人信息处理活动,保护个人信息合法权益,促进平台经济健康发展,国家互联网信息办公室、公安部起草了《大型网络平台个人信息保护规定(征求意见稿)》
2025-11-24 15:29:00
为强化员工合规意识,切实保障SPACC+营销模式下老年客户的服务安全,富德生命人寿保险有限公司张家口中心支公司于11月12日至13日
2025-11-24 15:32:00
10月29日至31日,百年人寿银行保险渠道在深圳大学举办“金鹏启梦,领行新程”主题研学班。本次活动聚焦专业能力跃升与价值成长路径
2025-11-24 15:33:00
多维促消费,畅享“双十一”——邮储银行三明市分行携手商圈平台打造银客商共赢典范东南网11月24日讯 为紧抓“双十一”消费机遇
2025-11-24 15:44:00
王嘉琳女士受邀出席睿海希尔顿花园酒店开业盛典,共贺新章
日前,重庆渝北中央公园睿海希尔顿花园酒店(以下简称“睿海希尔顿花园酒店”)在渝北区中央公园片区盛大开业。作为全国首家开业的4
2025-11-24 16:30:00
11月21日,2025北京零售商品博览会在北京展览馆启幕,展会以“品质零售·融聚共生”为主题,联动生产商、品牌商、渠道商
2025-11-24 17:41:00
“这个锅的厂家还在吗?”一则寻锅视频在全网爆火,这口“用了三十年仍旧不锈不粘、耐用如初”的锅也被网友称为“传家锅”。感动之余
2025-11-24 18:26:00