我的订阅
科技

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

对话IDEA张家兴：AI离成为普通人的工具就差一步｜36氪专访

类别：科技发布时间：2023-08-03 08:29:00 来源：36氪

文｜林炜鑫

编辑｜邓咏仪

ChatGPT打了一个共鸣的响指，大洋两岸的AI行业都为之震颤。短短几个月，许多知名人士宣布投身大模型创业，即便有人离AI很远，对大模型一知半解，也愿意拿出令人惊叹的热情和金钱，小步快跑挤进这条赛道。

“仿佛回到了10年前深度学习刚出来那会，”张家兴告诉36氪，“全社会各行各业积极拥抱新的技术。”

近期，36氪专访了这位科学家创业者，他坦言现在是自己职业生涯最兴奋的阶段，“我完整经历过深度学习从学术界诞生到产业界落地的技术周期，现在我感觉在经历第二个技术周期。”

张家兴是粤港澳大湾区数字经济研究院（IDEA研究院）认知计算与自然语言研究中心讲席科学家与负责人。加入IDEA研究院前，他先后就职于百度、阿里巴巴、360等大厂，带领团队进行AI相关的项目研究和技术落地。

两年前，张家兴加入IDEA研究院，开始带领团队做大模型的深入研究，是国内最早一批专注于预训练大模型的团队之一。他带领团队开源了第一个以中文为主的AI绘画模型“太乙”，还创建了名为“封神榜”的大模型开源计划，截止目前共开源超过100个模型。

作为行业专家，张家兴第一时间关注到ChatGPT的发布。他承认最初低估了GPT-3.5所带来的技术突破，直到团队上手体验，他的内心“受到很大的冲击”。

在他看来，颠覆性的变化在于，从过去强调模型结构创新，走向了强调训练方法创新。OpenAI为国内外同行指出一条明路：把通用大模型当作产品，引入更先进的训练方法，一遍遍打磨和调试。因此，训练方法将是大模型生产商的核心竞争优势。

对张家兴来说，大模型创业最难的环节不是资金和算力，而是人才。这不是单纯靠钱能解决的要素。在国内，AI学界和工业界存在一定程度的脱钩，学界诞生的前沿成果往往很难快速应用到工业界。“在青年研究者跟工程师之间，以前大家忽视了一层，是用工程能力做模型的人。”

在未来，各行各业都需要大模型——这已是显著的发展趋势。目前，很多公司还在调用通用大模型的API，但不是每家公司都有能力和资源去从零开始建大模型模型。“只有当每个公司拥有自己的大模型时，模型-场景的闭环才有可能得以成立，商业化实践才有可能获得成功，我想在中国将这层能力补齐，并打出影响力。”张家兴表示。

如今，张家兴的团队也在这条道路上进行实践——专注于生产垂直领域的大模型，并与各个行业的企业客户合作，帮助客户量身定制合适的模型，落地到具体应用场景中。

谈及AI发展的未来，张家兴是坚定的乐观派，他相信AI能帮助提高人类的数字生产力。接下来的十年，是属于生成式AI和通用式AI的。对普通人来说，学会利用AI工具，其实不是一件难事。

张家兴

以下是36氪和张家兴的对话，经36氪编辑整理：

OpenAI证实了大模型的价值

36氪：2014年，其实你在深度学习领域已经发表了相当前沿的研究成果，当时想象过会出现ChatGPT这样的产品吗？

张家兴：2014年有一个技术叫LSTM（长短期记忆网络），在学术界出现了一些让人惊艳的成果。当时我印象很深刻的例子是，它可以直接生成一个网页代码，格式完全正确，网页也能展示。因此今天我们看到的生成式人工智能，其实在2014年已经看到了萌芽，但是在工业界迟迟无法落地。一个很重要的原因是，当年的模型规模太小，跟今天没法比。今天技术ready了，有更多更好的数据和算力，曾经我们寄予厚望的生成式模型终于实现了。

36氪：两年前，你就已经开始在IDEA研究院对大模型做深入研究了，当时，你对大模型的判断是怎么样的，学界对大模型的研究大概是什么状态？

张家兴：我对AI发展一直很乐观。两年前，随着GPT3的问世，我们已经认识到未来认知智能必须基于基础设施——预训练模型，做任何自然语言任务，都是要从预训练模型开始，不可能一切都是从零开始。

当时我组建认知计算与自然语言研究中心，就是生产预训练模型。跟现在不同的是，当时模型结构并没有像今天这样收敛到GPT这样的结构，当时还是百花齐放的状态。

36氪：那会你们做的预训练模型是什么样的？

张家兴：那个时候我们团队就在推出“封神榜”体系，“体系”这个词也意味着要做很多基础的训练模型，当时我们就是中文最大的开源体系。我们希望下游可以拿着我们的模型再进一步微调，实现他们具体场景中的应用。这件事情做了两年，开源了接近100个预训练模型，直到ChatGPT的出现，打破了传统模型的效果。

36氪：技术层面，ChatGPT具体最让你感到惊讶或震撼的是什么？

张家兴：令我很惊讶的还是在基于一定知识之下，它可以进行复杂的推理，得出正确的结论。

此前我们有两大很难解决的问题。一个是知识的结构化，为此耗费了巨大人力，也难以保障准确率，维护成本也很高。现在只要对包含知识的文本做预训练，就能让大模型真的去理解、记住这些知识。

另一个是推理，之前我们认为推理需要通过符号系统再加上结构化的知识才能实现，而今天我们看到，ChatGPT可以完全通过自然语言的训练，并未显示出现符号和知识就具备这个能力，颠覆了我们对这个问题的认知。

36氪：具体来说，OpenAI推动的最重要的技术变化是什么？

张家兴：终于从过于强调模型结构创新走向了强调训练方法创新。训练方法变得更重要起来了。

ChatGPT4模型跟两年前的GPT3模型结构是一模一样的，但是为什么效果就提升了这么大？因为这里面引入了很多更先进的训练方法，比如说指定微调，让机器更懂得人类的指令；比如人类反馈学习，能够调整模型的偏好，全都是训练方法上的创新。

我们团队目前也将这些创新性训练方法应用于模型训练过程，实际应用证明，这些方法确实能够显著提升模型的表现。因此，我们深刻认识到，训练方法的创新在实现更强大的AI系统中起到了关键性作用。即使把模型结构开源了，但训练方法是你藏起来的核心竞争力，这也使得在这个时代做通用模型训练这件事情有商业价值。

同时，OpenAI也让大家认识到，不要追求用一次性的训练就能得到一个效果很好的模型。模型效果提升是靠一遍又一遍的打磨，不断的迭代升级。

36氪：这是不是意味着把模型当成产品？

张家兴：对，当我的模型进行一次训练迭代，我会看到模型的优点跟缺点，针对缺点，我找补救的方法，再继续进行训练，当所有的缺陷都补齐，优点都加强之后，模型就变成今天大家看到的样子。我们团队当下在做的姜子牙大模型就在持续地作为产品打磨，接下来也会不停地进行版本升级。

36氪：OpenAI刚起步时，因为技术路线比较小众，创始人Sam Altman回忆说他们遭受到很多白眼。你刚开始做IDEA的时候，当时国内行业氛围是怎么样的？

张家兴：当时，这个领域（预训练大模型）没有那么受重视，因为大家传统的思路都是AI的价值一定要跟某个行业结合，一定要有直接在具体场景中的产业落地。我们只生产预训练模型，可能别人不理解，觉得通用的东西又有什么用呢？

但是ChatGPT的出现，让大家知道一个做通用模型的公司，在整个产业生态中具有非常重要的价值。AI产业需要有上下游这样的生态体系，而不是每一家都自己去垂直造烟筒——从预训练模型到产业落地，恨不得把一整个系统都做出来。

OpenAI证实了大模型的价值，我们做这个事情的价值也终于得到证实。

36氪：现阶段去追赶OpenAI，做出一个跟ChatGPT差不多的东西，还有没有意义？

张家兴：还是有意义的。OpenAI这样提供一个超级大模型，一个通用API，指望大家来调用，这不是产业落地的唯一方式。很多商业公司有需求针对自己场景的定制化模型，但又没办法从头去做这件事情，代价太大，就需要生产通用大模型的公司来帮助他们。

36氪：这也就是你们团队要做的事情？

张家兴：我们具备了生产通用大模型的能力，还能给用户提供一些工具，帮助用户基于我们的模型继续生产他们垂直应用场景里的模型，再通过这种方式就能够让用户的模型跟场景形成迭代。我认为这是这是接下来大模型能够商业化成功的关键。

让模型落地到场景中，是商业化的关键

36氪：相信你最近的工作状态特别忙碌，能跟我们说说你的一天怎么过的吗？

张家兴：我的一天，一方面是跟团队研究探讨最前沿的技术问题，另一方面现在会见大量的客户，主要也听听大家想拿大模型做什么，这样好让我们的通用模型去提供大家所需要的能力。

比如，我们接下来会开源各个不同侧重能力的模型，也是因为发现每个客户对于大模型的需求不同。通过这些开源模型，我们希望能推动中国AGI的应用层迸发。

36氪：两年间，“封神榜”开源体系已经推出了近百个开源模型。你的团队最近刚刚开源了130亿参数的通用模型“姜子牙”，这个大模型具体是怎么样的？

张家兴：“姜子牙”是我们针对通用大模型推出的新开源系列，而第一个开源的“姜子牙”通用大模型v1也是我们封神榜开源系列的第99个开源模型。

在最新的SuperCLUE测评榜单中，我们的姜子牙v-1的测评结果也是开源模型里的第一。接下来，我们还会侧重各种能力开源不同的模型，比如多模态模型就会在本周推出。

36氪：目前企业对于大模型的需求，都有哪些？

张家兴：我接触的这些企业几乎横跨了所有领域。比较典型的是这几件事情：第一是生成文章和代码。第二是对文本做完全开放式、预先不设定具体任务、精准的理解。第三就是推理类的，比如说我要做一道题，能不能提示这个问题怎么解决。

36氪：大模型比较理想的商业模式，应该是怎么样的？

张家兴：根据以往经验，很多商业成功需要一个商业实体（如公司、团队和机构等），在技术产品的基础上建立应用场景，形成迭代的闭环。在这一闭环的生态里，更好的产品技术会吸引更多的用户和数据，产品和技术得以迭代更新、变得更好。

但在AI产业，目前很多公司还在调用通用大模型的API，无法建立闭环，大模型的商业化进程缓步不前。只有当每个公司拥有自己的大模型时，模型-场景的闭环才有可能得以成立，商业化实践才有可能获得成功。

我们团队的目标就是，用通用大模型去帮助每个企业甚至每个个人，让他们能够拥有并不断优化自己的大模型，和应用场景形成闭环，在商业化道路上走得更好。

36氪：商业化这个事情，会如何改变整个AI产业？

张家兴：未来的AI产业一定是巨大生态体系，既有处于下游的各个企业在各自场景中引用大模型技术，又有处于上游的模型生产商为整个生态提供预训练模型。云厂家和解决方案公司也在整个生态系统中扮演重要的角色。

36氪：你之前在大厂也有过多年的技术转化业务落地的经验，现在在 IDEA研究院进行科研转化的实践。从科研到转化落地中，你有哪些想分享的体会？

张家兴：如果作为科学家，更多的精力会放在前沿技术的思考和解决问题的创新上，会比较少去关注具体这个技术如何能给市场和社会带来价值，以及能带来多大的价值。

而作为科学家创业者，则更需要去关注市场的需求。从技术的前沿创新研究到最后的落地市场商业化，有很多鸿沟需要跨越，包括了解市场，了解客户，了解实现落地的每一步。我相信每一位科学家都有一个自己的梦想，而如何将这个梦想实现出来，是创业家需要去完成，也是现在特别让我兴奋的一个角色。

36氪：做大模型的几个核心要素：算力、人才、数据等等，从难到易，你会怎么排序？

张家兴：我认为最困难的是人才，目前在国内做大模型的团队还是稀缺资源。算力实际上只要有资本的认可、有钱，就会有。数据虽然需要长时间积累，但它是线性增长，有多少投入就有多少数据。人才不是单纯用钱可以解决的，并且还需要很长时间的积累。我们团队也是基于通过生产近百个大模型，才逐渐磨合出来的。

36氪：当下，AI人才的竞争是否已经到了一个白热化的程度？

张家兴：可能会有这样的趋势。但从另一个方面来说，大模型团队的建设不仅仅是把人聚在一起，还需要一个好的方式把大家组织好做好模型。

AI离成为普通人的工具就差一步

36氪：现阶段的AI研究进度会使你感到害怕吗？

张家兴：我对AI对社会的影响一直比较乐观。AI发展减少一些工作机会的同时也创造出更多工作机会，甚至它创造的工作机会正好适合于那些可能丢了工作的人。

以我们算法工程师为例，曾经我们每个人都是垂直造烟筒，什么都做。现在AI产业有上下游的健全的生态体系，那么算法工程师必然会分层，有些在做上游的预训练模型，有些拿着预训练模型，基于上游提供的工具，在做下游的更广泛的落地。下游对算法工程师的需求量会更大，所以说AI创造了更多的就业机会。

从宏观来说，AI为社会创造更多数字生产力。现在世界的人口可能走向稳定，甚至人口会减少，但是美好生活需要有更多生产力，我们就靠通用人工智能增加更多数字生产力。

36氪：今年三月你公开表示，将来10年是属于生成式AI和通用式AI。对我们普通人来说，将来10年应该做好什么准备？

张家兴：对于普通人来说，就是要学会怎么利用AI的工具，这是对每个人都有用的。另外一点，作为具体在每个场景中的人要努力去想，在我的场景中，我该如何积极拥抱AI的技术，然后对我的场景进行AI升级。

36氪：一个不懂AI的人，是否有可能被淘汰？

张家兴：未来只要会用AI工具的人，就不会被淘汰，使用AI工具其实并不是一件难的事情。所以我希望大家都要积极拥抱AI，把它作为提升自己生产力的工具。

36氪：你觉得现在我们已经进入AGI时代了吗？学术界可能还有一些争论。

张家兴：我认为这个叫做AGI时代1.0。其实是如何理解“通用”这个词，现在终于有一个模型可以具备所有的能力，这已经是一种通用。

36氪：你认为，下一次AGI的突破会是什么？

张家兴：AGI当下表现出来的是特征，是用自然语言来交互，但还欠缺的能力是自然语言学习。如果未来AGI模型都跟人一样，通过自然语言就能教会它各种知识技能，那么它就会真的变成普通人的AI工具。在更远的未来，或许AGI可以像人一样融入社会，跟人类一起交流、学习、成长。

欢迎交流

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2023-08-03 11:45:25

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于张家,普通人,专访,对话,工具,模型的资讯：

用GPT提效，这个产品要用AI生成爆款小红书笔记｜我爱黑「可

...降本的。”由GPT所带来的工具创造了现象级的AI 应用，让普通人使用 AIGC 的门槛逐渐降低，AI 的通用落地性也大大提升

2023-12-21 15:32:00

谁能最早看见AIGC的未来？专访昆仑万维董事长兼CEO方汉丨

...平台Club Koala 也即将上市。近日，娱乐资本论·视智未来专访昆仑万维董事长兼CEO方汉，深入探讨了公司在AI方面的最新动向及未来愿景

2023-10-12 17:44:00

2023服贸会｜专访百融云创陈昀彰：“模型-行业理解-应用”

...司（以下简称“百融云创”）AI创新负责人陈昀彰进行了专访。陈昀彰直言，当前大模型应用还存在诸多难点，提升算力、优化算法等技术手段之外，从业机构还需要充分的行业Know-how

2023-09-06 10:42:00

专访思必驰：DFM-2百亿级大模型主攻汽车、物联网等行业，将

作为一家16岁AI公司的董事长，思必驰创始人高始兴在今年初第一次使用ChatGPT时依旧难掩惊艳，“至少，发言稿可以不用专人写作了。”然而，伴随惊艳而来的，还有当时外界对几乎所有

2023-07-27 11:54:00

36氪专访 | 来也科技CTO胡一川：大语言模型让RPA涅槃

过去两年，企服赛道颇为动荡，但RPA始终保持超快的进化速度。2022年RPA市场同比由23亿美元增长到28亿美元，尽管增速在放缓，但依然远超全球软件市场11%的平均增长率。去年下

2023-09-06 09:43:00

中新健康｜专访哈佛大学刘军：AI医疗是人类医生的助手而非对手

...面尚存在一定欠缺。”即使AI能够提供具体的概率预测，普通人在面对这些具有强烈不确定性的问题时往往感到无助。刘军提出疑问，“当患者被告知有1%的概率患某种癌症，且这个概率是普通

2024-12-26 17:33:00

大模型助力健康管理，通过认知行为疗法改变知易行难｜我爱黑「可

“腰间的赘肉咔咔掉，人鱼线马甲线我想要。”无论你是否跟着刘畊宏跳过健身操，你一定听过这一句台词。后疫情时代，大众的健康意识进一步提高，具体表现为从过去的寻医问药转向更为全面的健康

2023-12-05 19:57:00

用大模型生成Lofi音乐，这款应用要做年轻人的情绪「疗养剂」

相较于主流音乐所追求的高保真、高质量，Lofi（Low Fidelity：低保真）音乐正在成为年轻人心灵疗愈的良方。在上世纪五十年代，受限于当时的音乐录制设备和场地要求，一些音乐

2023-12-14 19:02:00

AIGC应用持续升温，将给普通人生活带来哪些改变？

...新华社新华社北京2月14日电题：AIGC应用持续升温，将给普通人生活带来哪些改变？新华社“新华视点”记者近日，AIGC——即人工智能生成内容，再一次引发公众关注：一款名为C

2023-02-15 09:21:00

更多关于科技的资讯：

把“小角色”做成“大生意” 京东服饰如何激活品牌“第二增长曲

存量竞争时代,当新品、爆款赛道竞争过于激烈时,不少的品牌商家,将目光落在了曾经“不受重视”的非主打品类上。这些品牌中的“配角”

2025-08-09 18:13:00

抖音与中国移动合作:推出联名卡打造数字新经济

近日,抖音与中国移动正式达成合作,联合推出“动感地带抖音联名卡”,定位“通信+内容+消费”全场景服务升级产品,在火山引擎数智平台全链路技术支持下

2025-08-09 18:13:00

宝家洁的欧科棉拖把好不好:创新设计引领清洁体验升级

在竞争激烈的家居清洁市场,宝家洁凭借其强大的研发设计能力和颠覆性产品,持续领跑。其核心产品之一——欧科新材料拖把,正是品牌创新实力与市场成功的最佳例证

2025-08-09 18:13:00

家庭健身全能之选:军霞(康力源)综合训练器推荐

在家庭健身器材领域,综合训练器凭借其多功能性和高效性成为越来越多人的首选。作为国内健身器材领军品牌,军霞(康力源)凭借30余年的研发经验和严格品控

2025-08-09 18:13:00

奋战三季度跑好下半场丨“数智”塑造新优势浙江人工智能核心

今年以来，人工智能引领的“数智”浪潮正带动我省各类新产业、新业态蓬勃发展。数据显示，目前全省人工智能核心产业营收已突破3000亿元

2025-08-09 20:25:00

TEAM CHINA 中国国家队特许零售店鲁西北首店乐陵开业

8 月 8 日，正值全民健身日之际，TEAM CHINA/中国国家队（以下简称“中国国家队”）特许零售店鲁西北首店开业仪式在山东省乐陵市成功举办

2025-08-09 20:44:00

RoboSense速腾聚创携Active Camera亮相W

【中国北京,2025年8月8日】2025年8月8日,中国机器人领域顶级盛会——世界机器人大会(World Robot Conference

2025-08-09 18:13:00

高德地图2025全面AI化：3句话，最快5分钟AI生成个性化

近日，国民APP高德地图正式发布其全面AI化新版“高德地图2025”，成为全球首个基于地图的10亿级AI Native原生应用

2025-08-09 16:47:00

超多优质好物！快来青岛西海岸新区金沙滩啤酒城“寻宝逛GAI”

鲁网8月9日讯第35届青岛国际啤酒节在金沙滩啤酒城狂欢正酣，这里不只有泡沫四溢的酒杯与欢呼的人群，更藏着一座能打包带走的“快乐宝藏库”

2025-08-09 11:41:00

剪映专业版助力创作提效，90后四川小伙靠剪辑月入10万

过去几年，四川小伙王星程每天坚持分享自己的剪辑日常。得益于剪映专业版的方便易上手，“半路出家”的他很快就摸索出一套剪辑窍门

2025-08-08 15:27:00

何以中国丨邂逅魅力天津：砖瓦和鸣文脉新声扫码阅读手机版

天津，这座古老而又现代的城市，多元文化在建筑中显现、沉淀、交融。近年来，天津着力讲好建筑承载的故事，不仅使老建筑“重获新生”，更展现了天津厚重的人文底蕴与独特的城市魅力。

2025-08-09 07:44:00

温特纳科技:为压力扫描阀和气动探针提供一站式校准服务

从航空航天到汽车动力,从风洞实验到无人机飞行测试,精确的流场测量和压力数据采集是确保产品设计和研发进度的重要保障。很多科研工作者在采购压力扫描阀和气动探针后

2025-08-08 15:27:00

智能饮品革命:东方慧影如何用“零成本”方案破解餐饮行业人工困

一、餐饮行业的成本之痛,政策改变迫使餐饮商家做出调整截至2025年,餐饮行业人工成本高达32.7%,较疫情前上升了8%

2025-08-08 15:27:00

官方数据首度公开!TikTok Shop跨境日本、欧洲五国新

近日,TikTok Shop新市场捷报频传!日本站点开放仅一个月,首场大促便斩获“开门红”;与此同时,欧洲五国德法意西

2025-08-08 15:27:00

当连锁药房遇上“好老板”,通联支付助力“为了你”健康药房升级

药店买药免排队、秒支付!近日,通联支付与当地邮政联合,为云南“为了你健康药房”上线“好老板”轻应用,助力连锁药店升级一站式智慧收银平台

2025-08-08 15:27:00

头条订阅服务

对话IDEA张家兴：AI离成为普通人的工具就差一步｜36氪专访