• 我的订阅
  • 科技

企业如何搭建并使用人工智能?

类别:科技 发布时间:2023-07-13 14:00:00 来源:人人都是产品经理

AI人工智能技术的发展吸引了许多人涌入,相关技术的进步也为企业的发展带来了许多新的机遇。那么如果企业想搭建人工智能技术、培育模型,可以怎么操作?本篇文章里,作者对企业如何搭建并使用人工智能一事进行了解读,一起来看。

企业如何搭建并使用人工智能?

前言

人工智能无疑是继Web3、元宇宙之后最火的方向,吸引了大量资本的涌入。尽管许多人对于人工智能是否会取代人类感到担忧,但是了解之后,我们会发现每一次科技创新和工业革命都会带来新的职业机会。人工智能的出现虽然会取代部分重复性劳动,但同时也会释放更多的思考空间,提高执行效率和思考能力。然而,它永远无法完全取代人类!

一、为什么企业需要人工智能

在企业中引入人工智能技术,可以有效提升员工内部的运作效率。通过自动化流程性质的内容,人工智能能够更加高效地完成任务。此外,人工智能还可以通过不断的自我迭代,产生更加客观的结论,帮助企业避免走弯路,减少在关键决策上的资源和精力浪费。

除了解决人工效率问题,同时也能够提升制造业的生产流程,包括节约生产过程中的资源,从而达到了降本增效。例如:亚马逊正在使用 AI 来改善个性化推荐并优化库存管理。在亚马逊向股东提交的年度股东信中,CEO Jeff Bezos 讨论了通过其云计算部门采用 AI 快速交付产品,增强现有产品和创建新工具的重要性。

1. AI提升工作效率

举一个现实中的例子:

在互联网公司中,每周都会举行周例会,会议的进行中将本周的数据进行统计和分析,以观察是否存在异常和数据波动。如果将这项工作交给AI执行,只需一句命令,就能得出异常原因和异常数据,从而大大减少每次拉取数据的痛苦。这样释放出的时间和精力可以全身心地投入到解决问题上,而不是怀疑数据的真实性,或者针对数据做无休止的争论。

在上述的例子中,我们可以观察到AI能力的一部分,即替代重复性的劳动力。然而,要实现数据分析以及针对特定行业的分析,需要数据分析师与AI进行有效的沟通和引导,以得出科学且客观的结论。因此,企业引入的AI不仅需要具备能力,还需要是一个行业专属模型。

2. AI提升业务能力

人工智能不仅能够解决重复性的劳动,还能根据以往的业务数据进行分析,提前预测企业未来可能面临的问题。这个过程所输出的内容可以帮助企业内部员工提升能力,从而提高企业整体业务能力。这样的结果可以帮助企业在行业内快速成长。

人工智能在这个过程就像每个员工的专属助理一样,通过业务数据的分析,给出客观的预判,根据行业的发展状况,结合公司内部的数据,给出未来1到5年的规划,AI都可以完美的驾驭。但是依然是需要企业内部要有个专属模型。

3. 企业需要专属模型

我多次提到了“行业专属模型”,而这个模型就是目前所有业内人士最关心的内容,有学者称之为“大规模预训练模型”(large pretrained language model)。未来,大模型就是AI基础通用能力,就像ChatGPT一样,你问它的内容基本都不属于专属行业的内容,但是一旦问了,可能得出的结论并不能直解决问题,所以大模型是基础,那就要在这个基础上做小模型的训练,而小模型针对就是具体的场景,或者说具体的行业能力。

“小模型”:针对特定应用场景需求进行训练,能完成特定任务,但是换到另外一个应用场景中可能并不适用,需要重新训练(我们现在用的大多数模型都是这样)。这些模型训练基本是“手工作坊式”,并且模型训练需要大规模的标注数据,如果某些应用场景的数据量少,训练出的模型精度就会不理想。

“大模型”:在大规模无标注数据上进行训练,学习出一种特征和规则。基于大模型进行应用开发时,将大模型进行微调(在下游小规模有标注数据进行二次训练)或者不进行微调,就可以完成多个应用场景的任务,实现通用的智能能力。

二、如何培育模型

首先,值得注意的是,培育大型模型并非所有企业都能够轻松承担的任务,因为这需要高门槛和强大的技术储备。因此,我们需要利用已经培育好的通用模型为基础,进行特殊场景的训练。

这个过程一般需要分为几个步骤。

首先,我们需要对数据进行清洗和预处理,以提供更高质量的数据内容。其次,我们需要根据训练场景制定训练模式。在训练过程中,Transformer(自主意力神经网络模型)、LLM(自然语言处理模型)以及prompt(提示词)等相关内容都是不可或缺的。最后,我们需要进行场景化的应用和微调,这个过程就是不断试验模型输出的内容,然后不断地优化模型,以达到最优的效果,下面就展开说说部署的核心步骤。

三、数据处理 1. 数据提取

当前,企业均拥有自己的数据库,这些数据以数据库的节奏存储,半结构/非结构化数据并非人工智能有效识别,因此需要重新提取这些数据。提取过程需要消除无效数据,重新定义基础元数据,并为有效数据重新定义标签。最后,关键的一步是对这些数据进行数据标注(Annotation),标注后的数据可以更好地被AI理解。核心的四个步骤包括:清洗无效数据;定义基础元数据;标记标签;数据标注。2. 数据划分

将已提取并标注好的数据内容进行组合,相当于将关联性较强的数据放置于一个集合中,通常称之为训练集。当然,也可以通过应用场景反推数据如何合理地划分。数据划分是非常关键的一步,该过程包括训练集、验证集、测试集、分层抽样和交叉验证。

数据划分的目的是确保模型在训练、调优和评估过程中具有合理的数据集,并能够对未见过的数据进行泛化。合理的数据划分可以避免模型过拟合训练集和验证集,同时提供独立的测试集来评估模型的真实性能。在选择数据划分比例时,需要根据具体任务、数据规模和可用数据量等因素进行调整,并进行交叉验证等方法来稳定评估结果。

3. 特征工程

特征是指从数据集中提取出具有较强特点的内容,具备一定预测能力的特征。以文本数据集为例,这需要运用NLP技术,对数据集进行分词、去除停用词、处理近义词、向量化等操作,然后进行压缩和重组,生成新的数据处理集。通过领域知识和对数据的理解,可以构建新的特征,或者通过特征之间的组合和衍生来创造更有意义的特征。

特征工程的目标是使数据更适合机器学习算法的处理和建模,并提供更有表达能力和预测能力的特征。根据具体的任务、数据集和模型选择合适的特征工程步骤和技术,以提高模型的准确性和泛化能力。

四、模型训练 1. 模型类型

首先要明确训练的目标和目的,分析后期AI的应用场景的本质,确定好之后,才能够对模型类型进行选择。常见的模型类型包括线性模型(如线性回归、逻辑回归)、决策树模型(如随机森林、梯度提升树)、神经网络模型(如卷积神经网络、循环神经网络)等。根据问题的复杂度、数据量和可用资源等因素,选择适当的模型类型。

还有更深层次的架构内容:卷积神经网络(CNN):适用于图像和空间数据处理,通过卷积和池化层来提取图像的局部和全局特征。循环神经网络(RNN):适用于序列数据处理,通过循环结构捕捉序列中的时间依赖关系。注意力机制(Attention Mechanism):用于关注模型关注输入中的重要部分,可以应用于机器翻译、文本摘要等任务。转移学习(Transfer Learning):利用预训练模型来初始化网络参数,提高模型的性能和收敛速度。融合多个模型(Ensemble Learning):将多个模型的预测结果进行组合,以提高整体的准确性和泛化能力。

上述的内容,并不是都要在一个场景下用到,而是根据问题的性质、数据的特点、任务的要求和可用资源等因素,选择适合的模型类型和设计合理的网络架构。

2. 硬件资源

常用的硬件包括:CPU(中央处理器)、GPU(图形处理器)、TPU(张量处理器)、FPGA(现场可编程门阵列)、硬件加速平台等。

选择适当的硬件设备取决于许多因素,如任务的复杂性、数据集的大小、可用的资源和预算等。对于小规模的任务和数据集,使用CPU可能是足够的。对于大规模的深度学习任务,GPU和TPU可以提供更高的性能和效率。使用云计算平台的硬件加速服务可以灵活地扩展计算资源,并提供高性能的训练环境。

此外,还应考虑硬件和软件的兼容性、开发和调试工具的可用性,以及供应商的支持和更新等因素。综合考虑这些因素,选择合适的硬件设备可以提供高效的模型训练和优化,从而获得更好的性能和结果。

3. 训练模型

在此阶段,我们将对前述所有内容进行程序化处理,并在服务器上进行自动化训练。训练过程将通过可视化平台进行监测训练结果。我们将使用各种参数进行微调,并反复进行训练。训练结束后,我们将逐一保存模型版本,并进行测试验证。

跑模型的核心流程是一个迭代的过程,需要不断调优和改进,以提高模型的性能和适应性。在每个步骤中,数据的准备和清洗、模型的选择和配置、训练和评估、预测和应用都是重要的环节。通过不断的实践和经验积累,可以逐步优化和改进模型,以满足具体问题和应用的需求。

五、模型应用

不同的应用场景所运用的模型都需要在服务器存储,同时要与业务系统进行打通,比如将训练成型的模型嵌入到企业的业务系统中,或者部署到SAAS、PAAS等应用后台中。通过应用层的不断使用,数据进行再次回收,就形成了完整的闭环,而人工智能也可以在这个过程不断的自学,加快自我提升的速度。

六、总结

人工智能已经不再是一个概念性的产物,也不再是电影中所描绘的幻想。如今,它已经广泛应用于各个行业领域。一旦模型训练完成,它就可以应用于各种场景,并嵌入到各种系统中。

正如电影《超体》中所说:“我将无处不在!”,未来的人工智能完全可以跨越平台,在移动设备、智能家居、企业系统、应用软件以及各个平台中出现。如果企业想要快速发展,或者行业需要快速迭代,那么人工智能将成为最核心的部分。学会如何控制人工智能也将衍生出更多的新兴职业!

本文由 @金锴 原创发布于人人都是产品经理。未经许可,禁止转载

题图来自Unsplash,基于CC0协议返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-07-13 17:45:22

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...6月4日讯(记者郭松峤)“‘破’是指用大模型技术解决人工智能安全问题,确保人工智能产业良性发展。‘立’则是人工智能赋能数字福建的具体实践,重构数字产业,拓展新机会。”近日,国
2024-06-05 00:24:00
北京经开区:加快打造AI原生产业创新高地,每年发放1亿元...
...若干政策为深入落实《北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023—2025年)》,抢抓人工智能发展战略机遇,集聚国际国内创新资源,促进人工智能技术与主导
2024-03-29 16:42:00
北京占大模型“半壁江山” 算力支持政策酝酿出台
...自:人民日报客户端贺勇7月2日,“2023全球数字经济大会人工智能高峰论坛”在京举办。此次论坛以“智能涌现,重塑未来”为主题,10余位人工智能领域顶级专家学者和企业、机构代表
2023-07-04 17:16:00
...经济和信息化局印发《北京市关于支持信息软件企业加强人工智能应用服务能力行动方案(2025年)》, 围绕“人工智能+”战略推出8大举措支持企业发展,全面提升人工智能服务实体经济
2025-04-09 10:01:00
人工智能到底会取代谁
人工智能技术不断突破,大模型应用都想成为爆款,企业正站在一个全新的十字路口。引入人工智能会否真的降本增效,跟不跟?摆在眼前的是一个创新产品和服务的机遇,也是一个需要理性对待的未来
2024-09-03 00:07:00
...民政府同意,近日,省人民政府办公厅印发《贵州省推动人工智能高质量发展行动方案(2025—2027年)》,全文如下:贵州省推动人工智能高质量发展行动方案(2025—2027年)
2025-01-08 01:00:00
《门头沟区人工智能大模型产业创新发展三年行动计划(2024-2026年)》正式发布
本文转自:人民日报客户端王昊男日前,《门头沟区人工智能大模型产业创新发展三年行动计划(2024-2026年)》(以下简称《行动计划》)正式发布。该计划为门头沟区人工智能产业发展提
2023-12-07 03:29:00
云测数据:为人工智能提供专业、高效的AI数据服务
人工智能技术作为经济社会高质量发展的动力引擎,不仅需要持续探索重大场景应用、建设强有力的算力生态,还需要充分发挥数据要素价值。随着全球新一轮AI热潮来临,大量训练数据已成为AI算
2024-06-29 09:38:00
人工智能如何赋能“安徽万物”?
大皖新闻讯 1月16日,《安徽省“人工智能+万物”应用行动方案》发布,到2030年,安徽“人工智能+万物”应用落地将超万个,“人工智能+万物”应用将迎来跨越式发展。人工智能如何赋
2026-01-17 21:56:00
更多关于科技的资讯:
一颗播州辣椒的全球之旅
多彩贵州网讯 在黔北播州的绵延青山之间,一颗颗红彤彤的辣椒经过烘烤后,被集中送往位于石板镇国际辣椒产业园的遵义中椒生物科技有限公司
2026-01-29 17:49:00
科力装备携手华为云深化智能制造,打造汽车零部件行业数智化升级标杆
日前,工业和信息化部、教育部、市场监管总局、国家数据局四部门联合印发《汽车行业数字化转型实施方案》(以下简称《实施方案》)
2026-01-29 18:25:00
随着AI(人工智能)技术飞速发展,一种被称为OPC(One Person Company,一人公司)的新型创业形态正在兴起
2026-01-29 18:59:00
“咪咕阅读”正式升级为“咪咕悦看”,以文剧融合新生态践行数字文化发展使命
从追求流量到追求质量,微短剧行业正迈向精品化与主流化的升级之路,拥有大量好内容的网络文学是微短剧发展的重要推动力。咪咕阅读率先以“文剧融合”为抓手
2026-01-29 14:24:00
星聚会KTV中国香港双店同开
2026年1月27日,星聚会KTV(以下简称星聚会)正式官宣,中国香港铜锣湾V Point店与兰桂坊加州大厦店双店同步盛大启幕
2026-01-29 14:34:00
星巴克中国发布一季度财报 营收连续五个季度增长
1月28日晚,星巴克发布2026财年第一季度业绩报告,营收实现双位数增长,同店销售额连续三个季度正增长。营收连续五个季度增长
2026-01-29 15:24:00
五大优化精准惠民,2026年郯城县以旧换新再发力
鲁网1月29日讯 (记者 吴艳萍)1月29日,郯城县人民政府召开“惠企利民 消费品以旧换新”新闻发布会。郯城县商务局相关负责人介绍2025年郯城县消费品以旧换新工作开展情况
2026-01-29 16:44:00
惠民2800余万元!郯城县以旧换新释放消费新动能
鲁网1月29日讯 (记者 吴艳萍)1月29日,郯城县人民政府召开“惠企利民 消费品以旧换新”新闻发布会。郯城县商务局相关负责人介绍2025年郯城县消费品以旧换新工作开展情况
2026-01-29 16:46:00
注意力差、上课走神、做事拖拉磨蹭?这可能是学习能力需要“专业锻炼”的信号
鲁网1月29日讯学习困难是儿童成长过程中常见的问题,严重影响孩子的学业成绩和心理健康。因此,建立科学的筛查和干预机制,对于早期发现和解决学习困难问题至关重要
2026-01-29 15:35:00
科学探秘 巧手求真 观湖社区伯努利实验点亮青少年科学梦
“原来流动的空气真的有力量!”“乒乓球居然能悬浮在空中不掉下来!”近日,苏州工业园区唯亭街道观湖社区阿里博士实验室内欢呼声此起彼伏
2026-01-29 11:28:00
大皖新闻讯 1月28日晚间,星巴克发布2026财年第一季度业绩报告,中国市场延续强劲增长势头,营收实现双位数增长,同店销售额连续三个季度正增长
2026-01-29 12:51:00
京东携机器人亮相乡村舞台 光明村首届“村晚”科技感拉满
当智能机器人遇上“村晚”,科技与年味会碰撞出怎样的精彩?1月28日,江苏宿迁来龙镇光明村热闹非凡,由京东打造的首届“村晚”正式上演
2026-01-29 13:13:00
“溪山模式+溪有物种实践”赋能科创:从商业航天到核聚变
2026年1月22日,NSE2026第四届新物种进化大会暨2026溪山天使年会在北京大北农凤凰国际创新园隆重举行。这场由溪山天使汇
2026-01-29 13:14:00
爱喏与宅智造达成战略合作:融合产品体系与服务网络,打造高效家装新平台
近日,融合产品设计与实用美学的健康水生态品牌“爱喏”与国内领先的一站式建材服务商“宅智造”建材超市正式签署战略合作协议
2026-01-29 13:16:00
第五届青山科技奖出炉:聚焦“数字+绿色”,鼓励基础科研“更落地”
1月29日,第五届青山科技奖获奖名单正式揭晓,10位绿色低碳领域的青年科学家入选。获奖名单中首次出现两名“95后”科学家
2026-01-29 13:33:00