• 我的订阅
  • 科技

教人工智能读懂专业文件(新职业新故事)

类别:科技 发布时间:2024-08-27 06:09:00 来源:人民资讯

本文转自:人民日报

人工智能训练师帮助学习模型识别“有用”信息——

教人工智能读懂专业文件(新职业新故事)

本报记者 黄晓慧

《 人民日报 》( 2024年08月27日 第 13 版)

教人工智能读懂专业文件(新职业新故事)

杨洪旭在制订人工智能训练计划。

教人工智能读懂专业文件(新职业新故事)

杨洪旭(右)和同事在讨论人工智能训练进展。

以上图片均为本报记者黄晓慧摄

教人工智能读懂专业文件(新职业新故事)

打开电脑,开启智能训练软件,人工智能训练师杨洪旭开始一天的工作。他最近的任务是训练一个能自主识别银行电汇申请书的人工智能(AI)模型。

杨洪旭供职的达观数据有限公司,位于上海浦东软件园,是一家智能文本处理技术企业。这里研发的AI模型,能读懂合同工单、财务报表、行业报告等各类文本文件,在银行流水识别、合同审核与比对等多场景落地应用。

“在训练AI模型前,训练师首先要阅读大量相关的文件文本,从中提炼和标注出关键信息。”杨洪旭把读文本、做标注的过程比作老师备课,是训练的基础,“我们划重点、做标注,然后将‘有用’信息‘投喂’给AI模型,告诉它们应该提取哪些信息、按照什么格式提取。”人工智能训练师一年需要阅读上万份文档,训练几十个AI模型。

杨洪旭在智能训练软件中打开某银行一张电汇申请书的扫描图像,将“业务种类”“汇款人名称”“账号”“开户银行”“联系地址”等字段信息一一拉框选中,再在旁边打上相应标签,随后点击生成训练模型。

模型生成后,他需要给AI模型出一些练习题,输入字段信息,比对AI模型生成的结果,以此检验学习效果。当发现生成结果与原文本有出入时,杨洪旭会记录并整理成问题列表。“比如文章中有一处图像,它没有读取出来。有一个图像应该是正向的,它读取成了侧向的。”这些问题会统一反馈给AI模型的研发人员,为后续改进作参考。

“AI模型经过训练后,再遇到类似的文本文件,它就能自主抓取、审读这些关键信息,更高效地执行人类指令。”在别人眼中单调、重复、略显枯燥的文档阅读、数据标注、效果测试等工作,杨洪旭却得心应手。他最开心的事就是看到自己训练的模型越来越“聪明”。

1993年出生的杨洪旭,患有先天听力障碍,要戴助听器才能听到外界的声音。2014年,他从上海一所职业技术学院的环境设计专业毕业,先后做过家装设计、会计文员和仓库管理员等工作。

“和客户交流时,因为口齿表达不够清晰流利,经常会有挫败感。”在杨洪旭陷入迷茫之际,上海市浦东新区残联向他推荐了达观数据有限公司的“人工智能训练师”岗位。尽管没有计算机编程技术基础,也对人工智能了解不多,但在听说这份新工作主要和机器打交道后,杨洪旭决定尝试。

招聘杨洪旭入职的运营管理总监袁少杨说,公司首批人工智能训练师主要从事最基础的数据标注工作,重复的工作内容和大批量的标注强度,很考验人的耐心、细心和专注度。

5年下来,踏实、专注、好学的杨洪旭赢得了同事们的交口称赞。在公司的内部培训和自我学习下,他逐渐胜任模型处理、产品测试、接洽客户等多项工作。2022年底,上海发布了首批人工智能训练师(二级)职业技能等级认定通过名单,杨洪旭位列其中。

面对人工智能产业的飞速发展,杨洪旭主动学习AI模型主流的编程语言,编写一些简单代码处理模型出现的问题。“比如,当发现训练的模型有误读问题,我能够编写几行程序代码,做一些初步纠正,而不是把问题直接转给模型研发人员。”杨洪旭说,为了提升自己,眼下,他正在备考信息系统项目管理师职称证书。

人工智能是上海的三大先导产业之一。近年来,上海从算力、语料、模型、测试、应用场景等方面布局人工智能产业,同时加大人才培养力度。2022年,上海启动人工智能训练师职业技能等级认定工作,目前已有450多人获得了“人工智能训练师”证书。

版式设计:汪哲平

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-08-27 08:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

AI赋能职教出海 柳铁职院精彩亮相
...机车模型,以及极具特色的柳铁文创展品,并现场开展了人工智能留学问答服务系统和机器人应用技术演示,全方位、多角度地展现人工智能赋能职业教育智能化转型与职教出海创新实践的丰硕成果
2025-05-16 19:33:00
“AI训练师”:让人工智能越来越像人
本文转自:劳动报“AI训练师”:让人工智能越来越像人——“新质生产力下的职业观察”系列报道之二杨洪旭正在进行数据标注工作。■ 摄影 刘振思 ■劳动报记者 张锐杰 “近年来,
2024-03-14 02:47:00
海南人工智能与数据产业学院在海口揭牌成立
本文转自:人民网-海南频道海南人工智能与数据产业学院揭牌仪式在海口市举行。 人民网 枉源摄人民网海口9月26日电(枉源) 9月26日,海南人工智能与数据产业学院揭牌仪式在海口市举
2024-09-26 16:01:00
学大教育中标吕梁学院AI实验室项目,打通职教布局全链路
...示,北京学大信息技术集团有限公司中标吕梁学院数学系人工智能基础实验室设备及资源项目。不同于学大教育以往公开发布的与政府及职业院校就人才培养方案和专业共建等方面的合作,此次采购
2023-09-25 11:51:00
明确科学研究的“可为”与“不可为”
...进行深入解读,推动政策更好落地见效。不得使用生成式人工智能直接生成申报材料,生成式人工智能不得列为成果共同完成人;未经科学验证或同行评议的研究成果,科研人员不得向公众传播……
2024-01-10 02:05:00
浦东推出首个女性人才峰会,同步成立8个创新人才联盟
...区女工委牵头,联合康桥工业区、医学园区女工委成立的人工智能、芯片、生物医药类职业女性创新人才联盟;由南汇新城镇女工委发起,聚焦区域人工智能、集成电路类优势行业成立的新力量联盟
2023-10-10 10:39:00
...练过程中,实现个性化发展,放飞理想。本次大赛是围绕人工智能产业实施过程中的人机协同应用技术及人机协同技术应用场景的设计与实现展开竞技、切磋技艺的平台,希望以此为契机,培育适应
2022-12-29 11:05:00
...首个AI视频生成模型Sora的横空出世,让世界再次感受到了人工智能时代的冲击。伴随着这一里程碑式应用的出现,2024年的AI故事将走向何方?3月15日,由工业和信息化部工业文
2024-03-17 22:53:00
AI会如何影响传媒行业?顶级通讯社Thomson Reuters 收购Imagen、Casetext
...务。Imagen称,该公司的视频管理平台集成了谷歌和微软的人工智能服务,是世界上最智能的视频管理平台,该平台通过Ai驱动工作流
2023-07-11 12:19:00
更多关于科技的资讯:
摘要:本文围绕企业绩效管理体系的构建与完善展开研究,首先明确该体系的核心构成,包含目标设定、过程监控、评估实施与结果应用四个相互衔接的环节
2025-11-15 05:22:00
厦门软件园健康马拉松赛开跑 引入AI陪跑员
厦门网讯(厦门日报记者 林露虹 摄影报道)“我的‘跑友’是机器人!”昨日,厦门软件园第十七届健康马拉松赛在软件园二期热力开跑
2025-11-15 08:20:00
吉林本土动画电影《疯狂电脑城》,凭啥在海外频频获奖?
在温哥华华语电影节上,吉林动画学院师生联合打造的《疯狂电脑城》摘得“最佳动画片奖”,这已经不是该片第一次出海,2024年
2025-11-15 19:01:00
摘要:本文聚焦数字化转型背景下企业行政管理效率提升问题,首先剖析数字化转型与企业行政管理的内在关联,指出二者通过流程优化
2025-11-15 05:22:00
2025网聚美好安徽|“双路由”直连上海 看宿州腾“云”而上
大皖新闻讯 11月14日,“皖美十四五 再启新征程”2025网聚美好安徽网络主题活动采访团走进位于宿州高新区的汴水之畔超级计算中心
2025-11-15 10:05:00
“世界舞台”上秀一圈,南京收获了什么?
进博会圆满落幕,南京交易分团意向成交9.98亿美元“世界舞台”上秀一圈,南京收获了什么?□南京日报/紫金山新闻记者 黄琳燕11月10日
2025-11-14 08:38:00
埃斯顿工业机器人出货量持续增长 宁企连续三季霸榜国内“一哥”
11月13日,在江宁开发区埃斯顿智能制造示范车间内,工业机器人正在做各种场景应用展示。宁企埃斯顿今年前三季度机器人总销量约25000台
2025-11-14 08:39:00
一批创新产品亮相“宁创新品”信创产业教育专场活动 只需3步,20分钟完成全班作业批改南报网讯(记者徐宁)上传空白试卷和答案
2025-11-14 08:39:00
以AI引擎打造数字化转型山西模式
图片由讲述人提供讲述人 山西数据流量谷副总经理邵同旭我是山西数据流量谷的邵同旭,长期专注于数据要素与人工智能领域。多年来
2025-11-14 08:52:00
岁末是金融服务的“大考期”,业务量激增、客户需求多元叠加。张家口农商银行宣泰支行聚焦柜面运营核心环节,以“压降投诉、提升质量
2025-11-14 10:07:00
秋实如今,快节奏的都市生活中,“情绪消费”成为一种新的消费方式。数据显示,超九成青年认可情绪价值,近六成青年愿意为情绪价值买单
2025-11-14 11:28:00
新华社记者王雨萧周蕊一杯咖啡,能勾勒出怎样的经济图景?从云南绵延百万余亩的咖啡种植园,到上海梧桐树下香气氤氲的创意特调
2025-11-14 11:28:00
惠依近日,深圳大学深圳城市传播创新研究中心发布《短视频用户的算法实践与“破茧”报告》。《报告》显示,与一些人担忧“信息茧房”形成对比
2025-11-14 11:28:00
如新荣获2025消费责任对话活动客户服务创新典型案例
2025年11月5日,以“大力提振消费 品质服务担当”为主题的消费责任对话活动在成都成功举办。本次活动由中国消费者协会
2025-11-14 11:29:00
Shopee 11.11大促热力爆棚,Shopee Live直播开场4分钟即售出1100万件商品
2025年11月13日,中国 —— 近日,东南亚及巴西领航电商平台Shopee 11.11大促再掀购物狂潮,Shopee Live直播开场4分钟即售出1100万件商品
2025-11-14 11:31:00