• 我的订阅
  • 科技

让机器更“懂”人类(新职·新知③)

类别:科技 发布时间:2023-07-31 05:59:00 来源:人民资讯

本文转自:人民日报海外版

人工智能训练师:

让机器更“懂”人类(新职·新知③)

彭训文 张嘉幸

《 人民日报海外版 》( 2023年07月31日 第 05 版)

让机器更“懂”人类(新职·新知③)

图为付聪在路边采集声音数据。

张嘉幸摄

让机器更“懂”人类(新职·新知③)

让机器更“懂”人类(新职·新知③)

扫码观看视频

打开电脑,将采集的风声、雨声、溪流声等声音数据输入,“清洗”掉夹杂其间的噪音,对助听器数据模型进行“训练”,测试模型在真实场景的灵敏度……伴随着手指敲击键盘的“啪嗒啪嗒”声,腾讯天籁实验室人工智能训练师付聪一天的工作就此开始。

近几年,随着人工智能技术不断发展,这个被称为人工智能训练师的职业逐渐壮大。作为“数字职业”之一,人工智能训练师的出现,加速了人工智能由技术研发走向行业应用的过程,将产生较高的经济价值和社会价值。

为模型不断“喂”数据

每次出门时,付聪总会在耳朵上戴一个大“耳环”。

这个“耳环”其实是一个测试版的助听器。“耳环”里的声音各式各样,有呼呼的噪声,有尖锐刺耳的吵闹声……这些经过助听器放大后产生的噪声,是很多佩戴助听器的听障人士长期面临的困扰。

付聪和他的团队正在尝试利用算法设计、通过人工智能技术“训练”数据模型,让助听器更加“智慧”地降低噪声,让听障人群听得清、听得懂、听得舒服。

付聪解释说,助听器数据模型很小,因此需要针对不同场景进行优化,很多场景充满挑战,“比如一个听障人士在餐厅吃饭,周围有很多人说话,他想跟对面的人聊天,四周声音特别嘈杂,作为一个正常人都可能听不清楚,更何况一个有听力障碍的人?我们希望利用模型,把需要的声音提取出来,降低噪声,帮助更多听障人群”。

理想很丰满,但是实际的模型算法研发过程却像是一场反复进行的“战役”。

模型的研发过程大致分为以下几步:数据采集、数据“清洗”、模型训练、场景测试、调整算法,经过几次迭代之后再测试、调整,“如果测试结果不理想,需要把这个过程再走一遍,直到得到最优效果”。付聪说。

数据采集要有针对性。为了让模型更“聪明”,需要针对不同场景采集各种特殊数据。付聪和团队成员不仅需要到早晚高峰的地铁、热闹喧天的餐厅、人来人往的马路等场景,采集数百个小时的声音数据,还要戴上助听器体验这些声音的差别,“比如风声,正常人听到是呼呼声,但戴上助听器以后,是很吵的噗噗声,像是去KTV唱歌,声音使劲砸到麦克风上”。道路骑行、海边风浪……为了采集各种风噪数据,付聪录制了多种场景的风声。

数据“清洗”是将不需要的数据“洗掉”。付聪举了一个例子——风声,真实场景下会夹杂汽车鸣笛、人交谈等声音。在整理时要把这些数据剔除出来,保留一个比较纯粹的风声,这样模型才会“认识”风。

模型训练是将“清洗”好的数据“喂”给模型。除了采集的特殊数据,付聪和他的同事们还会加入诸如世界各国的语言和一些非语音声音等数据,“基本涵盖了人们生活中遇到的所有噪声和语音”。

和人类不同,人工智能模型在训练过程中,不会疲惫、烦躁、发脾气,它们的“智慧”取决于模型参数、训练策略、数据量等。“它们就像一个‘孩子’,会越来越‘聪明’,识别到越来越多的声音,我特别有成就感。”付聪说。

考验耐心、细致和忍受力

模型训练完成后,并不意味立刻能应用到听障人群的助听器上,还要经历较长时间的迭代、调整过程。

比如,为了让听障人群适配到合适的助听器,传统方式是患者反复到线下的验配店去试戴,过程繁杂。付聪解释说,一般情况下,根据发病原因不同可以将听力下降分为三类:感音神经性、传导性、混合性耳聋;根据听力下降的程度不同,分为轻度、中度、重度及极重度耳聋。针对不同的类型,助听器的适配方式有所不同。

有没有可能把适配过程搬到“线上”,利用人工智能算法和深度学习能力,让听障人群在线上就能做准确的听力验配?带着这个疑问,付聪开始研发适配算法。他将这个过程比喻为做应用题,需要查询国内外文献、检索现有方案,根据具体的使用环境,利用现有知识开展合理想象、设计实验、寻找答案。

这个过程考验人工智能训练师的耐心、细致。在测试助听器音质时,不同的佩戴方式,对应不同的测试结果。付聪和同事需要以“N×N”排列组合设计不同的佩戴方式,并且不断重复试验,来研究其对音质产生的影响。

这个过程十分考验人工智能训练师的忍受力。“一个人工智能训练师的基本素养,就是强迫自己听很多次刺耳的声音。”付聪表示,这是因为训练师需要定量衡量听障患者能正常听到的声音极限点,而这些声音的分贝数是正常人耳难以忍受的,“很多时候恨不得把耳机摔掉。经过一天测试,整个脑袋都感觉疼”。

经过不断迭代、调整,内置了算法的助听器终于完成了。最让付聪难忘的是他们第一次到广东韶关捐赠产品,他们把助听器挨个交到听障老人手上,开机、戴设备、调整增益……“虽然我对模型很有信心,但当时还是感觉心提到了嗓子眼,因为在此之前,老人们是无法正常交流的。”付聪说。

他小心地询问一个老人:“您能听到我在说什么吗?”

“可以了。”老人缓慢而又坚定地从口中说出3个字。

“那时候我觉得,我们做的这个事情挺有意义的。”付聪说。

用技术解决人类需求

人工智能训练师是一个需要忍受孤独的职业,因为他们大量的时间是在设计方案、写代码、采集数据、训练模型中度过的。

“我战胜孤独的秘密是兴趣。”付聪的专业是通信,其中很多课程和信号处理相关,他平时比较喜欢音乐,因此就将自己的兴趣和专业、工作结合起来,聚焦音频领域,大学毕业后参与了很多有关音频信号处理的工作,经历了音频算法从传统算法到人工智能算法,再到大规模深度学习的各个阶段。

在付聪看来,人工智能技术是一个很好的工具,目的是将人类从很多脑力劳动中解放出来,用规模化的方式去替代目前成本较高的个体劳动。对整个社会而言,这是一种生产力的进步,有着巨大的社会价值和商业价值。

成熟的人工智能技术是什么样?付聪认为需要经过3个阶段:一是感知智能,核心在于模拟人的视觉、听觉和触觉等感知能力,比如人脸识别、语音识别等;二是认知智能,具有人类思维理解、知识共享、行动协同或博弈等特征,“能够真正理解人在说什么,根据一些提示,提供相对完整的回答”;三是行为智能,也就是像自动驾驶一样,真正可以在物理世界发挥作用。

达到这样的目标,需要对人工智能模型不断进行训练。付聪表示,首先需要针对问题准备足够多的数据,“多到尽量涵盖解决这个问题时所遇到的所有情形”;其次需要设计很好的算法,并根据用户反馈不断优化。

“人工智能技术领域日新月异,要求人工智能训练师有广阔的视野、深厚的人文情怀和社会责任感,用业界最新想法、理念和正确的伦理观来帮助人类解决生产生活中遇到的问题。”付聪说。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-07-31 08:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

强强联合丨玖益助听进驻国内各大机场店
...投资和孵化等服务。是我国孵化加速企业合作数量最多的人工智能产业加速器,AI机器时代运营智能科技机场体验馆22个,覆盖全国深圳、北京、杭州、西安、成都等16个城市,覆盖超过3亿
2023-08-10 18:00:00
连续三年参展消博会,科大讯飞用AI改变消费者生活
...,带来不少新品或者新业态进行首秀。其中,A股上市的人工智能龙头公司科大讯飞连续三年携最新的AI产品亮相消博会,展出包括以AI办公为核心的消费级智能硬件,如讯飞翻译机、智能录音
2023-04-15 18:00:00
...模训练快速节能的尖峰神经网络。潜在的应用包括可穿戴人工智能(AI)、语音识别、增强现实等诸多领域。这种尖峰神经网络,可在称为神经形态硬件的芯片中实现,有望使AI程序更贴近用户
2023-05-10 01:46:00
老年照护,要“硬科技”,也要“软实力”
...类似蓝牙耳机,不仅可以放大声音,降低噪音,还能通过人工智能声学算法提升85%复杂场景下的清晰度和可懂度的助听器呢?在中国,老年听障群体规模达1.2亿,但佩戴助听器的人群却远低
2023-10-30 17:23:00
“AI训练师”:让人工智能越来越像人
本文转自:劳动报“AI训练师”:让人工智能越来越像人——“新质生产力下的职业观察”系列报道之二杨洪旭正在进行数据标注工作。■ 摄影 刘振思 ■劳动报记者 张锐杰 “近年来,
2024-03-14 02:47:00
研发者谈斯坦福家务机器人:泛化能力还不行,暂无商业计划
...板、开瓶盖,甚至逗猫猫。当地时间1月4日,斯坦福大学人工智能实验室计算机科学专业的博士生符梓鹏在社交媒体平台X上向网友介绍了这款名为Mobile Aloha的机器人
2024-01-23 09:41:00
...了来自人文、社科、科学、技术等领域的16位学者,围绕人工智能这一话题呈现相关领域的新知识、新观念、新视野。此次新知大会论坛的第一场和第三场,聚焦科学与哲学的思考;第二场和第四
2023-04-24 04:05:00
...产品展出。联影集团发布首款适合国人语言习惯的医疗级助听器,国产高端医疗级助听器有了“中国芯”。这也是国产助听器整机厂商首次实现从芯片、算法到整机及软件系统的源头性、全链条自主
2024-04-15 16:50:00
教人工智能读懂专业文件(新职业新故事)
本文转自:人民日报人工智能训练师帮助学习模型识别“有用”信息——教人工智能读懂专业文件(新职业新故事)本报记者 黄晓慧《 人民日报 》( 2024年08月27日 第 13 版)杨
2024-08-27 06:09:00
更多关于科技的资讯:
在2025年的最后一天,当大多数人准备迎接新年时,DeepSeek团队向学术社区提交了一篇技术论文。这篇论文迅速在人工智能领域引起关注
2026-01-03 08:31:00
元旦小长假,佳节团圆之时,亦是通信保障的关键时期,太原移动全方位筑牢节日通信防线,用满格的信号、畅通的网络,送上最真挚的新年祝福
2026-01-03 07:34:00
河北新闻网讯(王杨、王雪威)近日,河钢集团张宣科技生产的2万吨绿色汽车板材料下线,经检验,产品各项性能指标均满足订单标准
2026-01-02 22:20:00
鲁南眼科自有品牌「鲁南博视」光学镜片发布会暨成人验光配镜门诊一周年成功举办
鲁网1月1日讯2025年12月31日,鲁南眼科医院成功举办自有品牌「鲁南博视」光学镜片发布会暨成人验光配镜门诊一周年庆典
2026-01-02 16:41:00
新年第一天 燕赵沐朝晖|“雄安一号”星 测试太阳翼
编者按岁序更替,华章日新。2026年是“十五五”开局之年。锐始者必图其终,成功者先计于始。新年第一天,燕赵大地欣欣向荣
2026-01-02 07:05:00
注意缺陷与多动障碍 这个疾病越来越常见 都说长大就好了 为何缠上成人?
2025年12月31日凌晨,罗永浩在微博发文回应“科技春晚”发布会迟到40分钟事件,首次公开坦承自己受注意缺陷与多动障碍(ADHD)困扰多年
2026-01-02 08:06:00
近日,湘湖首部AI动画《湘湖漫游记》第五集上线,该系列作品正式收官。本片不仅是杭州湘湖(白马湖)研究院在“文化+科技”融合上的一次重要突破
2026-01-02 06:35:00
在杭州湖滨银泰in77的B区、D区之间,复古的国王十字车站、9站台出现在现场,仿佛下一秒就有巫师推着行李箱穿墙而过;一辆编号5972的霍格沃茨特快列车静静停靠在街区中央
2026-01-02 06:35:00
2025年度票房破518亿元 动画电影成亮点 安徽全国排名第十
大皖新闻讯 国家电影局2026年1月1日公布,2025年电影票房为518.32亿元,同比增长21.95%,城市院线观影人次为12
2026-01-01 17:14:00
免费抢鲜体验!香飘飘魔芋啵啵奶茶快闪体验活动空降临沂泰盛广场 健康爆款掀起跨年打卡热潮
鲁网1月1日讯 (记者 李文静)2025年12月31日晚,国民奶茶品牌香飘飘携新品“魔芋啵啵”奶茶,在山东临沂泰盛广场开启奶茶快闪体验活动
2026-01-01 15:52:00
厦门动漫嘉年华启幕 众多热门国漫IP集中参展
厦门动漫嘉年华各项活动精彩纷呈。(记者 林铭鸿 摄)厦门网讯(厦门日报记者 林露虹)展览面积超5万平方米,汇聚众多热门国漫IP
2026-01-01 08:41:00
助力低空应急产业发展——三明市应急管理局引进低空防御项目
东南网1月1日讯 2025年12月30日,由三明市应急管理局引进,南京云麒防务科技有限公司投资的福建鹏鑫智能科技有限公司
2026-01-01 09:33:00
近日,太长高速太原收费站智慧化升级改造全面完成并投入运营。项目以数字化转型为核心,围绕高峰期通行效率低、车辆拥堵等运营痛点
2026-01-01 07:17:00
沈洁任蓟州区代理区长 扫码阅读手机版
据“掌上蓟州”微信公众号消息,天津市蓟州区第二届人民代表大会常务委员会第三十五次会议决定:沈洁为天津市蓟州区人民政府代理区长。
2025-12-31 23:10:00
东南网12月31日讯(本网记者 卢金福)元旦佳节将至,消费市场迎来新一轮热潮。面对促销活动纷至沓来、消费场景多元拓展的新形势
2025-12-31 23:29:00