• 我的订阅
  • 科技

上海:发力语料,建设“模都”

类别:科技 发布时间:2024-07-06 13:16:00 来源:人民资讯

本文转自:人民网-上海频道

马作鹏 唐小丽

“人工智能,是人类养育的‘孩子’,而语料就是‘教材’!”

“我们希望人工智能在伦理价值上有德、情绪价值上有趣、文化价值上有品、社会价值上有序、技术价值上有用。”

7月6日上午,上海黄浦江畔,2024世界人工智能大会,一场关于人工智能语料的论坛首次举办。

时针回拨到一年前的今天——2023世界人工智能大会,上海市委书记陈吉宁与上海市市长龚正共同见证,上海人工智能实验室、人民网、国家气象中心等单位联合发起的中国第一个大模型语料数据联盟正式成立。

上海:发力语料,建设“模都”

2023年7月6日,大模型语料数据联盟成立。人民网记者 王初摄

人工智能大模型取决于三大要素:算力、算法、语料。算力是硬件,算法是大模型企业的核心竞争力。中国是世界上数字化应用场景最丰富的国家,各种场景提供了极为丰富的语料。中国是语料大国,但因为各种语料良莠不齐、涉及隐私,甚至违规、违法,目前急需与人类价值对齐的规范语料。

正因于此,上海才会如此重视语料建设。

纵观全国,北京、上海、深圳、杭州四地在人工智能领域深耕已久,正执产业发展之牛耳。上海的特点,是AI顶层设计有力,场景应用丰富,并在公共数据开源方面进行了长期大量的探索。

从183家到348家,上海人工智能产业规上企业数量在2018至2023年这5年间实现高速增长。商汤科技、达观数据、星环科技等企业开拓人工智能“新蓝海”,培育大模型产业发展新生态,加快形成新质生产力。

上海市已有34款大模型通过备案,产生了制造业、金融、具身智能机器人等垂类领域应用;多款通用人形机器人原型机发布,实现双足避障行走;4200亿Token的语料数据实现开源。

2023年被称作“智能互联网元年”,这一年,我们见证了激烈的“百模大战”。除了科技巨头先后入局之外,迅速崛起的一批AI企业也在不断进场。

而备受业界关注的语料数据的应用,还需在人工智能具体实践中找到未来。

人工智能,是上海着力发展的三大先导产业之一,也是发展新质生产力的重要引擎。随着大模型时代到来,上海力图先行一步,构建大模型创新策源地,建设新的“模都”。

去年9月,2023世界人工智能大会闭幕不久,上海“模速空间”创新生态社区即在徐汇西岸揭牌成立。作为全国首个、上海唯一的生成式AI专业孵化和加速载体,目前这里已入驻大模型上下游企业80余家,力争成为代表上海乃至国家赢取全球科技战略竞争主动权的“主力因子”。

上海:发力语料,建设“模都”

全国首个大模型创新生态社区“模速空间”。受访单位供图

今年3月下旬,在上海市经信委大力推进下,由上海人工智能实验室、人民网、中国电信、商汤、阶跃星辰等多家头部人工智能领军企业共同出资,注册成立中国第一家人工智能语料公司——上海库帕思科技有限公司。库帕思公司董事长山栋明表示,希望为全国的人工智能企业提供“1+N”式的语料服务。其中,“1”为公共的核心语料,包括世界知识体系和价值对齐体系;“N”为面向垂直应用领域等的专业语料。

在追逐浪潮中,不少企业发现,并非谁都有精力、有能力去做基础大模型,于是“小模型”——垂类大模型顺势而生。专门为具体行业而设计的“小模型”如何在企业等应用场景落地?这是许多AI企业负责人普遍关注的问题。

“银行审计业务面临数据信息和系统架构的分散性、异构性和复杂性等问题,深挖各类数据的价值一直是挑战,且银行内部数据的有效利用率普遍不高,尤其是审计部门内部大量文本数据未形成资产。”多年来,深耕垂类大模型领域的达观数据在金融行业文本处理方面,积累了大量金融专业数据。

如今,达观数据的垂类大模型已经开始面向银行审计人员,为审计监控平台提供接口服务,还可对各类文档进行比对,大大提高工作效率。

“楼上住户噪音扰民,尤其晚上进出人很多,怀疑是群租房,请管理部门尽快解决。”近日,浦东新区塘桥街道城运中心接到12345市民热线投诉工单,“数字社工”城运助手立即对工单内容进行分析,并自动精准分派给主、协办部门处置,整个流程不到2分钟。

“数字社工”以大模型为底座,能够适应基层政务的多种使用场景。“以前,工单派遣靠经验,分析研判靠人工,费时费力。”自“数字社工”上岗以来,在城运中心工作十余年的卜丹凤见证了科技给基层治理带来的变化。

上海:发力语料,建设“模都”

“数字社工”能够将工单分布情况生成热力图。人民网记者 唐小丽摄

如今,塘桥街道城运中心自动派单准确率超过90%,工单处置效率提升60%,绩效分析和报表生成从2小时缩减至10分钟,居民回访满意度再提升。“这样的技术应用,真是实实在在为基层减负。”卜丹凤感慨道。

协同区域发展、构建智慧城市、重塑商业密码、打造数字文娱……在上海,AI正深度链接千行百业。拥抱“人工智能+”,在AI助力下推动传统行业转型升级,指引新兴行业加速生长,已成为当下业界共识,发展趋势不可阻挡。

上海:发力语料,建设“模都”

2024年7月6日的语料论坛上,语料库建设导则正式发布。人民网记者 王初摄

“人工智能训练,不仅要关注数据语料的数量,也要重视’数据配方’,用高质量数据的最优组合,提升AI效能与安全性。”语料论坛上,人民网负责人介绍,通过伦理价值、情绪价值、文化价值、社会价值、技术价值五个维度的对齐,建设优质语料“好教材”,帮助大模型成长为“以人为本、智能向善、造福人类”、符合全人类共同价值的“好孩子”。

事实上,人民网在人工智能基础语料库的建设工作布局已久。

据人民日报社传播内容认知全国重点实验室研究员郭俊波介绍,该实验室成立于2019年11月,由人民日报社主管,依托人民网建设。实验室建设以国家重大需求为导向、应用基础研究为定位、学科交叉融合为特色,助推媒体融合向纵深发展。

在他看来,人工智能的多维度价值对齐需要根据不同维度的具体要求,结合其重要程度与规范性要求,制定分级分类标准,形成对人工智能进行安全风险和能力水平评价的规范和要求,指导语料资源的建设,提升人工智能的价值对齐能力。

针对当前人工智能在价值对齐方面的瓶颈问题,郭俊波和人民网上海分公司总经理、库帕思董事金煜纯介绍,未来实验室将与上海库帕思公司携手,共同建设价值对齐体系语料,形成以基础语料和问答语料2种形式为主,覆盖5大价值、3大圈层、14个类别、38个细分维度的高质量、多维度价值对齐基石语料库。双方将结合各自在数据、技术、人才等方面的优势资源,共同为人工智能的价值对齐和能力提升提供高质量教材和语料。

如何获取高质量的数据?如何让大模型更好落地造福人类?未知的明天,既是机遇,亦是挑战,大模型一路成长为符合人类共同价值的“好孩子”,尚需多方携手并肩。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-07-06 14:45:04

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

共建上海大模型语料繁荣生态,全球开发者先锋大会“语料筑基 智生时代”论坛在沪举办
...海库帕思科技有限公司承办,漕河泾开发区总公司、上海人工智能实验室、商汤科技、阶跃星辰、稀宇科技等公司联合协办。上海市经济和信息化委员会副主任张宏韬,徐汇区委常委、副区长俞林伟
2025-02-23 08:49:00
星环科技成功举办数据要素市场与大模型语料库论坛
...联盟开放日活动”成功举办,活动上200余家大模型数据、人工智能及技术企业及相关机构代表出席会议。上海市经信委信息化推进处处长钱晓致辞表示,大模型发展到现阶段,高质量的语料数据
2023-11-27 16:02:00
大模型“百花齐放” 业界合力“充实”中文语料数据
...大模型的中文语料数据。中国大模型语料数据联盟由上海人工智能实验室、中国科学技术信息研究所等单位在今年的世界人工智能大会上联合发起成立,致力建设开放型的大模型语料数据生态圈。上
2023-09-08 21:31:00
首个语料库建设导则面世!近二十家企业共同发布
...语料数据资源是AI时代的重要基石。7月6日上午,2024世界人工智能大会语料主题论坛在上海世博中心举办。本次论坛以“语料筑基,智生时代”为主题,围绕高质量语料数据如何高效供给
2024-07-06 17:50:00
AI价值对齐“五有”框架在世界人工智能大会发布
...人民网上海7月7日电 (记者唐小丽)高质量的语料是确保人工智能价值对齐的关键要素。7月6日,2024世界人工智能大会在沪举办期间,以“语料筑基,智生时代”为主题的首场语料论坛
2024-07-07 12:25:00
上海:加速实施“模塑申城”
...发者先锋大会”将于2月21日至23日在徐汇举办,旨在推动人工智能产业场景落地,加速人工智能商业化进程。今年,上海正瞄准技术前沿,加快推进人工智能“模塑申城”实施方案落实和重点
2025-02-20 15:49:00
【上海人工智能实验室单位联合发起大模型语料数据联盟】财联社7月6日电,2023世界人工智能大会7月6日在上海世博中心正式开幕。上海人工智能实验室、中国科学技术信息研究所、上海数据
2023-07-06 14:27:00
“2024语料风云榜”发布,10家企业上榜!
...语料数据资源是AI时代的重要基石。7月6日上午,2024世界人工智能大会语料主题论坛在上海世博中心举办。本次论坛以“语料筑基,智生时代”为主题,围绕高质量语料数据如何高效供给
2024-07-06 17:50:00
千行百业加速拥抱大模型(AI前沿观察)
...P28)在阿联酋迪拜举行。大会期间,中国研究团队展示的人工智能气候大模型引发广泛关注。此款名为“伏羲”的大模型,对气象进行预报的时间范围长、精度高。当前,中国国产大模型进入高
2023-12-22 03:26:00
更多关于科技的资讯:
国产高端主控芯片模组厂在江北新区投产固态硬盘“大脑”,南京造!南报网讯(通讯员胡晓靓记者夏思宇)身处数字化时代,固态硬盘(SSD)是掌握系统运行速度
2025-09-11 08:50:00
8个月引来24个项目,建邺招商“亿”军突起9月,德国奥乐齐首进南京建区域总部□南京日报/紫金山新闻记者 卫凌云 通讯员建投宣招商热潮涌
2025-09-11 07:44:00
南瑞继保发挥“头雁效应”,带领全产业链跑出中国智能电网自主创新路让产业链“筋骨”更壮“血脉”更通□南京日报/紫金山新闻记者黄琳燕国网湖南衡阳站
2025-09-11 07:44:00
近30家赣企参展投洽会 江西前沿科技亮绝活
本报讯 全媒体记者陈春伟报道:9月8日至9月11日,第二十五届中国国际投资贸易洽谈会(简称“投洽会”)在福建厦门举行。江西组织近30家优质企业参展
2025-09-11 06:36:00
2025服贸会丨走进贵州展区 一睹服贸“新”风采
2025年中国国际服务贸易交易会(简称“服贸会”)于9月10日至14日在北京首钢园区举办。其间,贵州将以“开放贵州,创新服贸”为主题设立展区
2025-09-11 03:24:00
烟台高新区多家企业入围第十届“创客中国”时空信息大赛决赛
胶东在线9月9日讯(通讯员 郭健)近日,由工业和信息化部网络安全产业发展中心(工业和信息化部信息中心)、北京市经济和信息化局联合主办
2025-09-11 03:03:00
8月28日,秦皇岛市海港区阿尔勃特空间智能(河北)视觉技术有限公司展示区,公司副总经理朱晓明用语音进行操作,要求机器人“鲁班1号”打好对应工位的螺丝
2025-09-10 08:27:00
第六届中国人工智能大赛在厦启动 描绘“数实融合”新图景
扫码了解详情厦门网讯(厦门日报全媒体记者 翁华鸿)在生成式人工智能持续迭代演进、与实体经济深度融合的背景下,一场高规格的人工智能盛会再度在厦门启航
2025-09-10 08:27:00
上海人工智能实验室主任、首席科学家周伯文:“人工智能+供应链”创新成果将在厦涌现
周伯文。(厦门日报全媒体记者 王火炎 摄)厦门正在全力推进国家人工智能应用中试基地建设,一批“人工智能+供应链”的创新成果有望在此加速涌现
2025-09-10 08:58:00
随着中报陆续披露,在今年国内医疗器械行业普遍承压的大环境下,鱼跃医疗交出了一份营收、净利双增的亮眼答卷,其中海外业务同比增长26
2025-09-10 09:17:00
上海时尚之都的形象深入人心,时装之外,上海还是一座美妆之城。今年8月,胡润研究院发布《2025 CBE·胡润中国彩妆品牌TOP50》报告
2025-09-10 10:55:00
当消费市场从规模竞赛转向价值深耕时,一场以民生需求为罗盘的产业变革正加速演进。国家统计局日前发布的数据显示,今年1—7月
2025-09-10 10:55:00
青岛锐智智能装备科技股份有限公司:科技创新引领高质量发展
鲁网9月10日讯(记者 葛万彩)在国际国内市场竞争异常激烈的形势下,青岛锐智智能装备科技股份有限公司靠科技人员自主研发
2025-09-10 11:20:00
AirPods Pro 3 登场了!耳机支持测心率,实时翻译功能国行暂不支持
在今日凌晨举行的“前方超燃”苹果发布会上,AirPods Pro 3正式亮相。这款耳机不仅延续了苹果经典的简约设计和出色音质
2025-09-10 11:24:00
重大变革!iPhone17将仅支持eSIM,不再配备实体卡槽,苹果官网默默下架iPhone16pro
9月10日,在凌晨举行的苹果2025秋季新品发布会上,苹果宣布,“史上最薄”iPhone Air 将在全球范围内统一采用仅支持eSIM的设计
2025-09-10 11:24:00