• 我的订阅
  • 科技

上海:发力语料,建设“模都”

类别:科技 发布时间:2024-07-06 13:16:00 来源:人民资讯

本文转自:人民网-上海频道

马作鹏 唐小丽

“人工智能,是人类养育的‘孩子’,而语料就是‘教材’!”

“我们希望人工智能在伦理价值上有德、情绪价值上有趣、文化价值上有品、社会价值上有序、技术价值上有用。”

7月6日上午,上海黄浦江畔,2024世界人工智能大会,一场关于人工智能语料的论坛首次举办。

时针回拨到一年前的今天——2023世界人工智能大会,上海市委书记陈吉宁与上海市市长龚正共同见证,上海人工智能实验室、人民网、国家气象中心等单位联合发起的中国第一个大模型语料数据联盟正式成立。

上海:发力语料,建设“模都”

2023年7月6日,大模型语料数据联盟成立。人民网记者 王初摄

人工智能大模型取决于三大要素:算力、算法、语料。算力是硬件,算法是大模型企业的核心竞争力。中国是世界上数字化应用场景最丰富的国家,各种场景提供了极为丰富的语料。中国是语料大国,但因为各种语料良莠不齐、涉及隐私,甚至违规、违法,目前急需与人类价值对齐的规范语料。

正因于此,上海才会如此重视语料建设。

纵观全国,北京、上海、深圳、杭州四地在人工智能领域深耕已久,正执产业发展之牛耳。上海的特点,是AI顶层设计有力,场景应用丰富,并在公共数据开源方面进行了长期大量的探索。

从183家到348家,上海人工智能产业规上企业数量在2018至2023年这5年间实现高速增长。商汤科技、达观数据、星环科技等企业开拓人工智能“新蓝海”,培育大模型产业发展新生态,加快形成新质生产力。

上海市已有34款大模型通过备案,产生了制造业、金融、具身智能机器人等垂类领域应用;多款通用人形机器人原型机发布,实现双足避障行走;4200亿Token的语料数据实现开源。

2023年被称作“智能互联网元年”,这一年,我们见证了激烈的“百模大战”。除了科技巨头先后入局之外,迅速崛起的一批AI企业也在不断进场。

而备受业界关注的语料数据的应用,还需在人工智能具体实践中找到未来。

人工智能,是上海着力发展的三大先导产业之一,也是发展新质生产力的重要引擎。随着大模型时代到来,上海力图先行一步,构建大模型创新策源地,建设新的“模都”。

去年9月,2023世界人工智能大会闭幕不久,上海“模速空间”创新生态社区即在徐汇西岸揭牌成立。作为全国首个、上海唯一的生成式AI专业孵化和加速载体,目前这里已入驻大模型上下游企业80余家,力争成为代表上海乃至国家赢取全球科技战略竞争主动权的“主力因子”。

上海:发力语料,建设“模都”

全国首个大模型创新生态社区“模速空间”。受访单位供图

今年3月下旬,在上海市经信委大力推进下,由上海人工智能实验室、人民网、中国电信、商汤、阶跃星辰等多家头部人工智能领军企业共同出资,注册成立中国第一家人工智能语料公司——上海库帕思科技有限公司。库帕思公司董事长山栋明表示,希望为全国的人工智能企业提供“1+N”式的语料服务。其中,“1”为公共的核心语料,包括世界知识体系和价值对齐体系;“N”为面向垂直应用领域等的专业语料。

在追逐浪潮中,不少企业发现,并非谁都有精力、有能力去做基础大模型,于是“小模型”——垂类大模型顺势而生。专门为具体行业而设计的“小模型”如何在企业等应用场景落地?这是许多AI企业负责人普遍关注的问题。

“银行审计业务面临数据信息和系统架构的分散性、异构性和复杂性等问题,深挖各类数据的价值一直是挑战,且银行内部数据的有效利用率普遍不高,尤其是审计部门内部大量文本数据未形成资产。”多年来,深耕垂类大模型领域的达观数据在金融行业文本处理方面,积累了大量金融专业数据。

如今,达观数据的垂类大模型已经开始面向银行审计人员,为审计监控平台提供接口服务,还可对各类文档进行比对,大大提高工作效率。

“楼上住户噪音扰民,尤其晚上进出人很多,怀疑是群租房,请管理部门尽快解决。”近日,浦东新区塘桥街道城运中心接到12345市民热线投诉工单,“数字社工”城运助手立即对工单内容进行分析,并自动精准分派给主、协办部门处置,整个流程不到2分钟。

“数字社工”以大模型为底座,能够适应基层政务的多种使用场景。“以前,工单派遣靠经验,分析研判靠人工,费时费力。”自“数字社工”上岗以来,在城运中心工作十余年的卜丹凤见证了科技给基层治理带来的变化。

上海:发力语料,建设“模都”

“数字社工”能够将工单分布情况生成热力图。人民网记者 唐小丽摄

如今,塘桥街道城运中心自动派单准确率超过90%,工单处置效率提升60%,绩效分析和报表生成从2小时缩减至10分钟,居民回访满意度再提升。“这样的技术应用,真是实实在在为基层减负。”卜丹凤感慨道。

协同区域发展、构建智慧城市、重塑商业密码、打造数字文娱……在上海,AI正深度链接千行百业。拥抱“人工智能+”,在AI助力下推动传统行业转型升级,指引新兴行业加速生长,已成为当下业界共识,发展趋势不可阻挡。

上海:发力语料,建设“模都”

2024年7月6日的语料论坛上,语料库建设导则正式发布。人民网记者 王初摄

“人工智能训练,不仅要关注数据语料的数量,也要重视’数据配方’,用高质量数据的最优组合,提升AI效能与安全性。”语料论坛上,人民网负责人介绍,通过伦理价值、情绪价值、文化价值、社会价值、技术价值五个维度的对齐,建设优质语料“好教材”,帮助大模型成长为“以人为本、智能向善、造福人类”、符合全人类共同价值的“好孩子”。

事实上,人民网在人工智能基础语料库的建设工作布局已久。

据人民日报社传播内容认知全国重点实验室研究员郭俊波介绍,该实验室成立于2019年11月,由人民日报社主管,依托人民网建设。实验室建设以国家重大需求为导向、应用基础研究为定位、学科交叉融合为特色,助推媒体融合向纵深发展。

在他看来,人工智能的多维度价值对齐需要根据不同维度的具体要求,结合其重要程度与规范性要求,制定分级分类标准,形成对人工智能进行安全风险和能力水平评价的规范和要求,指导语料资源的建设,提升人工智能的价值对齐能力。

针对当前人工智能在价值对齐方面的瓶颈问题,郭俊波和人民网上海分公司总经理、库帕思董事金煜纯介绍,未来实验室将与上海库帕思公司携手,共同建设价值对齐体系语料,形成以基础语料和问答语料2种形式为主,覆盖5大价值、3大圈层、14个类别、38个细分维度的高质量、多维度价值对齐基石语料库。双方将结合各自在数据、技术、人才等方面的优势资源,共同为人工智能的价值对齐和能力提升提供高质量教材和语料。

如何获取高质量的数据?如何让大模型更好落地造福人类?未知的明天,既是机遇,亦是挑战,大模型一路成长为符合人类共同价值的“好孩子”,尚需多方携手并肩。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-07-06 14:45:04

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

共建上海大模型语料繁荣生态,全球开发者先锋大会“语料筑基 智生时代”论坛在沪举办
...海库帕思科技有限公司承办,漕河泾开发区总公司、上海人工智能实验室、商汤科技、阶跃星辰、稀宇科技等公司联合协办。上海市经济和信息化委员会副主任张宏韬,徐汇区委常委、副区长俞林伟
2025-02-23 08:49:00
星环科技成功举办数据要素市场与大模型语料库论坛
...联盟开放日活动”成功举办,活动上200余家大模型数据、人工智能及技术企业及相关机构代表出席会议。上海市经信委信息化推进处处长钱晓致辞表示,大模型发展到现阶段,高质量的语料数据
2023-11-27 16:02:00
大模型“百花齐放” 业界合力“充实”中文语料数据
...大模型的中文语料数据。中国大模型语料数据联盟由上海人工智能实验室、中国科学技术信息研究所等单位在今年的世界人工智能大会上联合发起成立,致力建设开放型的大模型语料数据生态圈。上
2023-09-08 21:31:00
首个语料库建设导则面世!近二十家企业共同发布
...语料数据资源是AI时代的重要基石。7月6日上午,2024世界人工智能大会语料主题论坛在上海世博中心举办。本次论坛以“语料筑基,智生时代”为主题,围绕高质量语料数据如何高效供给
2024-07-06 17:50:00
AI价值对齐“五有”框架在世界人工智能大会发布
...人民网上海7月7日电 (记者唐小丽)高质量的语料是确保人工智能价值对齐的关键要素。7月6日,2024世界人工智能大会在沪举办期间,以“语料筑基,智生时代”为主题的首场语料论坛
2024-07-07 12:25:00
上海:加速实施“模塑申城”
...发者先锋大会”将于2月21日至23日在徐汇举办,旨在推动人工智能产业场景落地,加速人工智能商业化进程。今年,上海正瞄准技术前沿,加快推进人工智能“模塑申城”实施方案落实和重点
2025-02-20 15:49:00
“2024语料风云榜”发布,10家企业上榜!
...语料数据资源是AI时代的重要基石。7月6日上午,2024世界人工智能大会语料主题论坛在上海世博中心举办。本次论坛以“语料筑基,智生时代”为主题,围绕高质量语料数据如何高效供给
2024-07-06 17:50:00
【上海人工智能实验室单位联合发起大模型语料数据联盟】财联社7月6日电,2023世界人工智能大会7月6日在上海世博中心正式开幕。上海人工智能实验室、中国科学技术信息研究所、上海数据
2023-07-06 14:27:00
语料运营平台1.0在沪上线,首批十大高质量语料产品发布
...语料数据资源是AI时代的重要基石。7月6日上午,2024世界人工智能大会语料主题论坛在上海世博中心举办。本次论坛以“语料筑基,智生时代”为主题,围绕高质量语料数据如何高效供给
2024-07-06 17:50:00
更多关于科技的资讯:
中国科大实现碳化硅改性双空位色心的电荷态调控
大皖新闻讯 2月21日,大皖新闻记者从中国科学技术大学获悉,该校郭光灿院士团队在碳化硅改性双空位色心电荷态调控的研究中取得了新进展
2026-02-21 16:48:00
戛纳世界人工智能大会探讨“音乐人工智能”
中国青年报客户端讯(中青报·中青网记者 蒋肖斌)2026戛纳世界人工智能大会(WAICF 2026),近日在法国戛纳举办
2026-02-21 12:10:00
杭州一家高科技创业公司员工 每人领一个陪伴机器人回家过年
春节去各地见见世面长长“脑子”这个春节,大多数打工人都卸下KPI返乡团聚。杭州一家名为镭萌科技的创业公司,却有一群特殊的“员工”在忙着长“脑子”
2026-02-21 08:11:00
建设一流创新生态 激发创新投资需求杭州日报讯 日前,浙江(杭州)知识产权创新产业园内,一场旨在连接技术与资本的专利产业化投融资专项对接活动火热举行
2026-02-21 08:11:00
新春佳节,浙江不少企业春节“不打烊”,抢订单、赶交付、跑海外,把年过在了车间里和海外展台前。走进宁波这家科技企业,工作人员正紧盯屏幕
2026-02-20 15:04:00
马年春节,杭城消费市场持续升温。一批全国首店、浙江首店、杭州首店密集登陆湖滨、武林、钱江新城、奥体等核心商圈,覆盖潮玩
2026-02-20 07:31:00
大年初三,杭州苏宁易购庆春路店暖意融融。大厅里“焕新幸福年”的红色标语格外醒目。店内客流平稳,多为全家同行的家庭顾客,虽不似年前拥挤
2026-02-20 08:01:00
“库迪咖啡竟然涨价了,9.9元的咖啡以后还能闭眼冲吗?”春节前最后一个工作日,东北姑娘小乔中午赶到杭州火车东站,准备坐高铁回老家
2026-02-20 08:01:00
潮声丨从“Made in”到“Design by”,浙江品牌出海记
新春,义乌老板们已经忙碌起来。这几天,24家义乌企业亮相2026年美国拉斯维加斯服装服饰及面料展,带着新品抢订单、拓市场
2026-02-19 16:24:00
新春走基层|“解码”潮玩盲盒:Z世代用情绪消费点亮团圆年
中青报·中青网记者沈杰群余冰玥李怡蒙见习记者蒋欣雨95后北京职员王之怡在新加坡休假时,特意去了环球影城附近的泡泡玛特,店内挤满了年轻人
2026-02-19 12:05:00
大年初一,匆匆赶到湖州的生产基地,给春节坚持留守在生产一线的一百多名员工发完新春红包后,金羽新能董事长兼总经理黄杜斌又拿起了手机
2026-02-19 08:20:00
以下为报道原文:从“猜你喜欢”到“懂你需要” 人工智能加速“嵌入”日常生活人民日报 记者 谷业凯“帮我订春节假期南京到三亚的往返机票
2026-02-18 17:52:00
重要突破!中国科大发现新型有序物态——理想非晶体
大皖新闻讯 2月18日,大皖新闻记者从中国科学技术大学获悉,该校童华教授、徐宁教授及其合作者在非晶物态理论研究中取得重要突破
2026-02-18 17:53:00
新岁启程,马蹄声疾。骉(biāo),《说文解字》解读为“众马也”。单从字形便觉气势如虹,三马叠加,并辔而行。从一马当先
2026-02-18 14:39:00