• 我的订阅
  • 科技

上海:发力语料,建设“模都”

类别:科技 发布时间:2024-07-06 13:16:00 来源:人民资讯

本文转自:人民网-上海频道

马作鹏 唐小丽

“人工智能,是人类养育的‘孩子’,而语料就是‘教材’!”

“我们希望人工智能在伦理价值上有德、情绪价值上有趣、文化价值上有品、社会价值上有序、技术价值上有用。”

7月6日上午,上海黄浦江畔,2024世界人工智能大会,一场关于人工智能语料的论坛首次举办。

时针回拨到一年前的今天——2023世界人工智能大会,上海市委书记陈吉宁与上海市市长龚正共同见证,上海人工智能实验室、人民网、国家气象中心等单位联合发起的中国第一个大模型语料数据联盟正式成立。

上海:发力语料,建设“模都”

2023年7月6日,大模型语料数据联盟成立。人民网记者 王初摄

人工智能大模型取决于三大要素:算力、算法、语料。算力是硬件,算法是大模型企业的核心竞争力。中国是世界上数字化应用场景最丰富的国家,各种场景提供了极为丰富的语料。中国是语料大国,但因为各种语料良莠不齐、涉及隐私,甚至违规、违法,目前急需与人类价值对齐的规范语料。

正因于此,上海才会如此重视语料建设。

纵观全国,北京、上海、深圳、杭州四地在人工智能领域深耕已久,正执产业发展之牛耳。上海的特点,是AI顶层设计有力,场景应用丰富,并在公共数据开源方面进行了长期大量的探索。

从183家到348家,上海人工智能产业规上企业数量在2018至2023年这5年间实现高速增长。商汤科技、达观数据、星环科技等企业开拓人工智能“新蓝海”,培育大模型产业发展新生态,加快形成新质生产力。

上海市已有34款大模型通过备案,产生了制造业、金融、具身智能机器人等垂类领域应用;多款通用人形机器人原型机发布,实现双足避障行走;4200亿Token的语料数据实现开源。

2023年被称作“智能互联网元年”,这一年,我们见证了激烈的“百模大战”。除了科技巨头先后入局之外,迅速崛起的一批AI企业也在不断进场。

而备受业界关注的语料数据的应用,还需在人工智能具体实践中找到未来。

人工智能,是上海着力发展的三大先导产业之一,也是发展新质生产力的重要引擎。随着大模型时代到来,上海力图先行一步,构建大模型创新策源地,建设新的“模都”。

去年9月,2023世界人工智能大会闭幕不久,上海“模速空间”创新生态社区即在徐汇西岸揭牌成立。作为全国首个、上海唯一的生成式AI专业孵化和加速载体,目前这里已入驻大模型上下游企业80余家,力争成为代表上海乃至国家赢取全球科技战略竞争主动权的“主力因子”。

上海:发力语料,建设“模都”

全国首个大模型创新生态社区“模速空间”。受访单位供图

今年3月下旬,在上海市经信委大力推进下,由上海人工智能实验室、人民网、中国电信、商汤、阶跃星辰等多家头部人工智能领军企业共同出资,注册成立中国第一家人工智能语料公司——上海库帕思科技有限公司。库帕思公司董事长山栋明表示,希望为全国的人工智能企业提供“1+N”式的语料服务。其中,“1”为公共的核心语料,包括世界知识体系和价值对齐体系;“N”为面向垂直应用领域等的专业语料。

在追逐浪潮中,不少企业发现,并非谁都有精力、有能力去做基础大模型,于是“小模型”——垂类大模型顺势而生。专门为具体行业而设计的“小模型”如何在企业等应用场景落地?这是许多AI企业负责人普遍关注的问题。

“银行审计业务面临数据信息和系统架构的分散性、异构性和复杂性等问题,深挖各类数据的价值一直是挑战,且银行内部数据的有效利用率普遍不高,尤其是审计部门内部大量文本数据未形成资产。”多年来,深耕垂类大模型领域的达观数据在金融行业文本处理方面,积累了大量金融专业数据。

如今,达观数据的垂类大模型已经开始面向银行审计人员,为审计监控平台提供接口服务,还可对各类文档进行比对,大大提高工作效率。

“楼上住户噪音扰民,尤其晚上进出人很多,怀疑是群租房,请管理部门尽快解决。”近日,浦东新区塘桥街道城运中心接到12345市民热线投诉工单,“数字社工”城运助手立即对工单内容进行分析,并自动精准分派给主、协办部门处置,整个流程不到2分钟。

“数字社工”以大模型为底座,能够适应基层政务的多种使用场景。“以前,工单派遣靠经验,分析研判靠人工,费时费力。”自“数字社工”上岗以来,在城运中心工作十余年的卜丹凤见证了科技给基层治理带来的变化。

上海:发力语料,建设“模都”

“数字社工”能够将工单分布情况生成热力图。人民网记者 唐小丽摄

如今,塘桥街道城运中心自动派单准确率超过90%,工单处置效率提升60%,绩效分析和报表生成从2小时缩减至10分钟,居民回访满意度再提升。“这样的技术应用,真是实实在在为基层减负。”卜丹凤感慨道。

协同区域发展、构建智慧城市、重塑商业密码、打造数字文娱……在上海,AI正深度链接千行百业。拥抱“人工智能+”,在AI助力下推动传统行业转型升级,指引新兴行业加速生长,已成为当下业界共识,发展趋势不可阻挡。

上海:发力语料,建设“模都”

2024年7月6日的语料论坛上,语料库建设导则正式发布。人民网记者 王初摄

“人工智能训练,不仅要关注数据语料的数量,也要重视’数据配方’,用高质量数据的最优组合,提升AI效能与安全性。”语料论坛上,人民网负责人介绍,通过伦理价值、情绪价值、文化价值、社会价值、技术价值五个维度的对齐,建设优质语料“好教材”,帮助大模型成长为“以人为本、智能向善、造福人类”、符合全人类共同价值的“好孩子”。

事实上,人民网在人工智能基础语料库的建设工作布局已久。

据人民日报社传播内容认知全国重点实验室研究员郭俊波介绍,该实验室成立于2019年11月,由人民日报社主管,依托人民网建设。实验室建设以国家重大需求为导向、应用基础研究为定位、学科交叉融合为特色,助推媒体融合向纵深发展。

在他看来,人工智能的多维度价值对齐需要根据不同维度的具体要求,结合其重要程度与规范性要求,制定分级分类标准,形成对人工智能进行安全风险和能力水平评价的规范和要求,指导语料资源的建设,提升人工智能的价值对齐能力。

针对当前人工智能在价值对齐方面的瓶颈问题,郭俊波和人民网上海分公司总经理、库帕思董事金煜纯介绍,未来实验室将与上海库帕思公司携手,共同建设价值对齐体系语料,形成以基础语料和问答语料2种形式为主,覆盖5大价值、3大圈层、14个类别、38个细分维度的高质量、多维度价值对齐基石语料库。双方将结合各自在数据、技术、人才等方面的优势资源,共同为人工智能的价值对齐和能力提升提供高质量教材和语料。

如何获取高质量的数据?如何让大模型更好落地造福人类?未知的明天,既是机遇,亦是挑战,大模型一路成长为符合人类共同价值的“好孩子”,尚需多方携手并肩。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-07-06 14:45:04

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

共建上海大模型语料繁荣生态,全球开发者先锋大会“语料筑基 智生时代”论坛在沪举办
...海库帕思科技有限公司承办,漕河泾开发区总公司、上海人工智能实验室、商汤科技、阶跃星辰、稀宇科技等公司联合协办。上海市经济和信息化委员会副主任张宏韬,徐汇区委常委、副区长俞林伟
2025-02-23 08:49:00
星环科技成功举办数据要素市场与大模型语料库论坛
...联盟开放日活动”成功举办,活动上200余家大模型数据、人工智能及技术企业及相关机构代表出席会议。上海市经信委信息化推进处处长钱晓致辞表示,大模型发展到现阶段,高质量的语料数据
2023-11-27 16:02:00
大模型“百花齐放” 业界合力“充实”中文语料数据
...大模型的中文语料数据。中国大模型语料数据联盟由上海人工智能实验室、中国科学技术信息研究所等单位在今年的世界人工智能大会上联合发起成立,致力建设开放型的大模型语料数据生态圈。上
2023-09-08 21:31:00
首个语料库建设导则面世!近二十家企业共同发布
...语料数据资源是AI时代的重要基石。7月6日上午,2024世界人工智能大会语料主题论坛在上海世博中心举办。本次论坛以“语料筑基,智生时代”为主题,围绕高质量语料数据如何高效供给
2024-07-06 17:50:00
AI价值对齐“五有”框架在世界人工智能大会发布
...人民网上海7月7日电 (记者唐小丽)高质量的语料是确保人工智能价值对齐的关键要素。7月6日,2024世界人工智能大会在沪举办期间,以“语料筑基,智生时代”为主题的首场语料论坛
2024-07-07 12:25:00
上海:加速实施“模塑申城”
...发者先锋大会”将于2月21日至23日在徐汇举办,旨在推动人工智能产业场景落地,加速人工智能商业化进程。今年,上海正瞄准技术前沿,加快推进人工智能“模塑申城”实施方案落实和重点
2025-02-20 15:49:00
【上海人工智能实验室单位联合发起大模型语料数据联盟】财联社7月6日电,2023世界人工智能大会7月6日在上海世博中心正式开幕。上海人工智能实验室、中国科学技术信息研究所、上海数据
2023-07-06 14:27:00
“2024语料风云榜”发布,10家企业上榜!
...语料数据资源是AI时代的重要基石。7月6日上午,2024世界人工智能大会语料主题论坛在上海世博中心举办。本次论坛以“语料筑基,智生时代”为主题,围绕高质量语料数据如何高效供给
2024-07-06 17:50:00
千行百业加速拥抱大模型(AI前沿观察)
...P28)在阿联酋迪拜举行。大会期间,中国研究团队展示的人工智能气候大模型引发广泛关注。此款名为“伏羲”的大模型,对气象进行预报的时间范围长、精度高。当前,中国国产大模型进入高
2023-12-22 03:26:00
更多关于科技的资讯:
正雅发布2025年度发展报告:全球布局持续深化
2025年,正雅在正畸技术研发、国际学术交流与海外市场布局等方面持续推进,多项阶段性成果逐步落地,GS颌位重建技术的临床应用规模与国际影响力进一步扩大
2026-01-06 11:14:00
元旦假期厦门消费市场“火力全开”“以旧换新”带动消费超5000万元东南网1月6日讯(海峡导报记者 孙春燕)新年伊始,厦门消费市场就展现出十足的活力
2026-01-06 12:42:00
这家人工智能科普馆带你开启奇幻旅程
2025年12月21日,在廊坊市人工智能科普馆,讲解员为小朋友讲解AI知识。河北日报记者刘杰摄当好奇心满满的孩子邂逅AI前沿技术
2026-01-06 12:43:00
夸克等AI眼镜首次被纳入以旧换新“国补”范围 商务部开启调研
2025年12月30日,国家发改委、财政部发布《关于2026年实施大规模设备更新和消费品以旧换新政策的通知》(简称“通知”)
2026-01-06 13:31:00
传统城市形象传播中,政府是主导者。而具创新性的广州“城市合伙人”计划则打破传统赞助模式的边界,向全球征集“奋斗共同体”
2026-01-06 11:04:00
河北日报讯(记者刘英)近日,《廊坊市人工智能产业聚集区建设方案》(以下简称《方案》)正式发布,系统谋划布局人工智能产业发展新蓝图
2026-01-06 08:14:00
京津研发河北转化进行时(五):创新种子何以在这里开花结果
近三年间,12项京津研发成果在晨光生物完成转化创新种子何以在这里开花结果近日,位于曲周县的晨光生物科技集团股份有限公司中试中心内
2026-01-06 08:18:00
四中全会精神在基层|“产业大脑”高效协同 线缆企业多重受益
2025年12月6日,宁晋县河北易缆网络科技有限公司展厅,易缆网平台负责人王洪喜介绍平台功能。 河北日报记者 闫德见摄2025年12月6日10点30分
2026-01-06 08:25:00
福建省“最美科技工作者”、厦门金鹭研发工程师高兰兰:微米之间磨刃 宝刀谁与争锋
高兰兰介绍立铣刀切削的弧度和精度。用UP300系列通用高性能立铣刀切削而成的“青鸾”金属雕塑。厦门网讯 (文/厦门日报记者 李晓平 图/厦门日报记者 黄晓珍)在金属切削的微观世界里
2026-01-06 08:38:00
厦门网讯 (厦门日报记者 林露虹)2025年12月以来,厦门企业融资捷报频传,主要涉及人工智能、新材料领域,彰显厦门在培育新质生产力方面的蓬勃活力
2026-01-06 08:38:00
临沂圣陶高级中学举行高三英语教学传承分享会
鲁网1月5日讯近日,临沂圣陶高级中学“杏坛薪火·师道赓续”专家教师教学传承分享会如期举行,为高三英语一轮复习注入新动能
2026-01-06 09:37:00
20个福建品牌入选中国消费名品其中5个来自厦门,分别为银鹭、暴龙、鹭岛卫浴、瑞尔特和燕之屋东南网1月6日讯(海峡导报记者 黄奕琳)昨日
2026-01-06 10:33:00
厦门网讯(厦门日报记者 沈彦彦)新年伊始,政策红利与节庆消费碰撞出红火“好市”。据厦门市商务局发布的数据显示,2026年元旦假期
2026-01-06 08:38:00
国补山东落地 山东消费者来京东换新单人至高可省11000元
1月4日,2026年国家以旧换新补贴落地山东,京东线上线下全面承接国家补贴落地。山东消费者到京东APP搜索“山东以旧换新”即可进入国补页面
2026-01-06 10:12:00
内存硬盘身价翻倍 存储产品成“年度理财产品” 业内预测:今年手机、电脑将迎来涨价
移动固态硬盘价格比一年前明显上涨“年初买的内存条年底价格已经翻倍!”“不看购买记录不知道,一看吓一跳,连固态硬盘的‘身价’都在一直上涨
2026-01-06 08:09:00