• 我的订阅
  • 科技

上海:发力语料,建设“模都”

类别:科技 发布时间:2024-07-06 13:16:00 来源:人民资讯

本文转自:人民网-上海频道

马作鹏 唐小丽

“人工智能,是人类养育的‘孩子’,而语料就是‘教材’!”

“我们希望人工智能在伦理价值上有德、情绪价值上有趣、文化价值上有品、社会价值上有序、技术价值上有用。”

7月6日上午,上海黄浦江畔,2024世界人工智能大会,一场关于人工智能语料的论坛首次举办。

时针回拨到一年前的今天——2023世界人工智能大会,上海市委书记陈吉宁与上海市市长龚正共同见证,上海人工智能实验室、人民网、国家气象中心等单位联合发起的中国第一个大模型语料数据联盟正式成立。

上海:发力语料,建设“模都”

2023年7月6日,大模型语料数据联盟成立。人民网记者 王初摄

人工智能大模型取决于三大要素:算力、算法、语料。算力是硬件,算法是大模型企业的核心竞争力。中国是世界上数字化应用场景最丰富的国家,各种场景提供了极为丰富的语料。中国是语料大国,但因为各种语料良莠不齐、涉及隐私,甚至违规、违法,目前急需与人类价值对齐的规范语料。

正因于此,上海才会如此重视语料建设。

纵观全国,北京、上海、深圳、杭州四地在人工智能领域深耕已久,正执产业发展之牛耳。上海的特点,是AI顶层设计有力,场景应用丰富,并在公共数据开源方面进行了长期大量的探索。

从183家到348家,上海人工智能产业规上企业数量在2018至2023年这5年间实现高速增长。商汤科技、达观数据、星环科技等企业开拓人工智能“新蓝海”,培育大模型产业发展新生态,加快形成新质生产力。

上海市已有34款大模型通过备案,产生了制造业、金融、具身智能机器人等垂类领域应用;多款通用人形机器人原型机发布,实现双足避障行走;4200亿Token的语料数据实现开源。

2023年被称作“智能互联网元年”,这一年,我们见证了激烈的“百模大战”。除了科技巨头先后入局之外,迅速崛起的一批AI企业也在不断进场。

而备受业界关注的语料数据的应用,还需在人工智能具体实践中找到未来。

人工智能,是上海着力发展的三大先导产业之一,也是发展新质生产力的重要引擎。随着大模型时代到来,上海力图先行一步,构建大模型创新策源地,建设新的“模都”。

去年9月,2023世界人工智能大会闭幕不久,上海“模速空间”创新生态社区即在徐汇西岸揭牌成立。作为全国首个、上海唯一的生成式AI专业孵化和加速载体,目前这里已入驻大模型上下游企业80余家,力争成为代表上海乃至国家赢取全球科技战略竞争主动权的“主力因子”。

上海:发力语料,建设“模都”

全国首个大模型创新生态社区“模速空间”。受访单位供图

今年3月下旬,在上海市经信委大力推进下,由上海人工智能实验室、人民网、中国电信、商汤、阶跃星辰等多家头部人工智能领军企业共同出资,注册成立中国第一家人工智能语料公司——上海库帕思科技有限公司。库帕思公司董事长山栋明表示,希望为全国的人工智能企业提供“1+N”式的语料服务。其中,“1”为公共的核心语料,包括世界知识体系和价值对齐体系;“N”为面向垂直应用领域等的专业语料。

在追逐浪潮中,不少企业发现,并非谁都有精力、有能力去做基础大模型,于是“小模型”——垂类大模型顺势而生。专门为具体行业而设计的“小模型”如何在企业等应用场景落地?这是许多AI企业负责人普遍关注的问题。

“银行审计业务面临数据信息和系统架构的分散性、异构性和复杂性等问题,深挖各类数据的价值一直是挑战,且银行内部数据的有效利用率普遍不高,尤其是审计部门内部大量文本数据未形成资产。”多年来,深耕垂类大模型领域的达观数据在金融行业文本处理方面,积累了大量金融专业数据。

如今,达观数据的垂类大模型已经开始面向银行审计人员,为审计监控平台提供接口服务,还可对各类文档进行比对,大大提高工作效率。

“楼上住户噪音扰民,尤其晚上进出人很多,怀疑是群租房,请管理部门尽快解决。”近日,浦东新区塘桥街道城运中心接到12345市民热线投诉工单,“数字社工”城运助手立即对工单内容进行分析,并自动精准分派给主、协办部门处置,整个流程不到2分钟。

“数字社工”以大模型为底座,能够适应基层政务的多种使用场景。“以前,工单派遣靠经验,分析研判靠人工,费时费力。”自“数字社工”上岗以来,在城运中心工作十余年的卜丹凤见证了科技给基层治理带来的变化。

上海:发力语料,建设“模都”

“数字社工”能够将工单分布情况生成热力图。人民网记者 唐小丽摄

如今,塘桥街道城运中心自动派单准确率超过90%,工单处置效率提升60%,绩效分析和报表生成从2小时缩减至10分钟,居民回访满意度再提升。“这样的技术应用,真是实实在在为基层减负。”卜丹凤感慨道。

协同区域发展、构建智慧城市、重塑商业密码、打造数字文娱……在上海,AI正深度链接千行百业。拥抱“人工智能+”,在AI助力下推动传统行业转型升级,指引新兴行业加速生长,已成为当下业界共识,发展趋势不可阻挡。

上海:发力语料,建设“模都”

2024年7月6日的语料论坛上,语料库建设导则正式发布。人民网记者 王初摄

“人工智能训练,不仅要关注数据语料的数量,也要重视’数据配方’,用高质量数据的最优组合,提升AI效能与安全性。”语料论坛上,人民网负责人介绍,通过伦理价值、情绪价值、文化价值、社会价值、技术价值五个维度的对齐,建设优质语料“好教材”,帮助大模型成长为“以人为本、智能向善、造福人类”、符合全人类共同价值的“好孩子”。

事实上,人民网在人工智能基础语料库的建设工作布局已久。

据人民日报社传播内容认知全国重点实验室研究员郭俊波介绍,该实验室成立于2019年11月,由人民日报社主管,依托人民网建设。实验室建设以国家重大需求为导向、应用基础研究为定位、学科交叉融合为特色,助推媒体融合向纵深发展。

在他看来,人工智能的多维度价值对齐需要根据不同维度的具体要求,结合其重要程度与规范性要求,制定分级分类标准,形成对人工智能进行安全风险和能力水平评价的规范和要求,指导语料资源的建设,提升人工智能的价值对齐能力。

针对当前人工智能在价值对齐方面的瓶颈问题,郭俊波和人民网上海分公司总经理、库帕思董事金煜纯介绍,未来实验室将与上海库帕思公司携手,共同建设价值对齐体系语料,形成以基础语料和问答语料2种形式为主,覆盖5大价值、3大圈层、14个类别、38个细分维度的高质量、多维度价值对齐基石语料库。双方将结合各自在数据、技术、人才等方面的优势资源,共同为人工智能的价值对齐和能力提升提供高质量教材和语料。

如何获取高质量的数据?如何让大模型更好落地造福人类?未知的明天,既是机遇,亦是挑战,大模型一路成长为符合人类共同价值的“好孩子”,尚需多方携手并肩。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-07-06 14:45:04

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

共建上海大模型语料繁荣生态,全球开发者先锋大会“语料筑基 智生时代”论坛在沪举办
...海库帕思科技有限公司承办,漕河泾开发区总公司、上海人工智能实验室、商汤科技、阶跃星辰、稀宇科技等公司联合协办。上海市经济和信息化委员会副主任张宏韬,徐汇区委常委、副区长俞林伟
2025-02-23 08:49:00
星环科技成功举办数据要素市场与大模型语料库论坛
...联盟开放日活动”成功举办,活动上200余家大模型数据、人工智能及技术企业及相关机构代表出席会议。上海市经信委信息化推进处处长钱晓致辞表示,大模型发展到现阶段,高质量的语料数据
2023-11-27 16:02:00
大模型“百花齐放” 业界合力“充实”中文语料数据
...大模型的中文语料数据。中国大模型语料数据联盟由上海人工智能实验室、中国科学技术信息研究所等单位在今年的世界人工智能大会上联合发起成立,致力建设开放型的大模型语料数据生态圈。上
2023-09-08 21:31:00
首个语料库建设导则面世!近二十家企业共同发布
...语料数据资源是AI时代的重要基石。7月6日上午,2024世界人工智能大会语料主题论坛在上海世博中心举办。本次论坛以“语料筑基,智生时代”为主题,围绕高质量语料数据如何高效供给
2024-07-06 17:50:00
AI价值对齐“五有”框架在世界人工智能大会发布
...人民网上海7月7日电 (记者唐小丽)高质量的语料是确保人工智能价值对齐的关键要素。7月6日,2024世界人工智能大会在沪举办期间,以“语料筑基,智生时代”为主题的首场语料论坛
2024-07-07 12:25:00
上海:加速实施“模塑申城”
...发者先锋大会”将于2月21日至23日在徐汇举办,旨在推动人工智能产业场景落地,加速人工智能商业化进程。今年,上海正瞄准技术前沿,加快推进人工智能“模塑申城”实施方案落实和重点
2025-02-20 15:49:00
“2024语料风云榜”发布,10家企业上榜!
...语料数据资源是AI时代的重要基石。7月6日上午,2024世界人工智能大会语料主题论坛在上海世博中心举办。本次论坛以“语料筑基,智生时代”为主题,围绕高质量语料数据如何高效供给
2024-07-06 17:50:00
【上海人工智能实验室单位联合发起大模型语料数据联盟】财联社7月6日电,2023世界人工智能大会7月6日在上海世博中心正式开幕。上海人工智能实验室、中国科学技术信息研究所、上海数据
2023-07-06 14:27:00
语料运营平台1.0在沪上线,首批十大高质量语料产品发布
...语料数据资源是AI时代的重要基石。7月6日上午,2024世界人工智能大会语料主题论坛在上海世博中心举办。本次论坛以“语料筑基,智生时代”为主题,围绕高质量语料数据如何高效供给
2024-07-06 17:50:00
更多关于科技的资讯:
智慧助老,温暖相伴!龙岩联通开展线下“联通客户日”活动
东南网龙岩1月29日讯(通讯员 曹可煊)1月,龙岩联通新罗分公司、漳平分公司在营业厅如期举行“联通客户日”专属活动。作为每月常态化的客户互动专场
2026-01-29 21:07:00
一颗播州辣椒的全球之旅
多彩贵州网讯 在黔北播州的绵延青山之间,一颗颗红彤彤的辣椒经过烘烤后,被集中送往位于石板镇国际辣椒产业园的遵义中椒生物科技有限公司
2026-01-29 17:49:00
科力装备携手华为云深化智能制造,打造汽车零部件行业数智化升级标杆
日前,工业和信息化部、教育部、市场监管总局、国家数据局四部门联合印发《汽车行业数字化转型实施方案》(以下简称《实施方案》)
2026-01-29 18:25:00
随着AI(人工智能)技术飞速发展,一种被称为OPC(One Person Company,一人公司)的新型创业形态正在兴起
2026-01-29 18:59:00
“咪咕阅读”正式升级为“咪咕悦看”,以文剧融合新生态践行数字文化发展使命
从追求流量到追求质量,微短剧行业正迈向精品化与主流化的升级之路,拥有大量好内容的网络文学是微短剧发展的重要推动力。咪咕阅读率先以“文剧融合”为抓手
2026-01-29 14:24:00
星聚会KTV中国香港双店同开
2026年1月27日,星聚会KTV(以下简称星聚会)正式官宣,中国香港铜锣湾V Point店与兰桂坊加州大厦店双店同步盛大启幕
2026-01-29 14:34:00
星巴克中国发布一季度财报 营收连续五个季度增长
1月28日晚,星巴克发布2026财年第一季度业绩报告,营收实现双位数增长,同店销售额连续三个季度正增长。营收连续五个季度增长
2026-01-29 15:24:00
五大优化精准惠民,2026年郯城县以旧换新再发力
鲁网1月29日讯 (记者 吴艳萍)1月29日,郯城县人民政府召开“惠企利民 消费品以旧换新”新闻发布会。郯城县商务局相关负责人介绍2025年郯城县消费品以旧换新工作开展情况
2026-01-29 16:44:00
惠民2800余万元!郯城县以旧换新释放消费新动能
鲁网1月29日讯 (记者 吴艳萍)1月29日,郯城县人民政府召开“惠企利民 消费品以旧换新”新闻发布会。郯城县商务局相关负责人介绍2025年郯城县消费品以旧换新工作开展情况
2026-01-29 16:46:00
注意力差、上课走神、做事拖拉磨蹭?这可能是学习能力需要“专业锻炼”的信号
鲁网1月29日讯学习困难是儿童成长过程中常见的问题,严重影响孩子的学业成绩和心理健康。因此,建立科学的筛查和干预机制,对于早期发现和解决学习困难问题至关重要
2026-01-29 15:35:00
科学探秘 巧手求真 观湖社区伯努利实验点亮青少年科学梦
“原来流动的空气真的有力量!”“乒乓球居然能悬浮在空中不掉下来!”近日,苏州工业园区唯亭街道观湖社区阿里博士实验室内欢呼声此起彼伏
2026-01-29 11:28:00
大皖新闻讯 1月28日晚间,星巴克发布2026财年第一季度业绩报告,中国市场延续强劲增长势头,营收实现双位数增长,同店销售额连续三个季度正增长
2026-01-29 12:51:00
京东携机器人亮相乡村舞台 光明村首届“村晚”科技感拉满
当智能机器人遇上“村晚”,科技与年味会碰撞出怎样的精彩?1月28日,江苏宿迁来龙镇光明村热闹非凡,由京东打造的首届“村晚”正式上演
2026-01-29 13:13:00
“溪山模式+溪有物种实践”赋能科创:从商业航天到核聚变
2026年1月22日,NSE2026第四届新物种进化大会暨2026溪山天使年会在北京大北农凤凰国际创新园隆重举行。这场由溪山天使汇
2026-01-29 13:14:00
爱喏与宅智造达成战略合作:融合产品体系与服务网络,打造高效家装新平台
近日,融合产品设计与实用美学的健康水生态品牌“爱喏”与国内领先的一站式建材服务商“宅智造”建材超市正式签署战略合作协议
2026-01-29 13:16:00