• 我的订阅
  • 科技

上海:发力语料,建设“模都”

类别:科技 发布时间:2024-07-06 13:16:00 来源:人民资讯

本文转自:人民网-上海频道

马作鹏 唐小丽

“人工智能,是人类养育的‘孩子’,而语料就是‘教材’!”

“我们希望人工智能在伦理价值上有德、情绪价值上有趣、文化价值上有品、社会价值上有序、技术价值上有用。”

7月6日上午,上海黄浦江畔,2024世界人工智能大会,一场关于人工智能语料的论坛首次举办。

时针回拨到一年前的今天——2023世界人工智能大会,上海市委书记陈吉宁与上海市市长龚正共同见证,上海人工智能实验室、人民网、国家气象中心等单位联合发起的中国第一个大模型语料数据联盟正式成立。

上海:发力语料,建设“模都”

2023年7月6日,大模型语料数据联盟成立。人民网记者 王初摄

人工智能大模型取决于三大要素:算力、算法、语料。算力是硬件,算法是大模型企业的核心竞争力。中国是世界上数字化应用场景最丰富的国家,各种场景提供了极为丰富的语料。中国是语料大国,但因为各种语料良莠不齐、涉及隐私,甚至违规、违法,目前急需与人类价值对齐的规范语料。

正因于此,上海才会如此重视语料建设。

纵观全国,北京、上海、深圳、杭州四地在人工智能领域深耕已久,正执产业发展之牛耳。上海的特点,是AI顶层设计有力,场景应用丰富,并在公共数据开源方面进行了长期大量的探索。

从183家到348家,上海人工智能产业规上企业数量在2018至2023年这5年间实现高速增长。商汤科技、达观数据、星环科技等企业开拓人工智能“新蓝海”,培育大模型产业发展新生态,加快形成新质生产力。

上海市已有34款大模型通过备案,产生了制造业、金融、具身智能机器人等垂类领域应用;多款通用人形机器人原型机发布,实现双足避障行走;4200亿Token的语料数据实现开源。

2023年被称作“智能互联网元年”,这一年,我们见证了激烈的“百模大战”。除了科技巨头先后入局之外,迅速崛起的一批AI企业也在不断进场。

而备受业界关注的语料数据的应用,还需在人工智能具体实践中找到未来。

人工智能,是上海着力发展的三大先导产业之一,也是发展新质生产力的重要引擎。随着大模型时代到来,上海力图先行一步,构建大模型创新策源地,建设新的“模都”。

去年9月,2023世界人工智能大会闭幕不久,上海“模速空间”创新生态社区即在徐汇西岸揭牌成立。作为全国首个、上海唯一的生成式AI专业孵化和加速载体,目前这里已入驻大模型上下游企业80余家,力争成为代表上海乃至国家赢取全球科技战略竞争主动权的“主力因子”。

上海:发力语料,建设“模都”

全国首个大模型创新生态社区“模速空间”。受访单位供图

今年3月下旬,在上海市经信委大力推进下,由上海人工智能实验室、人民网、中国电信、商汤、阶跃星辰等多家头部人工智能领军企业共同出资,注册成立中国第一家人工智能语料公司——上海库帕思科技有限公司。库帕思公司董事长山栋明表示,希望为全国的人工智能企业提供“1+N”式的语料服务。其中,“1”为公共的核心语料,包括世界知识体系和价值对齐体系;“N”为面向垂直应用领域等的专业语料。

在追逐浪潮中,不少企业发现,并非谁都有精力、有能力去做基础大模型,于是“小模型”——垂类大模型顺势而生。专门为具体行业而设计的“小模型”如何在企业等应用场景落地?这是许多AI企业负责人普遍关注的问题。

“银行审计业务面临数据信息和系统架构的分散性、异构性和复杂性等问题,深挖各类数据的价值一直是挑战,且银行内部数据的有效利用率普遍不高,尤其是审计部门内部大量文本数据未形成资产。”多年来,深耕垂类大模型领域的达观数据在金融行业文本处理方面,积累了大量金融专业数据。

如今,达观数据的垂类大模型已经开始面向银行审计人员,为审计监控平台提供接口服务,还可对各类文档进行比对,大大提高工作效率。

“楼上住户噪音扰民,尤其晚上进出人很多,怀疑是群租房,请管理部门尽快解决。”近日,浦东新区塘桥街道城运中心接到12345市民热线投诉工单,“数字社工”城运助手立即对工单内容进行分析,并自动精准分派给主、协办部门处置,整个流程不到2分钟。

“数字社工”以大模型为底座,能够适应基层政务的多种使用场景。“以前,工单派遣靠经验,分析研判靠人工,费时费力。”自“数字社工”上岗以来,在城运中心工作十余年的卜丹凤见证了科技给基层治理带来的变化。

上海:发力语料,建设“模都”

“数字社工”能够将工单分布情况生成热力图。人民网记者 唐小丽摄

如今,塘桥街道城运中心自动派单准确率超过90%,工单处置效率提升60%,绩效分析和报表生成从2小时缩减至10分钟,居民回访满意度再提升。“这样的技术应用,真是实实在在为基层减负。”卜丹凤感慨道。

协同区域发展、构建智慧城市、重塑商业密码、打造数字文娱……在上海,AI正深度链接千行百业。拥抱“人工智能+”,在AI助力下推动传统行业转型升级,指引新兴行业加速生长,已成为当下业界共识,发展趋势不可阻挡。

上海:发力语料,建设“模都”

2024年7月6日的语料论坛上,语料库建设导则正式发布。人民网记者 王初摄

“人工智能训练,不仅要关注数据语料的数量,也要重视’数据配方’,用高质量数据的最优组合,提升AI效能与安全性。”语料论坛上,人民网负责人介绍,通过伦理价值、情绪价值、文化价值、社会价值、技术价值五个维度的对齐,建设优质语料“好教材”,帮助大模型成长为“以人为本、智能向善、造福人类”、符合全人类共同价值的“好孩子”。

事实上,人民网在人工智能基础语料库的建设工作布局已久。

据人民日报社传播内容认知全国重点实验室研究员郭俊波介绍,该实验室成立于2019年11月,由人民日报社主管,依托人民网建设。实验室建设以国家重大需求为导向、应用基础研究为定位、学科交叉融合为特色,助推媒体融合向纵深发展。

在他看来,人工智能的多维度价值对齐需要根据不同维度的具体要求,结合其重要程度与规范性要求,制定分级分类标准,形成对人工智能进行安全风险和能力水平评价的规范和要求,指导语料资源的建设,提升人工智能的价值对齐能力。

针对当前人工智能在价值对齐方面的瓶颈问题,郭俊波和人民网上海分公司总经理、库帕思董事金煜纯介绍,未来实验室将与上海库帕思公司携手,共同建设价值对齐体系语料,形成以基础语料和问答语料2种形式为主,覆盖5大价值、3大圈层、14个类别、38个细分维度的高质量、多维度价值对齐基石语料库。双方将结合各自在数据、技术、人才等方面的优势资源,共同为人工智能的价值对齐和能力提升提供高质量教材和语料。

如何获取高质量的数据?如何让大模型更好落地造福人类?未知的明天,既是机遇,亦是挑战,大模型一路成长为符合人类共同价值的“好孩子”,尚需多方携手并肩。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-07-06 14:45:04

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

共建上海大模型语料繁荣生态,全球开发者先锋大会“语料筑基 智生时代”论坛在沪举办
...海库帕思科技有限公司承办,漕河泾开发区总公司、上海人工智能实验室、商汤科技、阶跃星辰、稀宇科技等公司联合协办。上海市经济和信息化委员会副主任张宏韬,徐汇区委常委、副区长俞林伟
2025-02-23 08:49:00
星环科技成功举办数据要素市场与大模型语料库论坛
...联盟开放日活动”成功举办,活动上200余家大模型数据、人工智能及技术企业及相关机构代表出席会议。上海市经信委信息化推进处处长钱晓致辞表示,大模型发展到现阶段,高质量的语料数据
2023-11-27 16:02:00
大模型“百花齐放” 业界合力“充实”中文语料数据
...大模型的中文语料数据。中国大模型语料数据联盟由上海人工智能实验室、中国科学技术信息研究所等单位在今年的世界人工智能大会上联合发起成立,致力建设开放型的大模型语料数据生态圈。上
2023-09-08 21:31:00
首个语料库建设导则面世!近二十家企业共同发布
...语料数据资源是AI时代的重要基石。7月6日上午,2024世界人工智能大会语料主题论坛在上海世博中心举办。本次论坛以“语料筑基,智生时代”为主题,围绕高质量语料数据如何高效供给
2024-07-06 17:50:00
AI价值对齐“五有”框架在世界人工智能大会发布
...人民网上海7月7日电 (记者唐小丽)高质量的语料是确保人工智能价值对齐的关键要素。7月6日,2024世界人工智能大会在沪举办期间,以“语料筑基,智生时代”为主题的首场语料论坛
2024-07-07 12:25:00
上海:加速实施“模塑申城”
...发者先锋大会”将于2月21日至23日在徐汇举办,旨在推动人工智能产业场景落地,加速人工智能商业化进程。今年,上海正瞄准技术前沿,加快推进人工智能“模塑申城”实施方案落实和重点
2025-02-20 15:49:00
【上海人工智能实验室单位联合发起大模型语料数据联盟】财联社7月6日电,2023世界人工智能大会7月6日在上海世博中心正式开幕。上海人工智能实验室、中国科学技术信息研究所、上海数据
2023-07-06 14:27:00
“2024语料风云榜”发布,10家企业上榜!
...语料数据资源是AI时代的重要基石。7月6日上午,2024世界人工智能大会语料主题论坛在上海世博中心举办。本次论坛以“语料筑基,智生时代”为主题,围绕高质量语料数据如何高效供给
2024-07-06 17:50:00
千行百业加速拥抱大模型(AI前沿观察)
...P28)在阿联酋迪拜举行。大会期间,中国研究团队展示的人工智能气候大模型引发广泛关注。此款名为“伏羲”的大模型,对气象进行预报的时间范围长、精度高。当前,中国国产大模型进入高
2023-12-22 03:26:00
更多关于科技的资讯:
中新经纬11月1日电 题:零首付租赁,机器人“普惠时代”来了作者 王喜文 北京华夏工联网智能技术研究院院长近期,智元机器人联合飞阔科技
2025-11-02 10:54:00
中新经纬11月1日电 (袁媛)近期,《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》(以下简称《建议》)发布
2025-11-02 10:58:00
鸿蒙电脑版微信强势升级:40+项功能释放办公社交新势能
作为超10亿人使用的国民级社交应用,微信深度适配鸿蒙电脑并不断进行版本更新。本次更新,鸿蒙电脑版微信一次性推出40+项实用功能
2025-11-02 14:26:00
正雅齿科与士卓曼集团宣布建立战略合作伙伴关系。此次合作将整合两家集团的核心优势,以更高的效率和速度推动全球口腔健康市场的增长
2025-11-02 14:26:00
京东服饰联合天纺标发布《新舒适内衣》团体标准 共建行业品质新生态
10月31日,由京东服饰与天纺标检测认证股份有限公司联合主办的“中国内衣行业高品质供应链峰会暨京东服饰&天纺标联合发布会”在天津成功举办
2025-11-02 14:26:00
华为擎云 W515y登顶自主创新性能榜 引领自主创新终端从可用迈向好用
在全球科技格局深刻演变、国际形势日趋复杂的背景下,自主创新产业正加速从可用向好用的真替真用阶段迈进。这不仅是技术发展的必然要求
2025-11-02 14:28:00
赛力斯2025前三季净利润超53亿元 盈利能力持续增强
10月30日,赛力斯披露了2025年三季报,以亮眼的经营表现和持续攀升的交付数据,再次印证其在中国新能源豪华车市场的领跑地位
2025-11-02 14:29:00
雄安人工智能算力调度平台正式上线运行
中国雄安官网11月1日电近日,雄安人工智能算力调度平台在雄安城市计算中心正式部署完成并投入运行,标志着雄安新区在构建集约高效
2025-11-02 18:03:00
中国轻奢美护品牌黎科世亮相巴黎设计周,以生物科技融合感官美学
近日,中国轻奢美护品牌SENSLUX(黎科世)凭借其融合生物科技与感官美学的独特理念,在2025年9月举办的巴黎设计周中国创新馆中精彩亮相
2025-11-02 21:50:00
AI盛宴启幕!“科大讯飞1024科博展”燃动合肥
大皖新闻讯 11月2日,第八届世界声博会暨2025科大讯飞1024全球开发者节科博展在合肥体育中心盛大启幕。从萌趣幼教机器人到智能健康助手
2025-11-02 22:42:00
走进院士专家工作站系列报道丨专家工作站“破局” 双兴智能实现豆类收获“芯”突破
编者按:科技是第一生产力,人才是第一资源。从田间地头到生产车间,从技术瓶颈到产业升级,十堰市科协主动作为,当好“科技红娘”
2025-11-02 20:13:00
英语培训机构教务系统高适配推荐:外教管理 + 分级排课 + 学员约课!
现代英语培训机构的高效运转,离不开专业教务系统的有力支撑。一套设计科学的英语培训机构教务管理系统,如同机构的智能中枢,将教学管理
2025-11-02 18:46:00
日前,位于山西转型综改示范区学府总部经济园区的医学影像数据人工智能大模型产业发展项目进入试运行阶段。目前已完成平台建设和医院对接
2025-11-02 18:06:00
□南京日报/紫金山新闻记者张甜甜 通讯员夏俊林娜10月31日,南京市统计局、国家统计局南京调查队发布南京经济“三季报”
2025-11-01 09:44:00
上海虹桥医院癫痫专病诊疗新高度:个性化方案,全程化守护
癫痫发作的不可预测性及其对记忆、情绪、社交、学业与工作等方面的深远影响,构成了广大患者面临的核心挑战。诊断的复杂、治疗方案的普适性困境以及持续管理的缺失
2025-11-01 10:05:00