我们正处于一个信息大暴发的时代,每天都能产生数以百万计的新闻资讯!
虽然有大数据推荐,但面对海量数据,通过我们的调研发现,在一个小时的时间里,您通常无法真正有效地获取您感兴趣的资讯!
头条新闻资讯订阅,旨在帮助您收集感兴趣的资讯内容,并且在第一时间通知到您。可以有效节约您获取资讯的时间,避免错过一些关键信息。
潮新闻讯 随着人工智能兴起,数据要素领域的生产性服务业,规模正迅速壮大。
近日,浙江省委副书记、省长刘捷在杭州专题调研服务业发展工作。此次调研和人工智能息息相关。
杭州景联文科技有限公司是一家高质量数据与语料基础设施企业,提供从数据源汇聚、清洗、标注到高质量数据集交付与价值变现的全栈式服务。
据浙江日报报道,刘捷听取了公司运行和产品研发情况的介绍,希望企业抢抓人工智能发展机遇,充分发挥技术、人才等优势,深入探索数据要素价值转化的市场化路径和商业模式。
涌金君关注到了一个关键词:数据要素价值转化。这是一个牵动着超万亿规模的庞大产业,有着持续旺盛的市场需求。
据国家数据发展研究院统计,2024年,全国数据企业数量超过40万家,数据产业规模达5.86万亿元,较“十三五”末增长117%,预计未来几年仍将保持较高的增长水平。
这主要是因为人工智能对高质量数据的巨大需求。
数据,就像人类学习所需要的书本。人工智能大模型,需要从海量的数据中学习、训练。而数据质量的高低,一定程度上决定了大模型能力水平的高低。
随着大模型训练数据规模越来越大,互联网上积累的优质公共数据,已几乎被“学习”消耗殆尽。
因此,新的高质量数据,正成为各方竞相争夺的战略资源。
人工智能,凸显数据作为关键生产要素的价值。对浙江而言,其中蕴藏着巨大机遇。
一方面浙江数字经济起步早,制造业数字化程度高,平台经济发达,沉淀了海量尚未释放价值的专业领域优质数据。
另一方面,去年浙江获批成为国家数据要素综合试验区,在数据权益确认保障等领域改革探索,有了一定制度保障。
其中,刘捷省长调研的杭州景联文科技有限公司,就是在这一轮数据浪潮中崭露头角的企业。
“高质量、专业化的行业数据集将成为高价值资源,尤其是在工业、金融、医疗等领域。”杭州景联文科技有限公司副总裁林旭峰说。
该公司专注于高质量数据集生产及服务,自主建设教育、医疗、自动驾驶等领域的数据集体系,服务人工智能企业及科研机构。
“语料”,是用于训练人工智能模型的数据集合的统称。对人工智能企业而言,这些数据最好具备四个特点——易获取、高质量、规模化、低成本。
去年11月,景联文入围了杭州国家语料库首批高质量数据集建设先行先试“揭榜挂帅”名单。公司入选榜单的是《教育大模型英文知识数据集》产品。其中包含了经标准化处理的英语听说读写等各类数据5600多万条,并进行了产权确认,可供其他教育科技公司、出版集团用于智能教育的研发训练。
林旭峰介绍,当前中文语料库建设,仍面临规模、质量、结构和生态等问题。
这些行业的痛点,正是浙江下一步瞄准的重点。
根据“十五五”规划纲要,浙江重点要推动数据要素高水平应用,并强调了“模数共振”概念。
“模数共振”,指的是充分激活数据资源价值,推动人工智能数据集建设与大模型能力提升深度融合,使“高质量数据、高效能模型、高价值应用”协同发展。
浙江要面向科技、工业、农业等领域建设数据语料库,搭建可信数据空间、高质量数据集、数据交易所一体的语料库加工基地。同时,探索建设数场、隐私保护计算平台、数联网等技术设施。
目前,浙江也已出台具体的政策支持举措。比如,支持高端数据标注平台,鼓励企业围绕数据关键环节,参与国际、国家、重要地方标准制定,可给予最高100万元每项的奖励。加强语料券支持。支持有条件的地方发放语料券,可按照不高于合同实际执行金额的30%,给予最高200万元补助等。
从全球来看,目前已出现Databricks等估值超千亿美元的数据服务独角兽,国内有海天瑞声、博睿数据等企业抢占赛道。我们期待在这一轮“模数共振”的历史机遇中,涌现出更多浙江企业。
以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。
快照生成时间:2026-02-11 20:45:03
本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。
信息原文地址: