• 我的订阅
  • 科技

中文公共语料库建设新范式:腾讯AI向善语料库正式开放申请

类别:科技 发布时间:2025-07-11 22:07:00 来源:中国江西网

2025年7月11日,腾讯AI向善语料库开放发布会在北京举行,这次发布会的主题是“AI时代没有旁观席,AI普惠一个不能少”。发布会上,腾讯与百余家社会组织公益共创的AI向善语料库(老年文本库)正式面向公益组织和非营利性研究机构开放申请,这是国内外首个通过社会公益共创构建,又面向公益组织开放的老年语料库,在一定程度上开创了公共语料库构建与开放的新范式。

中文公共语料库建设新范式:腾讯AI向善语料库正式开放申请

尽管人工智能技术的迅猛发展使产业效能得到了很大的提升,但也有一个迫切的社会议题逐渐浮现:AI如何才能为更多普通人提供实实在在的帮助和赋能?众所周知,高质量的语料在AI训练和产品创新中扮演着至关重要的角色,然而与老年人、残障朋友、留守儿童等社会困弱群体相关的语料却非常少,如此一来,为他们服务的AI产品就不容易做好。长此以往,“弱者恒弱”在AI时代下愈加显著,本就隐形、边缘的社会困弱群体,在AI时代下难以享受到平等的科技赋能。

中文公共语料库建设新范式:腾讯AI向善语料库正式开放申请

社会共创+公益共享,打造中文公共语料库新范式

2024年8月始,腾讯与数百家专业的社会组织共同发起了一项名叫“AI向善语料库”的社会共创计划,通过公益共创合力打造了一个面向社会困弱群体的专家级问答语料库。腾讯可持续社会价值创新事业部负责人陈菊红女士在连线发布会现场时指出,AI时代下如果人类不在前期做更多的事情,就可能造成“弱者恒弱”的局面,通过公益共创的方式与社会各界一起构建面向社会困弱人群的AI训练语料库是一个不错的尝试。AI向善语料库在推进中有一句被公益组织口口相传的“口号”——“先共创,再共享,先爱,再AI”,诠释了这一行动在中文公共语料库构建上的路径——通过公共协作,回归公益初心,将一线专家们的“人文关怀”收录到“AI向善语料库”中,再应用在公益事业上,助力更多服务这些社会困弱人群的公益组织提升AI能力。

中文公共语料库建设新范式:腾讯AI向善语料库正式开放申请

积极应对老龄化,为AI养老免费提供“第一桶金”

人口老龄化是社会发展的重要趋势,是人类文明进步的重要体现,也是我国今后较长一个时期的基本国情。预计到2035年左右,我国60岁及以上老年人口将突破4亿人,占比超过30%,进入重度老龄化阶段。养老服务业既是涉及亿万群众福祉的民生事业,也是具有巨大发展潜力的朝阳产业,然而,许许多多养老福利领域的公益组织,虽然也想探索科技创新,但是苦于没有数据资源,也没有孵化AI助手的经验。腾讯AI向善语料库的首个主题正是聚焦于此,本次开放申请的语料库主题是老年人日常生活,包含8047组老年人日常生活常见问题的问答对,含有健康、心理、关系等多个方面,公益组织与非营利性研究机构不仅可免费申请全量数据,还可依托腾讯益仔平台得到一站式AI服务。腾讯集团高级副总裁郭凯天先生与发布会现场视频连线时也提出了期待,他希望未来能在老年人真实的生活场景中把AI向善语料库用起来,推动涌现出更多帮助社会困弱人群的AI产品和服务。

中文公共语料库建设新范式:腾讯AI向善语料库正式开放申请

没有全能的AI训练语料库,但有无限的AI向善未来

本次发布会上,清华大学未来实验室的何丽雯女士代表实验室研究团队对AI向善语料库进行了使用方法的介绍,并进行了专业系统的评估,她指出,搭载了AI向善语料库后,大模型并非在所有维度上都得到了显著提升,但是在对老年人情感支持和文化适应性方面有了明显的提升。腾讯SSV产品经理周滢垭和复旦大学老龄研究院申琦教授分别介绍了公益组织和研究机构申请AI向善语料库的流程。北京邮电大学张为威老师和AI4GOOD公益产品经理孙心怡,分别作为AI向善语料库的学者使用方、公益机构使用方,介绍了自己的使用经验和AI作品。

中文公共语料库建设新范式:腾讯AI向善语料库正式开放申请

本次AI向善语料库开放发布会不仅是AI训练公共语料素材的展示与讨论,更是一场关于科技向善、AI普惠的探索实验,它汇聚了产学研各界力量,共同讨论如何为技术注入人情味,让科技发展的红利惠及每一位社会成员,真正实现“AI普惠一个不能少”的愿景。

2025年7月11日,腾讯AI向善语料库开放发布会在北京举行,这次发布会的主题是“AI时代没有旁观席,AI普惠一个不能少”。发布会上,腾讯与百余家社会组织公益共创的AI向善语料库(老年文本库)正式面向公益组织和非营利性研究机构开放申请,这是国内外首个通过社会公益共创构建,又面向公益组织开放的老年语料库,在一定程度上开创了公共语料库构建与开放的新范式。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-07-11 23:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

重磅|标贝科技非平衡专业语料上线 助推GPT大模型技术应用落地
...。而摆在“中国ChatGPT”面前的问题,首当其中就是中文语料库的不足。当前GPT大模型主流数据集和评估基准多以英文为主,缺少中文特点、文化,难以满足关键行业应用选型和优化的
2023-05-18 18:00:00
大模型“百花齐放” 业界合力“充实”中文语料数据
...型这个“冷灶”真正“烧热”起来。他指出,建设高质量语料库是大模型产业链的关键环节。大模型语料数据的多元供给需要多方协力、共同推进。
2023-09-08 21:31:00
...少业内人士已嗅到一丝危机:全能,意味着需要更强大的语料库来训练AI,而优质的AI语料已经越来越稀缺。AI语料,简单来说,就是用于训练和优化人工智能模型的数据集合。这些数据可以
2024-06-06 08:18:00
...京召开发布会,面向社会发布用于大模型的首批中文基础语料库。据悉,网安协会人工智能安全治理专委会会同国家权威机构,发挥企业、高校和科研单位协同优势,通过“共建-共享”机制,汇聚
2023-12-22 18:20:00
腾讯元宝“上桌”,AI助手之争再起波澜
...难追赶微信读书数百万正版图书的内容生态,这一高质量语料库,也将助力混元大模型深化专业知识能力。如今,全面接入微信搜一搜、搜狗搜索,内容覆盖微信公众号的腾讯元宝,将会进一步展现
2024-06-03 16:59:00
腾讯混元参战大模型:“幻觉率”可降低30%,多个指标超越GPT3.5
...内容产品,也为腾讯混元大模型提供了大规模、多样化的语料库,能够学习到各类应用场景中的语言知识和语境理解能力。在具体指标上,混元大模型在多个指标上超越了GPT-3.5,包括代码
2023-09-08 11:20:00
政已阅丨“新石油”能带来什么?首次举办的这场大赛剧透未来
...业发展新质生产力”项目,建设了一个千亿级高质量科创语料库。“语料库是大模型中非常重要的基础工作。相比于英语语料库,中文语料库的数据相对较少、质量不高。”项目负责人介绍。于是,
2024-09-24 22:17:00
APUS加速实现大模型普惠,让AI应用更简单
...的大模型市场上脱颖而出?整合国内外数据,丰富高质量语料库目前,国内主流模型训练中大多以中文数据集为主,但中文数据集在全球语料库中只占据3%的份额,对模型训练的局限性十分明显。
2023-09-27 11:43:00
利好不断的百度,能否撑起国产AI的门面?
...”却并不容易。中文因其特殊的语言情境,口语和方言的语料库较少、难以形成多模态语料库。并且国外主流大模型均以英文语料库为训练基础。以ChatGPT为例,训练数据中,中文语料比重
2024-06-27 14:05:00
更多关于科技的资讯:
京东折扣超市8月30日在江苏宿迁四店齐开,现场火爆,开业即限流
作为全国首个大型折扣超市业态,京东折扣超市自8月16日在河北涿州惊艳亮相后,凭借“又好又便宜”的购物体验,迅速收获京津冀消费者的如潮好评
2025-08-30 16:46:00
【2025数博会】《关于进一步强化“东数西算”工程算力枢纽协同发展的联合倡议》发布
8月29日上午举办的2025中国国际大数据产业博览会“算力聚势 智能未来”交流活动上,《关于进一步强化“东数西算”工程算力枢纽协同发展的联合倡议》由国家信息中心
2025-08-30 17:59:00
在数博会“抓”机器人?我的AI朋友们也太酷啦! On a Robot Hunt at the Big Data Expo! My AI Friends Are So Awesome!
8月28日,2025中国国际大数据产业博览会在贵州贵阳正式开幕。第十一年,我们再次相聚于“中国数谷”。本届数博会以"数聚产业动能 智启发展新篇"为主题
2025-08-30 18:30:00
【2025数博会】诚迈科技首秀数博会,信创产品矩阵惊艳亮相!
8月28日,2025中国国际大数据产业博览会在贵阳举行,诚迈科技首次亮相这一国际性展会。作为国内领先的操作系统专家与信创技术先锋企业
2025-08-30 18:30:00
猜猜谁才是数博会最忙的仔?答案:机器人!
在中国国际大数据产业博览会(简称“数博会”)上,一批形态多样、功能各异的机器人成为场馆内外关注的焦点。从灵活互动的“比心”助手
2025-08-30 18:30:00
【2025数博会】吃一口“智慧番茄” 感受大模型的“味道”
“这个西红柿真的非常好吃!”2025数博会上,一家数据安全和数据要素领域企业展台里摆放着两份番茄,吸引着参观者们前去品尝
2025-08-30 18:30:00
【2025数博会】南方电网发布电鸿物联操作系统3.0前瞻版
2025中国国际大数据产业博览会上,南方电网公司召开主题发布会,正式推出电鸿物联操作系统3.0前瞻版。本次的发布主题是
2025-08-30 20:04:00
【2025数博会】山东财经大学党委副书记、校长洪俊杰:培养兼具数字素养与人文情怀的人才
8月28日,山东财经大学党委副书记、校长洪俊杰在2025中国国际大数据产业博览会“数字人才培养”交流活动上表示:新文科建设的核心在于能否在机器智能和人类价值的动态平当中用好人工智能赋能文科教育
2025-08-30 21:37:00
在宇宙回响中探寻科幻之光——专访著名科幻作家刘慈欣
大河网讯 8月30日上午,宇宙回响《三体》海外十年影响力发布会在郑州举行。著名科幻作家、《三体》三部曲作者刘慈欣接受记者采访
2025-08-30 22:35:00
【2025数博会】库帕思金融行业解决方案总监刘东:金融AI2.0时代需从“数据治理”迈向“知识治理”
“当前AI已全面进入2.0阶段。”在“金融行业数据标注与高质量数据集建设”交流活动上,库帕思金融行业解决方案总监刘东表示
2025-08-30 22:40:00
中国移动“AI+”应用赋能千行百业 高效培育新质生产力
8月29日,在数博会现场,中国移动围绕“AI+生产”与“AI+社会治理”两大板块,集中展示了一系列深度融合人工智能与实体经济的创新解决方案
2025-08-30 22:40:00
【2025数博会】数智赋能生活:2025数博会上的未来愿景
8月30日,2025中国国际大数据产业博览会在贵阳落下帷幕。这场以“数聚产业动能 智启发展新篇”为主题的盛会,邀请800余名中外嘉宾出席
2025-08-30 21:06:00
【2025数博会】记者探数博|机器人“咖啡师”上岗
在2025中国国际大数据产业博览会现场,一台智能咖啡机器人成为许多观众科技之旅的起点。只需简单几步,这位“咖啡师”就能制作出一杯手工现磨咖啡
2025-08-30 05:29:00
近日,在省通信管理局精心筹划下,国家超算太原中心、中国移动山西公司智算中心携手接入北京市算力互联互通平台,标志着山西在落实国家“东数西算”战略
2025-08-30 06:46:00