• 我的订阅
  • 科技

用于大模型的首批中文基础语料库发布

类别:科技 发布时间:2023-12-22 18:20:00 来源:每日看点快看

本文转自:中国新闻网

中新网北京12月21日电 中国网络空间安全协会人工智能安全治理专业委员会20日在北京召开发布会,面向社会发布用于大模型的首批中文基础语料库。

据悉,网安协会人工智能安全治理专委会会同国家权威机构,发挥企业、高校和科研单位协同优势,通过“共建-共享”机制,汇聚一批高质量可信数据,经过去重、过滤等技术手段,形成并对社会发布首批120G中文基础语料,包括1亿余条数据,500亿个token。用户登录中国网络空间安全协会网站,点击“中文基础语料库”链接,通过注册、认证等程序,就能够下载相关语料。

网安协会人工智能安全治理专委会负责人表示,语料库建设是一项长期性、专业性的工作,需要遵循相应法规、标准和规范,需要合力共建、突破创新,推动形成科学有效的语料库汇聚、处理、使用机制,为国家人工智能技术创新和产业发展赋能。

来自专委会成员单位、大模型备案机构和相关领域科研、企业、社会组织代表近100人参加发布会。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-12-22 21:45:04

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

重磅|标贝科技非平衡专业语料上线 助推GPT大模型技术应用落地
...。而摆在“中国ChatGPT”面前的问题,首当其中就是中文语料库的不足。当前GPT大模型主流数据集和评估基准多以英文为主,缺少中文特点、文化,难以满足关键行业应用选型和优化的
2023-05-18 18:00:00
...少业内人士已嗅到一丝危机:全能,意味着需要更强大的语料库来训练AI,而优质的AI语料已经越来越稀缺。AI语料,简单来说,就是用于训练和优化人工智能模型的数据集合。这些数据可以
2024-06-06 08:18:00
大模型“百花齐放” 业界合力“充实”中文语料数据
...型这个“冷灶”真正“烧热”起来。他指出,建设高质量语料库是大模型产业链的关键环节。大模型语料数据的多元供给需要多方协力、共同推进。
2023-09-08 21:31:00
知乎 AI 革命:智能搜索与实时问答的融合
...容有更多被采集、使用和预训练的可能。参与国家级中文语料库建设,成为重要的语料建设者。整个社区的激进 AI 化。AI 进行提问,更负责回答。知乎社区将出现大量的 AI 数字人作
2024-03-31 21:00:00
千行百业加速拥抱大模型(AI前沿观察)
...云、中科创达、蚂蚁集团等17家企业发布《“中文互联网语料库”共建共享倡议书》。数据交易日益兴起,为大模型获取语料资源提供了新途径。《上海市推动人工智能大模型创新发展若干措施(
2023-12-22 03:26:00
中文公共语料库建设新范式:腾讯AI向善语料库正式开放申请
2025年7月11日,腾讯AI向善语料库开放发布会在北京举行,这次发布会的主题是“AI时代没有旁观席,AI普惠一个不能少”。发布会上,腾讯与百余家社会组织公益共创的AI向善语料库
2025-07-11 22:07:00
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...地”的弱智吧,最近竟摇身一变成了——最佳中文AI训练语料库?由此受到启发,是否并不是训练AI的优质数据不够用,而是还有更多宝藏数据资源值得深挖?近日,由中科院深圳先进技术研究
2024-04-15 17:00:00
上海:发力语料,建设“模都”
...界共识,发展趋势不可阻挡。2024年7月6日的语料论坛上,语料库建设导则正式发布。人民网记者 王初摄“人工智能训练,不仅要关注数据语料的数量,也要重视’数据配方’,用高质量数
2024-07-06 13:16:00
主流文化语料库重磅上线,将为数字文化产业发展带来哪些意义?
...东数字文化集团(以下简称山东数文集团)与人民网共建语料库合作签约暨项目推进会在济南举行,山东数文集团与人民网正式签约,共建全国首个主流文化语料库。什么是主流文化语料库?它的建
2025-08-25 16:46:00
更多关于科技的资讯:
成安“一品一播”赋能工业企业发展主播带货推动工业品线上热销河北新闻网讯(记者刘剑英)因一场直播,前不久,一名新疆卡车司机跨越3000多公里
2025-12-25 11:29:00
海尔×牛客AI面试:用技术重塑候选人体验,让招聘更有温度
效率与品质并行的时代,AI正在改写招聘的底层逻辑。从校招高峰到全球人才争夺战,越来越多企业正让AI深度介入招聘流程,让人才筛选像生产一样精准
2025-12-25 12:27:00
百度AI营销 × 茅台酱香:以岁月记忆沉淀品牌温度,打造全链路沟通范式
那些关于奔赴与抵达的足迹,那些串联起奋斗与团圆的旅程,不仅是时光的印记,更藏着一整年的热爱与坚守。当这些珍贵的生活轨迹被温柔唤醒
2025-12-25 12:29:00
不只是杯壶!新华社文创·哈尔斯“必胜”系列正式上线
近日,新华社文创与头部杯壶品牌哈尔斯携手推出“必胜”系列杯壶产品,该系列产品的策划灵感,源自纪念中国人民抗日战争暨世界反法西斯战争胜利80周年大会受阅现场划破长空的铿锵口号
2025-12-25 12:29:00
鸿蒙星火,桃李芳华:2025 HarmonyOS人才布道师年度论坛凝聚生态向心力
12月20日,“2025 HarmonyOS人才布道师年度论坛”于重庆举行。本次论坛不仅是一场对2025年度HarmonyOS人才发展的最新进展与成果的集中展示
2025-12-25 12:31:00
TPACK框架赋能高中英语教师信息化教学设计:现状、挑战与路径
摘要: 本研究基于TPACK框架,采用混合方法调查河南省高中英语教师信息化教学现状。结果显示:教师总体能力尚可(3.85)
2025-12-25 13:19:00
中新经纬12月25日电 “携程黑板报”公众号25日发布关于用户关切问题的郑重声明。针对近日大家高度关注的用户数据安全等问题
2025-12-25 14:01:00
长白时评评论员 久泰平近日,中国人民大学“书记严选”文创羽绒服热销火爆全网,源自中国人民大学党委书记张东刚在小红书社交平台上发帖推荐该校近期上新的人大超绒羽绒服
2025-12-25 14:06:00
Soul App联合复旦发布2026社交趋势十大关键词
近日,社交平台Soul App旗下Just So Soul研究院联合复旦大学传播与国家治理研究中心、复旦大学价值认知传播与人智协同治理交叉创新团队
2025-12-25 14:13:00
腾讯扣叮发布2026新品,助力人工智能教育普及
12月22日,2025腾讯扣叮渠道生态大会暨2026年新产品推介会在深圳举行。会上,腾讯扣叮宣布“快叮岛”迎来全新升级版本
2025-12-25 14:13:00
北京惠诚律师事务所举办律师品牌建设主题沙龙
12月5日下午,由北京市惠诚律师事务所与北京律页网络科技有限公司联合主办,百度百科、百度智能体、律视微言共同支持的“律业IP·惠诚赋能——律师品牌建设的创新路径”主题沙龙在惠诚律师事务所成功举办
2025-12-25 14:13:00
卡游:架设国潮文化和青少年之间的桥梁 ——“文化赋能,育心育人” 学术研讨会在京举办
12月20日,由央广传媒集团主办、浙江卡游动漫有限公司公益支持的“文化赋能,育心育人——中华优秀传统文化促进青少年心理健康学术交流活动”在北京举行
2025-12-25 14:43:00
中新经纬12月25日电 25日,公安部举行新闻发布会。会上,公安部经济犯罪侦查局局长华列兵表示,金融领域“黑灰产”已形成一套完整的产业链条
2025-12-25 14:48:00
中国青年报客户端讯(中青报·中青网记者 蒋肖斌)“未来音乐研讨会暨国家社科基金艺术学重大项目《音乐与人工智能协同创新发展理论研究》学术研讨会”
2025-12-25 15:49:00
在唐山,金融服务正跳出传统柜台,上演着一场场生动的“现场作业”。曹妃甸经开区一家手握多项专利的科技企业,一周内获得了急需的发展资金
2025-12-25 15:56:00