• 我的订阅
  • 科技

用于大模型的首批中文基础语料库发布

类别:科技 发布时间:2023-12-22 18:20:00 来源:每日看点快看

本文转自:中国新闻网

中新网北京12月21日电 中国网络空间安全协会人工智能安全治理专业委员会20日在北京召开发布会,面向社会发布用于大模型的首批中文基础语料库。

据悉,网安协会人工智能安全治理专委会会同国家权威机构,发挥企业、高校和科研单位协同优势,通过“共建-共享”机制,汇聚一批高质量可信数据,经过去重、过滤等技术手段,形成并对社会发布首批120G中文基础语料,包括1亿余条数据,500亿个token。用户登录中国网络空间安全协会网站,点击“中文基础语料库”链接,通过注册、认证等程序,就能够下载相关语料。

网安协会人工智能安全治理专委会负责人表示,语料库建设是一项长期性、专业性的工作,需要遵循相应法规、标准和规范,需要合力共建、突破创新,推动形成科学有效的语料库汇聚、处理、使用机制,为国家人工智能技术创新和产业发展赋能。

来自专委会成员单位、大模型备案机构和相关领域科研、企业、社会组织代表近100人参加发布会。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-12-22 21:45:04

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

重磅|标贝科技非平衡专业语料上线 助推GPT大模型技术应用落地
...。而摆在“中国ChatGPT”面前的问题,首当其中就是中文语料库的不足。当前GPT大模型主流数据集和评估基准多以英文为主,缺少中文特点、文化,难以满足关键行业应用选型和优化的
2023-05-18 18:00:00
...少业内人士已嗅到一丝危机:全能,意味着需要更强大的语料库来训练AI,而优质的AI语料已经越来越稀缺。AI语料,简单来说,就是用于训练和优化人工智能模型的数据集合。这些数据可以
2024-06-06 08:18:00
大模型“百花齐放” 业界合力“充实”中文语料数据
...型这个“冷灶”真正“烧热”起来。他指出,建设高质量语料库是大模型产业链的关键环节。大模型语料数据的多元供给需要多方协力、共同推进。
2023-09-08 21:31:00
知乎 AI 革命:智能搜索与实时问答的融合
...容有更多被采集、使用和预训练的可能。参与国家级中文语料库建设,成为重要的语料建设者。整个社区的激进 AI 化。AI 进行提问,更负责回答。知乎社区将出现大量的 AI 数字人作
2024-03-31 21:00:00
千行百业加速拥抱大模型(AI前沿观察)
...云、中科创达、蚂蚁集团等17家企业发布《“中文互联网语料库”共建共享倡议书》。数据交易日益兴起,为大模型获取语料资源提供了新途径。《上海市推动人工智能大模型创新发展若干措施(
2023-12-22 03:26:00
中文公共语料库建设新范式:腾讯AI向善语料库正式开放申请
2025年7月11日,腾讯AI向善语料库开放发布会在北京举行,这次发布会的主题是“AI时代没有旁观席,AI普惠一个不能少”。发布会上,腾讯与百余家社会组织公益共创的AI向善语料库
2025-07-11 22:07:00
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...地”的弱智吧,最近竟摇身一变成了——最佳中文AI训练语料库?由此受到启发,是否并不是训练AI的优质数据不够用,而是还有更多宝藏数据资源值得深挖?近日,由中科院深圳先进技术研究
2024-04-15 17:00:00
上海:发力语料,建设“模都”
...界共识,发展趋势不可阻挡。2024年7月6日的语料论坛上,语料库建设导则正式发布。人民网记者 王初摄“人工智能训练,不仅要关注数据语料的数量,也要重视’数据配方’,用高质量数
2024-07-06 13:16:00
主流文化语料库重磅上线,将为数字文化产业发展带来哪些意义?
...东数字文化集团(以下简称山东数文集团)与人民网共建语料库合作签约暨项目推进会在济南举行,山东数文集团与人民网正式签约,共建全国首个主流文化语料库。什么是主流文化语料库?它的建
2025-08-25 16:46:00
更多关于科技的资讯:
晋镜头 | 从“一根丝”看山西制造的进阶之路
一根长1米、仅重0.5克的“丝”,却能稳稳提起约200公斤的重物,这近乎科幻的场景,正在中国科学院山西煤化所的实验室与生产线上成为现实
2026-01-27 17:10:00
中新经纬1月27日电 (谢婧雯)“希望能重现11年前微信红包的时刻。”26日,在腾讯2026年员工大会上,腾讯董事会主席马化腾提及AI应用元宝将于春节推出的10亿元现金红包活动时说
2026-01-27 19:29:00
“之前和同事聊天计划去海南过年,当时谁也没用手机搜索。但两个小时后,我的社交平台首页就出现了海南旅游的相关推送。”近日
2026-01-27 18:06:00
给最好的创意搭配最强的算力
2026-01-27 18:23:00
鲁网1月27日讯为助力制造业高质量发展,聚焦单项冠军企业及科创型企业发展需求,2025年以来,邮储银行滨州市分行通过专项政策倾斜
2026-01-27 16:56:00
故宫同款徐州造!“清洁神器”领跑全国细分赛道
新华报业・中国江苏网讯 能守护故宫、布达拉宫等文化地标御道洁净,也能攻克城市背街小巷精细化清洁难题,这些实力与口碑兼具的“清洁神器”
2026-01-27 16:59:00
为深入贯彻中央金融工作会议精神,落实党中央提振消费的决策部署,青岛银行紧扣居民消费升级与生活品质提升需求,2025年创新推出线上数字信贷品牌“青易融”
2026-01-27 14:33:00
硬核登场,焦点汇聚 星梭科技重磅亮相2026北京国际商业航天展
1月23日至25日,2026北京国际商业航天展览会在北京亦庄隆重举行。星梭科技(北京)有限公司(展位号A260)以全新姿态重磅登场
2026-01-27 14:33:00
近日,由中国医药新闻信息协会指导、健识局主办的2025第六届论健·年度星榜发布。抗流感1类创新药——玛硒洛沙韦片(商品名
2026-01-27 14:36:00
海外网1月27日电 据美国哥伦比亚广播公司1月26日报道,谷歌公司已同意支付6800万美元(约合人民币4.73亿元),以解决一项集体诉讼案
2026-01-27 14:45:00
欧洲超级食物营养理念兴起,Myowellness超级食物受到关注
近年来,随着消费者对天然饮食与日常营养管理的重视不断提升,以植物来源为核心的超级食物(SuperFood)逐渐在欧洲市场形成稳定的消费认知
2026-01-27 15:05:00
两会快评|给最好的创意搭配最强的算力
创意是创新的源头,算力是创新的助推器。两者双向奔赴,能够催生璀璨的创新之花。综合算力指数全国第一,13个大模型通过国家备案
2026-01-27 15:20:00
打造中国版Open Evidence,蚂蚁阿福 PC端上线DeepSearch功能
今日,蚂蚁阿福升级其 PC 端,并上线DeepSearch(深度搜索)功能打造中国版“Open Evidence”,免费为医生
2026-01-27 15:47:00
15省国补上线京东秒送,换新机最高立省1500元还有叠加优惠
河北新闻网讯(记者 李春炜)近日,京东旗下即时零售平台京东秒送宣布已全面承接2026年国补落地,北京、上海、广东、江苏
2026-01-27 16:03:00