• 我的订阅
  • 科技

学术论文归档保存应从数字化转向数据化

类别:科技 发布时间:2024-04-30 04:19:00 来源:每日看点快看

本文转自:科技日报

学术论文归档保存应从数字化转向数据化

用更小保存单元实现更高共享效率

◎实习记者 沈 唯

日前,一项发表在《图书馆学与学术交流杂志》上的针对700多万份数字出版物的研究表明,超过200万篇标有数字对象标识符(DOI)的学术论文未得到妥善归档和保存。尽管这项研究被认为存在一定局限性,但研究的相关分析结果仍然引起了文献专家的关注与讨论。

如今,学术论文的产出数量大、速度快。上述研究指出,在线保存论文的系统已经无法满足研究产出的增长速度。是否有必要对所有学术论文进行归档保存?学术论文归档保存面临哪些机遇和挑战?

交流共享是重要目的

上世纪八十年代前,纸质化保存是学术论文归档保存的主流形式,主要以期刊为保存单元。“纸质化保存成本很高。购买纸质期刊需要成本,存放期刊要占用巨大空间。”中国人民大学信息资源管理学院教授索传军说。

随着数字技术水平提高,学术论文数字化保存逐渐成为主流,在保存单元上也打破期刊限制,将单篇学术论文作为基本保存单元。数字化保存使获取学术论文的便捷性、开放性更高,保存成本更低,同时解决了存储面积不足和期刊重复保存造成资源浪费等问题。

“现在有一些机构采用混合存档,对大多数学术论文进行数字化保存,对少量重要期刊和论文仍以纸质化形式保存。国家科技图书文献中心(NSTL)采用的就是这种方式。”索传军介绍,此外,还有一些机构对二次文献或学术论文的元数据进行保存,或是只保存论文的摘要、关键词等。

在探讨对学术论文归档保存的必要性之前,需要明确保存论文的目的。索传军认为,学术论文是对科研结果的记录,保存学术论文是为了让后人能够有效获取并了解前人的研究成果,保持学术研究的传承性和连贯性。同时,保存学术论文也是为了实现更大范围的知识交流与共享,提高科研效率,节省研究资源和成本。

“在我看来,对所有学术论文进行归档保存,从理论上来说没有必要。”索传军认为,一方面,根据文献计量学中经典的布拉德福定律,期刊是分层的,学术论文也是分层的。一些学术论文价值不高、创新性不强、研究结论过时,还有些论文甚至可能存在一定重复或错误。此类论文没有必要进行保存。另一方面,依据信息生命周期理论,学术论文的学术价值也随时间变化。大部分论文生命周期较短,很快就会因过时而失去参考价值。

从国内外有关机构的粗略统计分析结果看,60%以上的学术论文在发表后从未被访问和获取,即从未参与知识交流和共享。此外,由于每个人的时间和精力有限,论文保存得越多,人们有效获取信息的效率就越低,知识交流共享的成本也就越高。

“学术论文是为了保存而保存,还是为了满足当下国家重大科学技术和经济发展需求,以及科研人员对知识交流共享的实际需要而保存?这是一个本质问题。”索传军说。

逐步缩小保存单元

数字化时代,学术论文归档保存工作的挑战和机遇并存。“我国在算力、云存储等方面的水平较高,因此技术问题并非最大挑战。目前我们面临的主要问题在于,如何选择判断需要归档保存的学术论文。这不仅缺乏较为统一的选择判断标准,而且也缺乏较为科学的评价方法。”索传军说。

直至目前,人们仍主要依据学术期刊的影响因子大小判断一本期刊及其刊载论文的重要性或学术价值。从客观上看,期刊的影响因子并不能代表其刊载论文的学术价值,每种期刊刊载的每篇学术论文质量和价值不同。

大多数情况下,人们并不需要阅读一篇学术论文的完整文本,而是要借鉴和利用论文中有学术价值的内容,这些内容可以被称为“知识元”。索传军认为,一篇学术论文本质上是一组知识元的逻辑组合。论文最有创新价值的部分,就浓缩在这些知识元中。知识元才是人们真正需要的,也是真正需要归档保存的。

“数字化保存单元已经从期刊变为论文,下一步能否打破对学术论文全文保存的限制,只保存论文的核心知识元?如果归档保存的单元是知识元,读者直接获取的也是知识元。我们归档保存对象的单元会更小,成本会更低,读者获取利用效率会更高。”索传军认为,学术论文中知识元的识别和提取是一大关键挑战。这不仅是对相关技术的挑战,更是对学界和业界在保存学术论文的认识和观念上的挑战。

当前,国际上一些学术期刊杂志社(出版集团)已经进行了小范围尝试。他们要求作者在投稿时提供论文所阐述的新观点,即让作者描述最具价值的创新知识元。在索传军看来,这种尝试是有益的,但同时会存在主观性偏强的问题。如有些作者为了发表文章拔高论文的创新性,或是因个人的认知水平不足而对创新性的描述过高。

索传军认为,当下数字技术的发展,要求学术论文的保存单元不再局限于期刊,“一刀切”的保存策略或许也应做出改变。“我们对学术论文的数字化保存,应该顺应时代发展,逐步过渡到数据化保存阶段。这需要将学术论文转化成更精细的数据,而不是机械性地把纸质论文转化成计算机上‘0’和‘1’的符号。”他说。

在首次全国数据工作会议上,国家数据局提出,探索建设国家级数据标注基地。索传军说,学术论文也是数据标注的对象之一。对学术论文内容进行深入、细致、准确标注,可以较为精准地定位、获取、利用知识元。

生成式人工智能和大语言模型等新技术的应用有望实现这一目标。“学术论文是针对研究问题开展的。如果能通过机器学习找到每篇学术论文的主要研究问题,就可以对此进行标注,进而使读者能通过研究问题来检索论文。”索传军说,这将是一个长期积累和发展的过程,必须循序渐进地构建起不同领域、不同学科的标准和参照系,利用大语言模型和机器学习等技术,经过不断优化迭代,最终使标注结果达到科学准确。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-04-30 05:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

如果没有课题可以发论文吗?
...研究任务的难度就会更大。没有课题并不意味着无法进行学术研究。其实,很多发表的论文并不依赖于大型课题。新闻传播学领域,尤其是数字传播、新媒体研究等方向,开源数据资源丰富,只要你
2024-11-01 11:28:00
知网反垄断调查尘埃落定,行业规范化发展成“关键抓手”
...续保持世界排名第2位,这些数据表明中国已成为高质量学术论文数量第一梯队的国家之一。但显然,中国的学术期刊发展规模和速度比不上中国学术论文的发展。首先,大多数学术期刊依赖于大学
2023-01-19 03:00:00
...灵魂的文字垃圾,而且会让一些学生滋生懒惰心理,丧失学术研究的兴趣和能力。如果沉湎于此,无疑是对AI技术的莫大嘲讽——作为高效的数字化工具,人工智能旨在使“人工”变得更加“智能
2024-05-29 02:40:00
学术会议解决方案实现会议全流程数字化管理!
学术会议具有信息搜集工作量大、筹备周期长、评审工作繁琐、议程多、学术任务多等特点,因此,学术会议需要信息管理系统对学术会议全生命周期进行全流程的管理。快会务曾为众多学术会议提供数
2023-01-02 08:00:00
...次站在舆论风口浪尖。有评论指出,作为在中国境内中文学术文献网络数据库服务市场上一家独大的机构,知网对中国学术体系有着深远影响。那么,如何正确评价知网的功过是非?本文指出,知网
2023-09-07 17:55:00
本科毕业论文有点“水” 要不要变成可选项?
...版文献中去挖掘理解。我大约参考了近16本专著和40多篇学术论文,这不仅帮助我学习英语,还让我提升了独立学习枯燥深奥的论文和书籍的能力。”她提到,未来她打算出国读研究生,毕业论
2024-06-11 07:16:00
...过于机械,许多学生为此苦恼,客观上也出现了消磨论文学术价值的情况。论文是学生学业水平的集中体现,原创性是衡量一篇论文的重要指标。依托技术进行查重,能更高效地打击抄袭,对学术诚
2024-06-21 04:35:00
快会务助力管理升级,学术会议更省心!
目前,学术会议的举办模式已形成定式,各类学术会层出不穷,大都遵循业内已有的那套完整的办会流程。因循收据固然可以避免错误,安稳办会,但缺乏新意,容易出现疲态,那么有没有什么高效的管
2023-01-01 13:00:00
学术数据库惊现多个“劫持性期刊”
...中国科学报给未经同行评议的可疑论文披上合法“外衣”学术数据库惊现多个“劫持性期刊”图片来源:DAVIDE BONAZZI/SALZMANART本报讯 在当前激烈竞争的国际背景下
2024-01-03 07:24:00
更多关于科技的资讯:
2025年玛咖(玛卡)品牌综合评测:如何找到适合自己体质的调理方案?
在个性化健康日益成为主流的今天,男性对保健品的需求已从“大众配方”转向“个体化方案”。玛咖作为广受关注的植物补充剂,其功效虽获认可
2025-11-04 15:47:00
可梦AI开放测试获首批企业盛赞!“短剧男频标杆”的蜜糖网络实力入驻,共启AI短剧工业化新篇
短剧行业全流程智能平台可梦AI正式开启企业测试通道,凭借“真AI驱动全链路、需求响应极速、企业服务定制化”的核心优势,迅速赢得首批入驻企业的高度认可
2025-11-04 13:50:00
CFCA安心诉存证服务,融资租赁行业的电子证据守护者
目前,融资租赁行业正在快速向数字化转型迈进,行业内线上业务的繁荣发展,使得电子数据在交易出现司法纠纷时所起到的作用愈发重要
2025-11-04 13:51:00
当年轻人开始在夏天“进补”,巨量星图如何用一场计划“养”出多个品牌破圈增长
当养生成为这届年轻人的日常,一边熬夜一边搜索“祛湿攻略”,左手冰美式右手胶原蛋白,已成为他们的生活常态。对于大健康品牌来说
2025-11-04 13:52:00
平台化协同·场景为先--中叉网对话安庆联动属具公司的高质量跃迁
2025年8月上旬,“合力改变物流搬运方式--合力•中叉网 | 2025中国叉车和移动机器人高质量发展万里行”再次走进安徽叉车集团旗下的安庆联动属具股份有限公司
2025-11-04 13:52:00
智造能力的跃升,正在成为中国品牌突破创新的底气
智造能力的跃升,正在从结构上打破「高端化」市场格局。以厨电市场为例,以往在单价8万元/㎡以上住宅项目中,进口厨电占比高达78%
2025-11-04 08:12:00
畅通京津冀算力“高速路”!河北大力推进京津冀三地网络协同、服务协同、算力资源协同
河北大力推进京津冀三地网络协同、服务协同、算力资源协同畅通京津冀算力“高速路”10月17日,在2025中国国际数字经济博览会上
2025-11-04 08:12:00
厦门网讯(厦门日报记者 李晓平)近日,省工信厅公布省级人工智能硬件优质产品名单,全省18个入选产品中,厦门独占8席,包括瑞为
2025-11-04 08:38:00
在生成式AI重构流量分配格局的2025年,中国GEO服务商市场已形成清晰的三大梯队。据《2025中国生成式AI搜索生态白皮书》数据显示
2025-11-04 08:49:00
在生成式AI重构流量分配规则的2025年,企业面临着一个核心问题:为什么同样是GEO服务,不同服务商带来的商业回报差距能高达300%以上
2025-11-04 08:50:00
厦门网讯(厦门日报记者 吴燕如 李晓平)我市再添人工智能新型孵化载体——10月31日,位于数字立方大厦的思明未来科技园正式揭牌运营
2025-11-04 09:10:00
大皖新闻讯 11月4日,星巴克咖啡公司宣布与博裕投资达成战略合作,双方将成立合资企业,共同运营星巴克在中国市场的零售业务
2025-11-04 09:31:00
在远程操控下,焦炉“四大车”(装煤车、推焦车、拦焦车、熄焦车)有条不紊地进行作业;通过设备预测性维护系统,设备的早期故障得到智能诊断……在河北新兴能源科技股份有限公司(以下简称“新兴能源科技公司”)
2025-11-04 09:01:00
“产业炬光灯”聚焦厦企笃正新能源 紧跟市场谋创新
“产业炬光灯”聚焦笃正新能源。厦门网讯(厦门日报记者 林露虹)把阳光“存”起来,变成随时可用的电能。厦门企业笃正新能源在离网光伏储能领域持续深耕
2025-11-04 08:07:00
需求释放结构升级,消费市场涌动“焕新”潮
“还有咖啡节”在玄武湖公园打造了时尚潮流集市,吸引许多市民前来消费打卡,在明媚秋光中度过惬意周末。 通讯员 常成 南京日报/紫金山新闻记者 孙中元 摄今日关注数字4
2025-11-04 07:41:00