总书记曾强调创新是引领发展的第一动力。为了建设创新型企业,企事业单位高度重视科技创新投资。在科学研究项目投资逐年增加的背景下,必须促进科学技术项目的重复核查制度,以处理科学研究项目的大量历史数据,增加科学研究项目,避免重复科学研究项目。
国内外对重复数据的核查和比较进行了大量研究,重复数据的核查技术比较成熟。例如,国外研究主要包括基于向量空间模型的比较分析、基于语义的文本相似度比较、基于统计的相似度比较以及基于人工智能和元数据的比较分析。
国内还有很多汉语分词技术、关键词提取技术、基于现有语料库的相似性计算分析、基于语义的重复检查技术。与此同时,一些国内的科技项目管理系统开发了重复核查功能,如国家自然科学基金项目申请文本查重,立项情况查询,中国科技信息研究所的科技报告相似性检测系统,企事业单位文档查重的Tocheck,以及中国知网、Papertime的论文查重系统等。
通过对科学技术项目重复进行核查,有效解决了科学研究文件的单独储存、与评估科学研究项目有关的工作量增加以及对科学研究项目的重复投资等问题。
一方面,科学和技术项目重复核查系统提供了科学研究项目文件的搜索功能,丰富了研究人员在选择课题和项目时可以参考的数据来源,同时促进了科学研究项目的自我审查以及科学研究政策和主题的调整。
此外,通过自动检测科技项目重复核查系统和人工专家核查,有效提高了科研重复控制的效率和准确性。
科技项目重复核查系统建设过程中建立的文件元数据标准可适用于其他平台----公司知识和文件形式,从而有效地将公司知识联系起来,减少学术信息孤岛问题。同时,重复检查项目开发的重复检查算法也适用于搜索引擎的排序、文件数据库或知识库中的冗馀信息检查。