您好,欢迎来到海南中小企业大数据中心及公共服务平台!     请登录   免费注册
专利概况
专利名称 一种科技文献大数据分类方法
申请号 CN201911066136.1 申请日
公开(公告)号 CN110807101A 公开(公告)日
申请(专利权)人 中国科学技术信息研究所 发明人 张晓丹; 梁冰; 王莉; 白海燕
专利来源 国家知识产权局 转化方式
摘要

本发明涉及一种科技文献大数据分类方法,属于大数据文本挖掘技术领域;该方法S1、构建拓扑关系图:该图由节点和边组成,节点为文献、句子和STKOS中的关键词;边为文献和句子,文献和关键词,句子和句子,句子和关键词及关键词和关键词之间的关系;S2、将拓扑关系图转化成拓扑关系矩阵;S3、使用训练数据及其构建的拓扑关系矩阵对分类模型进行训练;S4、文献分类:将批量的待分类文献输入到训练好的分类模型中,得到待分文献归属于不同类别的概率。对比现有技术,本发明所构建的拓扑关系图,句子考虑了语序的因素,关键词为专家标引过的术语,提升了分类准确率;采用的分类模型,无需重复训练且对每一卷积层的输入进行采样计算,提高了分类效率。

参与列表

主管部门:海南中小企业服务 | 建设单位:海南商业联合会

版权所有:海南商业联合会 | 备案号:粤ICP备13083911号(ICP加挂服务)@2017