您好,欢迎来到海南中小企业大数据中心及公共服务平台!     请登录   免费注册
专利概况
专利名称 一种基于主题模型的医案分类方法
申请号 CN201611207980.8 申请日
公开(公告)号 CN106709520B 公开(公告)日
申请(专利权)人 浙江大学 发明人 张引; 李哲蓉; 姚亮; 魏宝刚
专利来源 国家知识产权局 转化方式
摘要

本发明公开了一种基于主题模型的医案分类方法。步骤如下:1)通过OCR、文本结构化处理,从医案书籍中提取结构化单篇医案;2)使用中文分词工具,对所有结构化单篇医案进行预处理,包括分词和去停用词;3)分别使用中药、方剂、疾病、症状、证候、治法的领域词典对医案的分词结果进行过滤,得到每篇医案对应的六个词表。4)建立包含普通词、中药、方剂、疾病、症状、证候、治法七大类的医案主题模型。5)将所有医案在步骤3)过滤得到的六个词表和医案中剩下的词一起输入主题模型中进行训练,通过吉布斯采样得到文档主题分布。6)将文档主题分布输入训练好的SVM分类器得到相应类别。

参与列表

主管部门:海南中小企业服务 | 建设单位:海南商业联合会

版权所有:海南商业联合会 | 备案号:粤ICP备13083911号(ICP加挂服务)@2017