专利名称 | 基于知识图谱的社交媒体大数据主题发现方法 | ||
申请号 | CN201710089527.X | 申请日 | |
公开(公告)号 | CN106909643A | 公开(公告)日 | |
申请(专利权)人 | 同济大学 | 发明人 | 黄震华; 倪娟; 程久军 |
专利来源 | 国家知识产权局 | 转化方式 | 委托人转化 |
摘要 |
本发明涉及一种基于知识图谱的社交媒体大数据主题发现方法,通过知识图谱概率化处理、社交媒体大数据语义相似度计算、主题的模糊密度聚类以及弱信息量主题过滤4个步骤来实现社交媒体大数据的主题发现。知识图谱概率化处理步骤完成知识图谱中三元组事实的置信度评估及其为真概率值的生成,社交媒体大数据语义相似度计算步骤实现每对文档的语义映射图构造以及基于近似图匹配策略评估文档间的语义相似度,主题的模糊密度聚类步骤获取社交媒体大数据的不同主题并自动确定主题的数量,而弱信息量主题过滤步骤删除语义强度不足的主题并将最优的主题列表返回给用户。与现有技术相比,本发明具有扩展性程度高、自适应能力强以及准确性高等优点,能够有效应用于社会公共安全、民众医疗健康、互联网深度信息服务和电子商务等领域。 |
主管部门:海南中小企业服务 | 建设单位:海南商业联合会
版权所有:海南商业联合会 | 备案号:粤ICP备13083911号(ICP加挂服务)@2017