专利名称 | 一种不同信息源的房产数据同一性判别方法 | ||
申请号 | CN201910242011.3 | 申请日 | |
公开(公告)号 | CN109977287A | 公开(公告)日 | |
申请(专利权)人 | 国家计算机网络与信息安全管理中心 | 发明人 | 刘春阳; 张旭; 王鹏; 姜越; 张华平; 张吴波; 张宝华 |
专利来源 | 国家知识产权局 | 转化方式 | |
摘要 |
本发明涉及一种不同信息源的房产数据同一性判别方法,属于互联网数据分析与挖掘技术领域。所述同一性判别方法基于链家、我爱我家、中原、麦田网站公布的房屋数据及其相关性;通过分析房屋数据的特点,通过区域去重、小区去重以及房屋去重的三大步骤剔除重复的房屋数据,所述房屋数据是对实际的房屋客体的特点描述,虽然描述的角度和方式存在差异,但数据之间存在很强的相关性。所述方法能对来源于不同网站的房屋数据去重,能够准确、高效的对来源于不同信息源的房屋数据的同一性判别,并能有效去除重复区域、小区,可以实现面向多源异构的房屋数据的有效融合,为房地产市场分析提供“干净”,“整齐”的数据。 |
主管部门:海南中小企业服务 | 建设单位:海南商业联合会
版权所有:海南商业联合会 | 备案号:粤ICP备13083911号(ICP加挂服务)@2017