专利名称 | 一种面向大数据聚集分析的近似计算方法 | ||
申请号 | CN201710982111.0 | 申请日 | |
公开(公告)号 | CN107704611A | 公开(公告)日 | |
申请(专利权)人 | 同济大学 | 发明人 | 黄震华; 高军; 张志飞 |
专利来源 | 国家知识产权局 | 转化方式 | 委托人转化 |
摘要 |
本发明公开一种面向大数据聚集分析的近似计算方法,主要包括数据分割、渐进近似计算以及聚集增量更新三个模块。数据分割模块将原始大数据顺序划分成多个流式数据片,并调整每个数据片中的数据元组。渐进近似计算模块从首个数据片开始处理输入到该模块中的所有数据片,调用聚集增量更新模块获取分析结果值的多次采样值,在此基础上,返回近似分析结果值以及相对标准差/置信区间。当用户接受当前近似值所处的相对标准差/置信区间时,分析过程停止,否则,将增加一个数据片来提高分析结果的精度。本发明具有分析速度快、分析结果准确度高以及分析过程更人性化等优点,能够有效应用于电子商务、智能交通、商业智能、医疗健康以及数据可视化等领域。 |
主管部门:海南中小企业服务 | 建设单位:海南商业联合会
版权所有:海南商业联合会 | 备案号:粤ICP备13083911号(ICP加挂服务)@2017