大数据环境下用于实体解析的两层相关性聚类方法
发表日期:2014-10-09 12:41AM 阅览次数:
[摘要] 数据量大、数据更新块、数据源多样和数据存在噪声是大数据的四大特点,这为数据集成提供了新的挑战。实体解析是数据集成的一个很重要的步骤,在大数据环境下,传统的实体解析算法在效率、质量上表现并不是很明显。所以为了解决大数据环境中因为数据噪声所导致的解析结果冲突,捡公共邻居引入相关性聚类问题上。
点击免费下载:【PDF】大数据环境下用于实体解析的两层相关性聚类方法
[摘要] 数据量大、数据更新块、数据源多样和数据存在噪声是大数据的四大特点,这为数据集成提供了新的挑战。实体解析是数据集成的一个很重要的步骤,在大数据环境下,传统的实体解析算法在效率、质量上表现并不是很明显。所以为了解决大数据环境中因为数据噪声所导致的解析结果冲突,捡公共邻居引入相关性聚类问题上。
点击免费下载:【PDF】大数据环境下用于实体解析的两层相关性聚类方法