对网络空间中多源数据进行质量评估,一方面需要建立数据模型或提出适当的采样方法;另一方面,需要提出对采样数据的评价与检验方法。网络数据采样是将数据从Web数据库提取出来的过程。传统的数据库采样是随机从数据库中选取数据记录以获得数据库的统计信息的过程,典型方法可参考文献。但是要获取Web数据库中的数据只能通过向查询接口提交查询﹐不能自由地从Web数据库获取记录﹐故而传统方法不能实现对Web数据库的采样。
2021-04-19
472