互联网大数据的评估与采样
时间:2021-04-19 17:00
浏览:478
对网络空间中多源数据进行质量评估,一方面需要建立数据模型或提出适当的采样方法;另一方面,需要提出对采样数据的评价与检验方法。网络数据采样是将数据从Web数据库提取出来的过程。传统的数据库采样是随机从数据库中选取数据记录以获得数据库的统计信息的过程,典型方法可参考文献。但是要获取Web数据库中的数据只能通过向查询接口提交查询﹐不能自由地从Web数据库获取记录﹐故而传统方法不能实现对Web数据库的采样。
对网络空间中多源数据进行质量评估,一方面需要建立数据模型或提出适当的采样方法;另一方面,需要提出对采样数据的评价与检验方法。网络数据采样是将数据从Web数据库提取出来的过程。传统的数据库采样是随机从数据库中选取数据记录以获得数据库的统计信息的过程,典型方法可参考文献。但是要获取Web数据库中的数据只能通过向查询接口提交查询﹐不能自由地从Web数据库获取记录﹐故而传统方法不能实现对Web数据库的采样。
针对Web数据库采样。HIDDEN-DB-SAM-PLER是第一项工作,它给出了对范围属性和分类属性的处理方法﹐而对查询接口中设计的必填的可任意取值的关键词属性未作处理。提出基于图模型的增量式Web数据库采样方法WDB-Sampler,通过查询接口从Web数据库中以增量的方式获取近似随机的样本。但是该方法是针对样本中每条数据作为顶点来建立图模型,每一轮查询后都要将查询结果扩充到图模型中用于产生下一轮查询词,这样做的代价比较高。
相关阅读
- 电脑域名解析错误
- 如何办理域名转入解析
- 我用linux的vps结果昨天新加域名的时候域名都不解析,出现403错误,原本在vps上的域名都正常解析
- web服务器所属的虚拟主机分哪三种?
- 怎样进行域名解析?
- 网站子目录启用二级域名后,每个子目录是不是要当做独立的站点来优化呢!
- 息壤空间能解析几个域名?
- 中文.com域名有用吗
- 如何在域控中设置DNS反向解析
- www.开头的域名是一级域名吗?
- 中资源域名被封锁,怎么办
- 什么是Edns域名智能解析
- 这个要怎么解决哦 是什么出问题?
- 【施工现场监控方案】 施工工地监控方案
- 二级域名站对seo有什么好处
- linux系统管理与维护dns配置,怎么为域名提供正反向解析服务
- 阿里云域名如何解析
- 如何把自己的域名解析到QQ空间上
- 新网如何将代理下的域名,转到我自己的手里进行管理?
- 二级域名的利弊是怎样的
最新资讯