使用调查数据进行数据验证

使用调查数据进行数据验证

数据收集过程具有固有的缺陷。

最引人注意的是,部分调查问卷填写不完整,提供的某些信息不正确。但是,这并不能阻止公司基于数百万条记录(其中一些包含不完整或不正确的数据)进行收集和做出决策。利用此潜在无效数据的关键是数据验证。数据可视化提供了一种全新的方式来确定您的数据是否有效。

数据验证的概念并不是什么新鲜事物-大多数公司已经相信他们正在以一种或另一种形式进行数据验证。不管他们采用部分记录放弃,离群值的交叉引用还是两者的某种组合,都在对数据进行筛选以查找可能的不规则性。但是,要真正查看数据是否已通过验证,需要一种更好的方法来查看数据集的潜在问题。

有缺陷的数据从何而来?

数据集中最常见的缺陷是缺少数据,通常是部分记录的形式。这可能是个大问题-尤其是当从多个组合数据中得出推断时。

但是,数据丢失只是更大问题的征兆。通常,数据差距来自 应答疲劳 –人们厌倦了任务后便会放弃调查。更令人担忧的是,受访者倾向于匆忙完成一项调查并提供不正确的数据,只是他们可以完成调查。

虽然可以使用以下方式找到并删除此错误数据: 传统统计分析,此过程为:

  • 昂贵的
  • 费力的
  • 仍然不是100%有效

通过数据可视化识别并防止数据中的空白

可以通过可视化来识别数据中的问题区域,该可视化旨在突出显示来自不完整数据的“瑞士奶酪”效应。这种用于数据验证的可视化实现是一种重要但基本的观看数据方式。

数据可视化真正发挥作用的地方在于帮助创建尽可能简化的数据收集过程。仅收集决策所需的实际信息。

通过数据可视化了解什么数据是必需的

许多项目将数据可视化作为流程的最后步骤之一。他们从专注于收集数据开始,特别是收集他们认为必要的所有数据。

这是个错误。

相反,应该从一开始就计划可视化。通过在设计和计划项目时经历数据可视化过程,公司可以看到如何合并他们收集的数据。此收益来自流程的两个不同方面:

  • 项目计划 –在项目计划阶段,一家优秀的数据可视化公司将分析数据本身(或计划的数据,如果尚未收集的话)。这项分析与对可视化目标的理解相结合,将使该机构能够显示哪些数据是相关的,哪些数据无关。
  • 基本的初步可视化 –项目设计和规划的早期阶段应涉及创建初步的可视化。这些将显示收集到的数据在说什么,并使趋势和异常值易于查看。 初步的可视化通常是发现数据收集过程中以前未发现的缺陷的工具。

数据可视化在收集有效数据中起着关键作用。最初,可视化计划过程会准确地突出显示应收集哪些数据,并允许创建简化的收集过程(从而减少响应者的疲劳)。然后,单独的可视化可以显示出现数据空白的地方,并且,如有必要,可以对收集过程进行调整。中间流程的更改而不是在原始过程完成后重新收集,而是节省了大量的成本和时间(更不用说成功的项目了)。

如果您的数据验证过程不正确’尽可能主动,或者如果您看到大量数据无效, 与Boost Labs联系,以了解有关可视化如何帮助您的更多信息.

最近贴文

在脸书上分享
分享到Twitter
在linkedin上分享