知网查重论文样例--数据可视化概述
1 数据可视化定义
数据可视化(Data Visualization)技术是指运用计算机图形学和图像处理技术,将数据或知识转换为图形或图像在屏幕上显示出来,并直观地与用户进行交互处理的理论、方法和技术[20]。它涉及计算机图形学、计算机图像处理技术、计算机CAD 技术、计算机视觉和人机交互技术等多个领域。
数据可视化技术扩展了传统的文字表述和图表功能,使用户对数据的理解更加直观,交互性也更强。它还应用于数据挖掘的全过程,比如数据源的选择、数据的预处理、数据的挖掘以及数据的分析与评估等。首先,在数据源的选择上,可以用可视化的方式选择出要被分析的数据源,数据部分也可以以特定形式显示出来,让用户有一个明确的目标,便于模型和结果的预测与确定;然后,在数据预处理的过程中利用数据可视化分析来帮助用户作出判断和筛选;而后,在数据挖掘阶段进行可视化处理,比如将过程一步步展示出来,类似于动画一般,这样既有助于用户对过程的直观了解,也可对数据本身作直观的认识;最后,对结果分析与评估过程的可视化可直接将挖掘出的规律知识直观地呈现给用户,让用户能直观清晰地获得所感兴趣的知识,并且能正确验证要分析的目标[19]。
2 数据可视化形式
图像是表达知识的一种非常直观的方式,相较于文字和声音而言,它所蕴含的信息量更大,表达的信息也更直观。常用的数据可视化形式有以下三种。
1)条形图。适用于二维数据集,但只可以对一个维度进行比较。横轴一般用来表示时间趋势,如果不是用来表示时间可以用不同的颜色来区分。利用每个长方形的高度来反应数据之间的差异,人眼对高度的差异变化比较敏感,辨识的效果较好。
2)折线图。适合于二个维度的大数据集,当需要了解某一维度的变化趋势而不是某个单点时,折线图能很好地展现。
3)饼状图。显示的数据清晰,可以很容易地显示魅族数据相对于总数的大小,而且每组数据所占大小的比例可以一目了然。