你不得不知的数据可视化的前世今生,看这一篇就够了(二)!

发布日期:2022-04-20 14:05浏览次数:

二、什么是数据可视化

 

发展历程

 

利用人眼的感知能力将数据交互可视化以增强认知能力的技术称为可视化,它将看不见或难以分析的数据转化为可感知的图形、符号、颜色、纹理等,以提高数据识别和信息传递的效率。

 

0411-10.png

我们拿到的原始数据,可能是半结构化,甚至非结构化的,经过数据清洗和ETL过程,我们得到规整的结构化数据表,再通过视觉映射,我们得到需要展示的视觉结构,即按照什么维度,展示什么指标,Z后,将视觉结构通过图像转换,转化为Z终的可视化图像,呈现给决策者。

 

我们可以将数据可视化的发展历程分为七个历程。

  

17世纪之前——图表萌芽

 

人类早在公元前6200年就掌握了观测和绘制的能力,此后也一直通过手工的方式制作可视化作品。可视化萌芽出自地图和一些简单的图表,数据也不是测量而来,目的大多是展示一些重要的信息。

 

0411-11.png

人类第 一幅地图(公元前6200年)

 

公元950年,欧洲人画出了基于时间变化的折线图,用于展示太阳,月亮等行星的位置变化趋势,开始出现如今的数据图表的雏形。

 

0411-12.jpg

  

17世纪——物理测量

  

17世纪以后,随着对物理基本量(时间、距离等)的测量理论和设备的完善,制图学理论也随着分析几何、概率论等学科迅速发展,17世纪末产生了基于真实测量数据的可视化作品。

 

0411-13.jpg

人类第 一幅天气图(1686年)

 

这幅图是谁画的呢?Edmond Halley1656-1742),埃德蒙·哈雷,是不是挺耳熟,没错,就是发现哈雷彗星的那个哈雷。

 

0411-14.png

图上绘制了信风和季风的方向,“一目了然地显示了这些风的所有不同地段和路线;据此,有可能比任何口头描述都更容易理解”。[1].

 

18世纪——图形符号

 

18世纪,人类不再满足于地图上的几何信息,随着统计理论、实验数据分析等的发展,我们现在所熟悉的函数图和抽象图图被广泛地发明出来。

 

0411-15.jpg

丹麦和挪威的进出口贸易时间序列

 

此图来自威廉·普莱费尔(WilliamPlayfair1759-1823),他是来自苏格兰的工程师和政治经济学家,发明了我们今天使用的折线图、条形图、饼形图和面积图。在图中,红线是出口额价值,黄线是进口额,从两条曲线可以清楚地看出,1754年以前,出口额价值低于进口额,之后出口价值超过进口价值。

 

19世纪——数据图形

 

19世纪,统计图、概念图等迅猛爆发,此时人们已经掌握了众多统计数据可视化工具,包括柱状图、饼图、折线图、时间线、轮廓线等。政府规划和运营也越来越多的采用可视化方法,19世纪下半叶,迎来了数据可视化的黄金时期。这个时期的数据可视化代表作,除了上文中提到的“霍乱地图”,还有下面这张拿破仑东征流图。

 

0411-16.png

18121813对俄战争中法军人力持续损失示意图(1869年,被誉为史上Z佳可视化)

 

这张图的信息量J大,是1969年法国工程师Charles Joseph Minard制作的,描绘了拿破仑1812年率军攻占莫斯科的行军图。

 

下面是一张地图,深黄色代表行军的规模,黑色代表撤退的规模,线条宽度代表军队的人数规模,显示了从行军开始的42w军队,行军的规模逐渐缩小,撤军规模不断增加,直到他们到达莫斯科时只剩下1w。当然,线路移动也是行军/撤军路线。

 

同时,底部既有横向的时间轴,也有纵向的刻度标识了当时的气温。

 

这是拿破仑40万大军被长途跋涉和寒冷的冬天消耗殆尽的生动写照,也被称为拿破仑兴衰的转折点。同时,还有南丁格尔玫瑰图:

 

0411-17.jpg

南丁格尔玫瑰图

 

没错,就是那位护士弗罗伦斯·南丁格尔(Florence Nightingale),护理学的奠基人。

 

0411-18.png

Florence Nightingale

 

她的另一个身份是统计学家。“南丁格尔玫瑰图”直观展示了卫生条件对死亡人数的影响,因而争取到了更好的医疗条件。

 

20世纪——多维数据

 

进入20世纪,数据可视化的黄金时期终结,主要是因为随着数理统计的诞生,对数理统计的数学基础的追求成为数据科学行业的首要目标,图形和可视化作为辅助手段并没有得到足够的重视,多维数据可视化是这一时期数据可视化的一个重要特征。

 

0411-19.png

1904年关于太阳黑子随时间扰动的蝴蝶图验证了太阳黑子的周期性

 

1970s-21世纪——交互可视化

 

随着计算机的发明和应用,人们开始使用计算机编程来完成可视化的过程。70以后,随着人机交互界面和图形显示设备的普及,人们获得了将更复杂、更高维数据可视化的能力。

 

0411-20.png

谷歌人体浏览器

 

80末以来,Windows系统的出现使人们能够直接与信息进行交互,并大大提高了对可视化的需求。与此同时,随着高维数据和高性能计算的日益普及,人们对多维、时变、非结构化数据的数据表示和分析的需求越来越强烈,可交互可视化产品开始进入历史书籍。

 

2004至今——可视分析学

 

0411-21.png

大数据公司Palantir为美军分析的亚丁湾海盗概率热点图

 

21世纪,人们对现有的可视化技术对数据的表示和表现不满意,他们开始将可视化与数据挖掘和图形学技术结合起来,帮助用户从大尺度、复杂、矛盾甚至不完整的数据中快速提取有用的信息,从而做出有效的决策,这个学科称为可视分析学。

 

主流呈现形式

 

软件生成分析图

 

ExcelPythonMatlabSAS数据分析软件通常都有自己数据可视化包或工具,可以让科研人员或技术人员对数据进行初步可视化,继续深入分析和挖掘,维度相对简单,视觉要求低,适合技术人员进行初步分析或学者发表的研究论文。

 

下图是针对16年美国大选选民学历的可视化分析,未接受高等教育的白人比例越大(相比4年前),Trump的胜算越大,而这个比例在男性中更为明显。

 

0411-22.png

 

信息图

 

根据清洗后的数据,设计师对其含义进行了充分的分析,并采用illustratorcoreldraw等平面设计软件进行手动加工,添加注解信息。数据可读性趣味性,但相对不准确,通常出现在媒体资讯或公司行业报告中“一图看懂XXXX”。

 

0411-23.jpg

 

可交互的HTML网页(BI系统)

 


高维数据可以通过HTML5JS等技术进行动态交互显示,没有技术背景的普通用户也可以对感兴趣的数据进行选择和挖掘。商业智能通常由多个网页组成,但近年来,商业智能也被媒体广泛用于展示热点数据。


以上文章由eHR,人事管理系统,人力资源管理系统为您提供,详情点击我们的网站:http://www.hrsscc.cn

本站访客:50