一天入门Tableau详细教程(上)
作者:Roar
来源:知乎专栏 | https://zhuanlan.zhihu.com/p/71502618
看到标题,可能有的同学会说不是可以敲代码得到相应的可视化图形的吗?为什么还要用Tableau这种专业的数据分析软件呢?
那么我觉得得先认识一下什么是Tableau?
在开始学习之前,我想先做一个思维导图来说明学习Tableau的顺序,以及想通过这篇文做到什么。得到什么。
1
简单的认识Tableau
我觉得学习任何一个软件?可以称Tableau为软件对吧,都会先对界面有一个基本的认识。
我使用的10.5版的Tableau,我不知道最新版本有没有什么特别好用的功能的增加。
我也不免俗,先介绍一下主界面:
Tableau的开始页面
可以看到开始界面包含3个部分:连接,打开,探索。
首先介绍连接:连接可以直接连接文件:图中也有很多的可以连接的文件类型,这就是Tableau好用的地方,可以直接连接Excel,文本,JSON,Access数据库,PDF,空间文件
紧接着还可以连接到服务器,这个就更强大了,基本可以和目前市面上流行的服务器都能连接起来
这个是可以连接的服务器
现在主流的数据库:
MySQL
Oracle
Hadoop
MongoDB
这些数据库都可以连接。
认识了连接以后,再来看一下打开,打开点击以后
可以看到打开工作簿直接转到了可以使用的工作簿,也就是之前保存的Tableau文件。
而最后一个探索,则是这个软件的良心的地方,有很最基础的入门视频,手把手教你入门。当然少不了软件的更新,以及一些广告。
下面我们看一下下一个界面,数据源界面
这里我们连接一个数据(超市数据集),来更好地说明。可以看到上面通常分为3个主要区域,左侧窗格,画布和网格。
左侧窗格:显示连接的数据库,服务器,和数据库中的表
画布:这里可以连接一个或者多个数据集
网格: 可以查看数据源中的字段,和前1000行的数据。还可以对数据源做一般的修改,如排序,隐藏字段,创建字段,以及设置别名等
工作簿界面:
实际操作最多的界面
我们来看一下这个界面都有些什么呢?
首先可以看到左侧有一个维度和度量区域。
那么维度和度量分别代表什么意思呢?
维度:在初次连接数据源的时候Tableau自动将包含离散分类信息的信息字段分配给维度,比如字符串和日期,当然维度也是可以转换为度量的
度量:Tableau会把包含定量数值的信息的字段分配给度量
由于这个界面是以后经常用的界面,所以一些后续的一些介绍,我会在最后一步实际操作中予以介绍。
好的,到这里就把Tableau的基本界面介绍完了,下面进行第二步。
2
Tableau支持的数据类型
Tableau支持字符串,日期/日期时间,数字和布尔数据类型。
这里就以刚刚的数据集为例,这里标中的Abc代表的是文本值。
上图中标记的类似于日历的图标就是日期,
而这个图形中的类似于#代表的是数字值。
还有一种这个图里没有T|F这个就是常用的布尔值(仅限于关系数据源)
而上面的这个地球图表代表的是地理值(用于地图)
而如果要更改数据类型就是上面的几个操作,把数据类型改一下就好。
3
运算符及优先级
Tableau支持的运算符有:算术运算符,逻辑运算符,比较运算符
算术运算符
+(加法):用于数字表示数字相加,用于字符串表示串联,用于日期,可以将天数和日期相加。比如:'abc'+'def'='abcdef',#April 15,2004#+15=#April 30,2004#
- (减法):同样的,用于数字表示相减,用于表达式时表示求反,用于日期,可以用于从日期中减去天数
*(乘法):用于数字表示乘法,例如,5*4=20
/(除法):用于数字表示除法,例如 20/4=5
%(取余):此运算符算数字余数,5%4=1
^(乘方):此符号等同于POWER函数,用于计算数字的指定次幂,比如 6^3=216
逻辑运算符
AND:逻辑运算且,两侧必须使用表达式或布尔值
OR:逻辑运算或,两侧必须使用表达式或布尔值
NOT:逻辑运算否,此运算符可用于对另一个布尔值或表达式取反
比较运算符
Tableau有很丰富的比较运算符,有==或=,>,<,>=,<=,!=等用来比较两个数字、日期、或者字符串。(ps:这个难道不是每一个编程语言里面都有的)
优先级问题
运算符优先级图形实例