如何让你的图表“既能用又好看”?
共 2386字,需浏览 5分钟
·
2021-03-29 19:56
和你一起学习大数据,这里是大数据科学
俗话说,细节决定成败。在数据图表的制作中,此话尤其应验。图表的制作,首先是逻辑清晰,即要表达的主题明确,且图表中的信息是按一定的逻辑关系进行组合的。其次是精确传达信息,即保证图表中数值的准确度,并保证展示的精度。接着是调整展示的细节,让图表从“能用”向“既能用又好看”过度。通过学习本文的内容,希望能帮助大家把图表做得“既能用又好看”。
图表背景和绘图区背景
从埃森哲、尼尔森、波士顿咨询等咨询公司的报告中可以发现他们对图表的背景有所处理,而不单单只是白色。图表背景的加工,有助于视觉信息的传达。
如图1所示为笔者初入职场时采用的图表风格。当时使用的是Excel 2003或者Excel 2007。这样的作图方式得到了领导的赏识,因为这显然不是Excel的默认格式,是用心设置了一些细节后才会出现的效果。
图2 设置文本框的背景填充
对于绘图区背景色,设置也非常简单,鼠标右键单击绘图区,单击“设置绘图区格式”选项,然后在右侧弹出的设置面板中选择填充色,如图3所示。
图4 设置绘图区水印
设计图表背景是一件有趣的事情,有点像画画,每个人都可以将自己的情绪表达出来。以笔者的经验,如果业务进展顺利,大家心情都很愉悦,而且研究报告的内容是向好的,那么采用清凉明快的图表背景比较合适;如果业务进展遇到了一些问题,需要大家严肃对待,认真仔细地思考,那么厚重的色彩会在情绪上形成有效的引导。如图5和图6所示,笔者走了两个极端,一个是白底,一个是黑底,同样的数据,相信给人的感知是不一样的。黑红蓝配色让人觉得紧张,黄绿白配色让人觉得轻松。
需要提醒读者,如果没有十足的把握,不要随意调整背景颜色。实际上,现在笔者也很少在图表背景上动脑筋,毕竟不是设计师,已不愿承受为了美观而不断修改的痛楚。因此,笔者的图表都采用不会犯错的白色背景。
图6 厚重的图表背景
如果读者非常想让自己的图表多姿多彩却又不使配色俗气丑陋,笔者有一个偏方,那就是先下载一个取色软件,然后搜索一些世界绘画名家的作品,用取色器取出这些作品中的色彩(RGB色彩编码),最后在Excel的填充选项的“自定义颜色”中应用这些色彩,如图7所示。
图8 坐标轴设置
在“坐标轴选项”这个板块中,我们对最大值和最小值的操作非常频繁。如果每次作图都不细心设置,就不能称为一个合格的数据分析师。这里的最大值和最小值决定了坐标轴可丈量的数据范围。
图9中的两幅图实际上是相同的指标,只是因为坐标轴选项里的最大值和最小值设置的区别导致了完全不同的观感。根据上面的图反映出的活跃率,我们得出的信息非常有限,仅仅是活跃率维持在88%左右,没有波动;而下方的图得出的结论与此完全不同,不仅活跃率波动剧烈,而且经历过一波爬升和震荡后,开始有了上升的势头。那么,哪幅图是正确的呢?
图10 隐藏纵坐标轴
灵活使用辅助线
在这部分我们将较详细地讨论辅助线的应用。笔者将辅助线大致分为三类。
(1)趋势线,即帮助你判断数据变动趋势的辅助线。
(2)信息增强线,即能够突出数值间隐藏信息的辅助线,如涨跌线、垂直线和误差线等。
(3)标注线,即将某些外部信息或抽象信息标注进图表中的辅助线,如均值线、置信区间等。
我们从趋势线开始讲起。所谓趋势,即反映了某种演进关系,最典型的就是时间序列。在时间序列的折线图中,笔者往往会添加趋势线,即使最终趋势线没有在图表中呈现,也会在作图时添加,用来帮助自己判断趋势。
能选择的趋势线有指数、线性、多项式、幂、移动平均、对数一共6项,如图11所示。在日常工作中,用得最多的应该是线性和移动平均两项。我们针对这两种趋势线详细说明它们的使用场景。
图12 设置线性趋势线的公式和R平方
如图13所示,公式显示y=984.98x+561944,x即活跃率,y即活跃用户数,这是否意味着活跃率变化1个单位,活跃用户数就能变化985个单位呢?如果单看这个回归公式,答案是肯定的。但为了避免犯低级错误,做回归时一定要看R平方值是否足够大。一般情况下,只有在R平方值大于0.6时,才认为这个回归公式是有意义的。R平方值代表了回归公式对现实数据的可解释度。在本例中,R平方值是0.0184,也就是说,这两组数据间的关系只有1.8%的信息可由该回归公式解释。
图14 线性预测趋势线
应用移动平均趋势线做时间序列的预测
类似预测趋势变化这样的需求在实际业务中非常常见。如图15所示,我们经常用移动平均趋势估计未来。
图16 移动平均趋势线
添加信息增强线
我们以涨跌柱线为例来说明信息增强线的作用。涨跌柱线的制作过程并不复杂,在“图表工具”中单击“添加图表元素”选项,然后选择“涨/跌柱线”选项即可,如图17所示。它的应用前提是“图表中的两个指标必须能计算差值,且这个差值是有现实意义的”。如本例中,川术公司的月度销售目标和实际销售额,它们的差值就有实际意义。
用两种颜色分别表示涨和跌,如图18所示。涨跌柱一旦使用,图表的观察者会将注意力集中在涨跌上,基于这个属性,作图时要谨慎思考,是两个指标之间的差值重要,还是两个指标自身的数值更重要。笔者在实际业务中很少使用涨跌柱线,除非需要“讲故事”,要尤其突出“涨”或者尤其突出“跌”。这是一个加工数据的技巧。
图18 涨跌柱线的应用
——本文选自《数据化运营速成手册》,由电子工业出版社投稿至数据分析网并经编辑发布。
请点击【点赞】【在看】↓↓