Hello World, Tableau

"The idea is to go from numbers to information to understanding – Hans Rosling."

Posted by Nero on Saturday, August 11, 2018 |  1179 words |  3 minutes
“從數位資料中理解真實世界的運作!”

1. 什麼是 Data Visualization ?

Data Visualization 資料視覺化是以視覺方式呈現數據的一種表示方式,人類對於視覺方式的吸收能力遠大於文字,並以視覺的方式呈現有助於我們對於資料整體上的相對關係與理解更為直覺。

2. 為什麼需要 Data Visualization ?

研究指出大腦對從不同感覺器官輸入的信息有不同的吸收率。一項實驗結果表明,在通常情況下,大腦對視覺輸入的信息吸收率最高,可達83%;對聽覺輸入信息的吸收率為11%;嗅覺可達3.5%;對觸覺和味覺輸入信息的吸收率最低,依序為1.5%和1%。

比起文字與數字與是覺得方式呈現想要表達的的訊息會讓人覺得更為活潑有興趣參與,一個出色的視覺化圖表可以達到以下優點。

  1. 幫助聽眾快速地理解一個抽象的概念
  2. 使報告的內容更為引人入勝
  3. 可以降低資料的維度,凸顯出想表達客戶關注的部分

3. 2018年排名前7的數據可視化工具

資料視覺化已成為現今商業智慧(Business Intelligence, BI)不可或缺的重要技術,以下為 2018 年排名前7的數據可視化工具

  1. Tableau
  2. FusionCharts
  3. Datawrapper
  4. Highcharts
  5. TeamMate Analytics
  6. Sisense
  7. Plotly

4. 什麼是 Tableau ?

人人都是資料分析師,Tableau 是一套將 Data Visualization 的視覺化工具,用戶只需要專注在如何呈現想要說明的故事上,工具有使用過 Excel 的話十分的容易上手,可以拖拉的方式完成 Dashboard ,並有多種視圖包括條型圖、區域圖、、區域圖、餅圖、、區域圖、餅圖、散點圖等,可以選擇。

5. 如何安裝 Tableau ?

可以在官方網站下載,或點擊連結進行下載。

6. 資料分析流程

  1. 暸解你分析的目的是什麼?你希望別人從你給出的分析可以做出怎樣的決策或你能讓別人做出怎樣的決策?
  2. 如何取得資料?資料格式是什麼?資料是否足夠讓人做出決策?
  3. 探索資料從中找出適合解釋問題的特徵
  4. 依照適合的情境與流程建立 model。
  5. 將資料以適合的呈現方式 Visualization ,可以參考這個網站的決策規則。

7. Tableau 操作

7.1 Dimensions(維度)

當連接數據時,Tableau 會將離散類型的屬性(例如:型別是字串或布林)分配到 Dimensions 中,當你從 Dimensions 中拖出一個屬性放入到一個視圖中時,Tableau 都會將它默認為是離散型的,同時為其分配一個藍色的背景。

7.2 Measures(度量)

任何從 Measures 上拖到視圖中的屬性默認都會是連續的,它的背景色也將會是綠色。但是如果你點擊字段並選擇 Discrete ,這些相應的值就會變成表格上方的標題。

7.3 Discrete(離散)

而離散的概念在於不可分割,像是骰子跟教室裡面的學生,在定義上不會出現半點或半個學生,在 Tableau 終會以藍色進行表示。

7.4 Continus(連續)

連續指一個不間段的範圍,在 Tableau 中會以綠色進行表示。

7.5 Columns(直列)

在工作表中橫向,即 X 軸中希望表達表達的表格屬性。

7.6 Row(橫行)

在工作表中直向,即 Y 軸中希望表達表達的表格屬性。

7.7 Marks(標記)

有多個屬性可以添加,如下。

  • Color
  • Size
  • Label
  • Detail
  • Tooltip

8. 參考資料


comments powered by Disqus