Tableauのヒストグラム作り方。適切なビンサイズで導くデータの傾向

Tableau

作るのは簡単だけど、実は使いこなすのが難しい!? Tableauヒストグラムの作り方をご紹介します。

スポンサーリンク

度数分布表とヒストグラム

ヒストグラムは度数分布表を棒グラフで表現したものです。一般的には、ばらつきのあるデータからデータの傾向を導き出すために使います。

度数分布表とは、ある集団のデータ(観測値)をいくつかの階級に分け、それぞれの階級でデータがいくつあったか(度数)を数え、表にしたもの。

品質管理のフレームワークとして有名な「QC7つの道具」の一つでもあります。

アンナ
アンナ

少し難しいわね

アレコレメモ
アレコレメモ

例えば、あるテストの点数結果があるとする。

番号氏名氏名(カタカナ)性別テスト点数
1新井 信幸アライ ノブユキ81
2塚本 優依ツカモト ユイ72
3石崎 賢治イシザキ ケンジ52
4新田 信彦ニッタ ノブヒコ44
5北野 正司キタノ マサシ75
6田辺 勝久タナベ カツヒサ65
7高見 冨士子タカミ フジコ56
8川端 昌二カワバタ ショウジ77
9有田 義夫アリタ ヨシオ50
10首藤 涼シュドウ リョウ65
11高木 清作タカギ セイサク53
12増田 正之マスダ マサユキ85
13木本 遥香キモト ハルカ59
14金城 正勝カナシロ マサカツ69
15川端 来未カワバタ クルミ66
16木原 紅葉キハラ クレハ79
17楠 瑞希クスノキ ミズキ100
18森脇 咲雪菜モリワキ サユナ30
19喜多 早百合キタ サユリ67
20菅原 玲子スガハラ レイコ61

個人データはダミーです。

アレコレメモ
アレコレメモ

このデータだけをみたときにテスト点数の傾向ってちょっとわかりづらいよね。だから、点数の幅と人数で表にまとめます。

アンナ
アンナ

有田さん、森脇さん、落第ね

階級値階級度数
200-401
4641-502
5651-604
6661-706
7671-804
8681-902
9691-1001

この表が「度数分布表」と呼ばれます。

度数分布表の要素
  • 階級:点数にあたる部分
  • 階級値:「階級」の中間値
  • 度数:人数にあたる部分

横軸に「度数」、縦軸に「階級」をとって度数分布表に長方形を敷き詰めたものがヒストグラムと呼ばれるものです。

Tableauで作るヒストグラム(ヒストグラムの例 - 一般型)

ヒストグラムが得意・苦手なこと

得意なこと
  • ばらつきのあるデータから傾向をざっと把握できる
  • 異常な値を見つけることができる
苦手なこと
  • 個々のデータはわからなくなる

どんな時にヒストグラムが役立つか

人口ピラミッド

よく見る人口ピラミッド。年齢と人数、男女を掛け合わせてどの世代でどのくらいの人口があるか傾向がつかめます。

Tableauで作るヒストグラム(人口ピラミッド)

上記は日本の人口を描画したもの、途中から二つの大きな山でベビーブームがあったことがわかります。

Tableauで作る人口ピラミッドについては、以前記事投稿しています。

機能的には「ビン」を使ったヒストグラムではなく、棒グラフと二重軸で描画しています。グラフの用途としてはヒストグラムになっているので例として使いました

サービスを使う年齢を知る

同じ年齢ネタになりますけど、Googleアナリティクスではウェブを閲覧している人の年齢がざっくりわかります。

Tableauで作るヒストグラム(Googleアナリティクスで見られる年齢ヒストグラム)

グラフから20代30代の閲覧が多いことがわかります。企業であれば、商品・サービスの年齢傾向を導きだすのにヒストグラムが有効となることがわかりますよね。

よくあるヒストグラムのパターン

型の説明は、一般的に品質管理で用いられている内容です。分析対象のデータによって捉え方は多少変わる可能性があります。

一般型Tableauで作るヒストグラム(一般型)工程は安定していると考えられる
ふた山型Tableauで作るヒストグラム(ふたやま型)二つの工程、異なる要因が含まれている場合などに現れる
歯抜け型Tableauで作るヒストグラム(歯抜け型)データ数が少ない、ビンの幅指定が適切でないことが考えられる。
右(左)すそ引き型Tableauで作るヒストグラム(右すそ引き型)片側に制限がある場合に現れる
絶壁型Tableauで作るヒストグラム(絶壁型)選別されている場合に現れる
離れ小島型Tableauで作るヒストグラム(はなれ小島型)突発性がある、測定に間違いがある、工程に異常が発生している場合などに現れる
高原型Tableauで作るヒストグラム(高原型)2種類の基準が含まれている場合に現れる
スポンサーリンク

Tableauのヒストグラム作り方

今回使うデータ

サンプルスーパーストアでもよいのですが、Tableau公式ヘルプと記事が似かよりそうなので別のデータを使います。

コーヒーの売上がまとまったCSVファイルで店舗・メニューごとの売上がまとまっています。

いくつかあるフィールドのうち、メジャーとして使うのは「Total Expenses(総費用)」となります。

基本

まずは単純にヒストグラムを作ります。

ヒストグラムは表示形式を使うと簡単に作れます。メジャーを1個選んで「表示形式」⇒「ヒストグラム」を選択すればOKです。

Tableauで作るヒストグラム(基本)

このヒストグラムを作る操作で「Total Expenses(ビン)」という連続するディメンションが作成されます。

ビンとは

ヒストグラムの階級(区間)です。作った棒グラフひとつひとつの幅がビンになっています。

参考記事 ヒストグラム、奥が深いよ?

Tableauで作るヒストグラム(ビンサイズの編集)

▲ このデータの場合、最小値は$10、最大値は$190となっています。初期状態でビンのサイズは9.5となっており、9.5ドル刻みのディメンションとなっています。

Tableauで作るヒストグラム(ビンサイズの編集)

▲ ビンのサイズは最小値から最大値の間で変更できます。手動で操作した後に「ビンサイズの提案」を押すとTableauが自動計算した推奨値9.5に戻ります。ビンのサイズ指定にはパラメータも使えます(後述)。

Tableauで作るヒストグラム(ビンサイズの編集)

ここではこの後の説明をやりやすくするため、ビンのサイズをキリの良い「10」に変更しておきます。

ラベルを表示してみる

作ったヒストグラムにラベルを表示してみます。

Tableauで作るヒストグラム(ラベルの表示)

▲ 列にあるメジャー「Total Expenses (ビン)」を「マーク」⇒「ラベル」に持っていくとビンのサイズが棒グラフ上に表示されます。グラフの横軸は便のサイズ10刻みになっています。

Tableauで作るヒストグラム(ラベルの表示)

▲ 行にあるメジャー「カウント(Total Expenses)」を「マーク」⇒「ラベル」に持っていくと、ビンのサイズごとの個数が表示されます。

  • $10: 433件
  • $20: 505件
  • $30: 617件
  • $40: 829件
  • $50: 575件 … 続く

ラベルを割合表示にしてみる

Tableauで作るヒストグラム(ラベルの割合表示)

▲ 「カウント(Total Expenses)」を「マーク」⇒「ラベル」に持っていき、そのマークを右クリックして「簡易表計算」⇒「合計に対する割合」を選ぶと表の横軸に沿った割合表示に変わります。これでどのビンサイズがどのくらいの割合で存在するのかわかります。

Tableauで作るヒストグラム(ラベルの割合表示)

▲ ラベルを二つにして割合+件数とかにしておくとさらにわかりやすいかも。

カテゴリで内訳表示や比較表示してみる

ヒストグラムと追加のディメンションを組み合わせてさらに分析することが出来ます。

今回のデータだと次のディメンションが程よい分類数で使いやすいです。

  • Market
  • Market Size
  • Product Line
  • Product Type
  • Type
Tableauで作るヒストグラム(カテゴリの内訳表示や比較表示)

▲ ディメンション「Type」を選び、マーク「色」にドロップします。これで内訳がわかります。

Tableauで作るヒストグラム(カテゴリの内訳表示や比較表示)

▲ もしくはディメンション「Type」を行に持っていき、グラフを複数作るのもいいでしょう。分類ごとで突出したところ、そうでないところが一目でわかります。

リファレンスラインを入れる

平均値を把握するため、リファレンスラインを入れてみます。

Tableauで作るヒストグラム(リファレンスラインで平均を入れる)

▲ 左サイドバー「アナリティクス」から「リファレンスライン」を選び、グラフ上に放り込みます。そのままOKを押すと平均値がわかるリファレンスラインが表示されます。

Tableauで作るヒストグラム(リファレンスラインで平均や中央値を入れる)

▲ 同じ要領で「リファレンスバンド」を使っても良さそうですね。平均値、中央値を一緒に把握できます。

応用

ビンサイズの指定にパラメーターを使う

ビンのサイズ指定にパラメーターが使えます。これによりViz閲覧者の視点でビンサイズを決められます。

Tableauで作るヒストグラム(ビンサイズの指定にパラメーターを使う)

▲ まずはデータにあったパラメーターを作ります。今回は、値の範囲を指定して最小値「10」、最大値「100」、ステップサイズ「10」としました。

Tableauで作るヒストグラム(ビンサイズの指定にパラメーターを使う)

▲ サイドバー上のディメンション「Total Expenses (ビン)」を右クリックして編集、「ビンのサイズ」に作ったパラメーターを指定します。

Tableauで作るヒストグラム(ビンサイズの指定にパラメーターを使う)

▲ これでパラメーター操作でビンサイズが変わります。

累積・累計カウントも組み合わせてみる

最後に、ヒストグラムの棒グラフとその累積構成比がわかるようにパレート図を加えてみます。

Tableauで作るヒストグラム(累積構成比がわかるようにパレート図を加える)

▲ 一旦、マーク上の要素はクリアにしたヒストグラムまで戻します。

Tableauで作るヒストグラム(累積構成比がわかるようにパレート図を加える)

▲ メジャー「Total Expenses」をグラフ右端に持っていき、二重軸グラフを作ります。後から追加した方はグラフタイプを線グラフに変更します。

Tableauで作るヒストグラム(累積構成比がわかるようにパレート図を加える)

▲ 後から加えたメジャーを右クリックして、カウント集計に変更します。

続けて「表計算の追加」を選択して、以下の通り設定します。

Tableauで作るヒストグラム(累積構成比がわかるようにパレート図を加える)
Tableauで作るヒストグラム(累積構成比がわかるようにパレート図を加える)
  • 計算タイプ:累計
  • 次を使用して計算:表(横)
  • セカンダリ計算の追加:チェック
    • 計算タイプ:合計に対する割合
    • 次を使用して計算:表(横)
Tableauで作るヒストグラム(累積構成比がわかるようにパレート図を加える)

▲ 最後にそれぞれのメジャーでラベル表示します。自動配色の色がキツかったので少し柔らかめにしたほうがよいでしょう。

2つのビンを重ねる

Tableau公式にViz添付のナレッジがありました。

参考 オーバーラップするヒストグラムを作成する

まとめ

Tableauを使うとヒストグラム自体はカンタンに作れます。ただ、使いこなすには数学的・統計学的な素養も必要そう感じがします。

アレコレメモ
アレコレメモ

要は文系の私には使いこなせない

アンナ
アンナ

投げやりね、Udemyの動画でも見て出直しなさい