作るのは簡単だけど、実は使いこなすのが難しい!? Tableauヒストグラムの作り方をご紹介します。
度数分布表とヒストグラム
ヒストグラムは度数分布表を棒グラフで表現したものです。一般的には、ばらつきのあるデータからデータの傾向を導き出すために使います。
度数分布表とは、ある集団のデータ(観測値)をいくつかの階級に分け、それぞれの階級でデータがいくつあったか(度数)を数え、表にしたもの。
品質管理のフレームワークとして有名な「QC7つの道具」の一つでもあります。

少し難しいわね

例えば、あるテストの点数結果があるとする。
番号 | 氏名 | 氏名(カタカナ) | 性別 | テスト点数 |
---|---|---|---|---|
1 | 新井 信幸 | アライ ノブユキ | 男 | 81 |
2 | 塚本 優依 | ツカモト ユイ | 女 | 72 |
3 | 石崎 賢治 | イシザキ ケンジ | 男 | 52 |
4 | 新田 信彦 | ニッタ ノブヒコ | 男 | 44 |
5 | 北野 正司 | キタノ マサシ | 男 | 75 |
6 | 田辺 勝久 | タナベ カツヒサ | 男 | 65 |
7 | 高見 冨士子 | タカミ フジコ | 女 | 56 |
8 | 川端 昌二 | カワバタ ショウジ | 男 | 77 |
9 | 有田 義夫 | アリタ ヨシオ | 男 | 50 |
10 | 首藤 涼 | シュドウ リョウ | 女 | 65 |
11 | 高木 清作 | タカギ セイサク | 男 | 53 |
12 | 増田 正之 | マスダ マサユキ | 男 | 85 |
13 | 木本 遥香 | キモト ハルカ | 女 | 59 |
14 | 金城 正勝 | カナシロ マサカツ | 男 | 69 |
15 | 川端 来未 | カワバタ クルミ | 女 | 66 |
16 | 木原 紅葉 | キハラ クレハ | 女 | 79 |
17 | 楠 瑞希 | クスノキ ミズキ | 女 | 100 |
18 | 森脇 咲雪菜 | モリワキ サユナ | 女 | 30 |
19 | 喜多 早百合 | キタ サユリ | 女 | 67 |
20 | 菅原 玲子 | スガハラ レイコ | 女 | 61 |
※個人データはダミーです。

このデータだけをみたときにテスト点数の傾向ってちょっとわかりづらいよね。だから、点数の幅と人数で表にまとめます。

有田さん、森脇さん、落第ね
階級値 | 階級 | 度数 |
---|---|---|
20 | 0-40 | 1 |
46 | 41-50 | 2 |
56 | 51-60 | 4 |
66 | 61-70 | 6 |
76 | 71-80 | 4 |
86 | 81-90 | 2 |
96 | 91-100 | 1 |
この表が「度数分布表」と呼ばれます。
- 階級:点数にあたる部分
- 階級値:「階級」の中間値
- 度数:人数にあたる部分
横軸に「度数」、縦軸に「階級」をとって度数分布表に長方形を敷き詰めたものがヒストグラムと呼ばれるものです。

ヒストグラムが得意・苦手なこと
- ばらつきのあるデータから傾向をざっと把握できる
- 異常な値を見つけることができる
- 個々のデータはわからなくなる
どんな時にヒストグラムが役立つか
人口ピラミッド
よく見る人口ピラミッド。年齢と人数、男女を掛け合わせてどの世代でどのくらいの人口があるか傾向がつかめます。

上記は日本の人口を描画したもの、途中から二つの大きな山でベビーブームがあったことがわかります。
Tableauで作る人口ピラミッドについては、以前記事投稿しています。
サービスを使う年齢を知る
同じ年齢ネタになりますけど、Googleアナリティクスではウェブを閲覧している人の年齢がざっくりわかります。

グラフから20代30代の閲覧が多いことがわかります。企業であれば、商品・サービスの年齢傾向を導きだすのにヒストグラムが有効となることがわかりますよね。
よくあるヒストグラムのパターン
型の説明は、一般的に品質管理で用いられている内容です。分析対象のデータによって捉え方は多少変わる可能性があります。
一般型 | ![]() | 工程は安定していると考えられる |
---|---|---|
ふた山型 | ![]() | 二つの工程、異なる要因が含まれている場合などに現れる |
歯抜け型 | ![]() | データ数が少ない、ビンの幅指定が適切でないことが考えられる。 |
右(左)すそ引き型 | ![]() | 片側に制限がある場合に現れる |
絶壁型 | ![]() | 選別されている場合に現れる |
離れ小島型 | ![]() | 突発性がある、測定に間違いがある、工程に異常が発生している場合などに現れる |
高原型 | ![]() | 2種類の基準が含まれている場合に現れる |
Tableauのヒストグラム作り方
今回使うデータ
サンプルスーパーストアでもよいのですが、Tableau公式ヘルプと記事が似かよりそうなので別のデータを使います。
コーヒーの売上がまとまったCSVファイルで店舗・メニューごとの売上がまとまっています。
いくつかあるフィールドのうち、メジャーとして使うのは「Total Expenses(総費用)」となります。
基本
まずは単純にヒストグラムを作ります。
ヒストグラムは表示形式を使うと簡単に作れます。メジャーを1個選んで「表示形式」⇒「ヒストグラム」を選択すればOKです。

このヒストグラムを作る操作で「Total Expenses(ビン)」という連続するディメンションが作成されます。
ヒストグラムの階級(区間)です。作った棒グラフひとつひとつの幅がビンになっています。
参考記事 ヒストグラム、奥が深いよ?

▲ このデータの場合、最小値は$10、最大値は$190となっています。初期状態でビンのサイズは9.5となっており、9.5ドル刻みのディメンションとなっています。

▲ ビンのサイズは最小値から最大値の間で変更できます。手動で操作した後に「ビンサイズの提案」を押すとTableauが自動計算した推奨値9.5に戻ります。ビンのサイズ指定にはパラメータも使えます(後述)。

ここではこの後の説明をやりやすくするため、ビンのサイズをキリの良い「10」に変更しておきます。
ラベルを表示してみる
作ったヒストグラムにラベルを表示してみます。

▲ 列にあるメジャー「Total Expenses (ビン)」を「マーク」⇒「ラベル」に持っていくとビンのサイズが棒グラフ上に表示されます。グラフの横軸は便のサイズ10刻みになっています。

▲ 行にあるメジャー「カウント(Total Expenses)」を「マーク」⇒「ラベル」に持っていくと、ビンのサイズごとの個数が表示されます。
- $10: 433件
- $20: 505件
- $30: 617件
- $40: 829件
- $50: 575件 … 続く
ラベルを割合表示にしてみる

▲ 「カウント(Total Expenses)」を「マーク」⇒「ラベル」に持っていき、そのマークを右クリックして「簡易表計算」⇒「合計に対する割合」を選ぶと表の横軸に沿った割合表示に変わります。これでどのビンサイズがどのくらいの割合で存在するのかわかります。

▲ ラベルを二つにして割合+件数とかにしておくとさらにわかりやすいかも。
カテゴリで内訳表示や比較表示してみる
ヒストグラムと追加のディメンションを組み合わせてさらに分析することが出来ます。
今回のデータだと次のディメンションが程よい分類数で使いやすいです。
- Market
- Market Size
- Product Line
- Product Type
- Type

▲ ディメンション「Type」を選び、マーク「色」にドロップします。これで内訳がわかります。

▲ もしくはディメンション「Type」を行に持っていき、グラフを複数作るのもいいでしょう。分類ごとで突出したところ、そうでないところが一目でわかります。
リファレンスラインを入れる
平均値を把握するため、リファレンスラインを入れてみます。

▲ 左サイドバー「アナリティクス」から「リファレンスライン」を選び、グラフ上に放り込みます。そのままOKを押すと平均値がわかるリファレンスラインが表示されます。

▲ 同じ要領で「リファレンスバンド」を使っても良さそうですね。平均値、中央値を一緒に把握できます。
応用
ビンサイズの指定にパラメーターを使う
ビンのサイズ指定にパラメーターが使えます。これによりViz閲覧者の視点でビンサイズを決められます。

▲ まずはデータにあったパラメーターを作ります。今回は、値の範囲を指定して最小値「10」、最大値「100」、ステップサイズ「10」としました。

▲ サイドバー上のディメンション「Total Expenses (ビン)」を右クリックして編集、「ビンのサイズ」に作ったパラメーターを指定します。

▲ これでパラメーター操作でビンサイズが変わります。
累積・累計カウントも組み合わせてみる
最後に、ヒストグラムの棒グラフとその累積構成比がわかるようにパレート図を加えてみます。

▲ 一旦、マーク上の要素はクリアにしたヒストグラムまで戻します。

▲ メジャー「Total Expenses」をグラフ右端に持っていき、二重軸グラフを作ります。後から追加した方はグラフタイプを線グラフに変更します。

▲ 後から加えたメジャーを右クリックして、カウント集計に変更します。
続けて「表計算の追加」を選択して、以下の通り設定します。


- 計算タイプ:累計
- 次を使用して計算:表(横)
- セカンダリ計算の追加:チェック
- 計算タイプ:合計に対する割合
- 次を使用して計算:表(横)

▲ 最後にそれぞれのメジャーでラベル表示します。自動配色の色がキツかったので少し柔らかめにしたほうがよいでしょう。
2つのビンを重ねる
Tableau公式にViz添付のナレッジがありました。
まとめ
Tableauを使うとヒストグラム自体はカンタンに作れます。ただ、使いこなすには数学的・統計学的な素養も必要そう感じがします。

要は文系の私には使いこなせない

投げやりね、Udemyの動画でも見て出直しなさい