【初歩的な使い方】Tableau Prepの有効性がわかるようにハンズオン♪

【初歩的な使い方】Tableau Prepの有効性がわかるようにハンズオン♪ Tableau

データのクレンジング、クリーニング処理してますか?

複雑なデータを整形するために、自分しか読めない計算フィールド作っていませんか?

少し前に、Tableau Prepの紹介記事を投稿しているのですが、アクセス傾向や流入キーワードを見ていると、ようやく導入に入る企業、検討中の企業が多いのが読み取れます。

Tableau Prepって何がよいの?デスクトップとの違いは何さ。

恐らくそんな感じの方が多そうな気がします。代理店購入とかだと営業から「フワっと」した表現の説明ばかりで一体全体、Prepの何がよいのか伝わってきません。

代理店<br>営業
代理店
営業

クレンジングされます、データが綺麗になります(棒読み

アンナ
アンナ

ほう… (つかったことないくせに)

ということで実例を出してハンズオン形式でデータをきれいにしてみようと思います。簡単なお題ですが、デスクトップ利用者であれば大まかな使い方は把握できるのではないかと。

参考 ゼロからの Tableau Prep 入門icon

参考 Tableau Prep for Business Intelligenceicon

スポンサーリンク

Tableau Prepの初歩的な使い方がわかるようにハンズオンしてみる

お題として、国際連合(国連)で出している人口統計データを使ってみます。

Tableau Prepでデータ準備にするのはなんと国連データ

前提条件

この記事はベーシックな内容で投稿します。

Tableau Desktopをまったく使ったことない方向けの書き方はせず、デスクトップを多少なりとも使っていてこれからPrepも使おうか、という方に向けた記事となります。Tableauを使ったことがある人が知っているような概念的な説明は割愛します。

初心者が理解できるように包括的に説明されているコンテンツは動画でUdemyから出ています。興味のある方は活用してみるとよいと思います。

詳細はこちら 買い切り・繰り返し見れるTableau Prep入門動画icon

テストデータと完成系

国連の人口データはたくさんのエクセルが出ています。そのうち、今回は3つのファイルをデータソースとして使い、Prepで一つの表にまとめます。

元がエクセルのデータ

下記のページにデータがあります。

以下の3つのエクセルファイルをデータソースとします。サイトにファイルはありますが、この後の画像と合わせるため、当ブログ内にファイルを格納しています。

今回使うデータはこちら
Tableau Prepでデータ準備にするのはなんと国連データ

▲ データを開くとたくさんのシートがあります。それぞれのファイルで使うシートは「ESTIMATES」「MEDIUM VARIANT」の2つです。

前者が過去の人口、後者は予測で中位値です。人口統計では高位、中位、低位などでの予測があるようですが、よく使われるのは中位値のようです。

完成系

3つのファイルは総人口、男性人口、女性人口がわかれているのでこれを一緒にします。国でフィルターすると国別の人口がわかるようになります。

出来上がるディメンションとメジャー
  • ディメンション
    • 国名
  • メジャー
    • 国コード
    • 総人口
    • 女性人口
    • 男性人口

ハンズオンで行う主な操作

高度なことはしません。

クリーニング処理の効果がどの程度かイメージしていただければと思います。同じことをデスクトップでやろうとすれば手間が発生するのは伝わると思います。

この記事で行う主な操作
  • データへの接続(エクセル)
  • 列名を都合よく変更
  • ステップの操作
  • ピボット
  • ユニオン
  • 結合
  • 出力
スポンサーリンク

それではハンズオン(初歩的な使い方編)

作業の流れ
  • ステップ1
    データに接続する

    Tableau Prepからエクセルファイルを開きます。

  • ステップ2
    最初のステップ処理を行う

    まずはざっと俯瞰して使い道のないフィールドを消し去る。

  • ステップ3
    ピボット処理を行う

    横持ち→縦持ち切り替え。

  • ステップ4
    再びステップ処理を行う

    大きな変化を加えたときはステップ追加で俯瞰する。

  • ステップ5
    ユニオン処理を行う

    同じデータ構造のデータを継ぎ足す処理です。

  • ステップ6
    結合処理を行う

    キーを合わせて結合です。

  • ステップ7
    Tableau Desktopでプレビューする

    同じ端末にDesktopがあればプレビューできちゃう。

  • ステップ8
    ハイパー形式で出力する

    時代はハイパーだそうです。

ステップ1~4の処理は「Total Population – Both Sexes」のエクセルファイルで説明します。「Total Population – Male」「Total Population – Female」エクセルファイルも列名称が多少異なりますが、やることは同じです。

ステップ1: データに接続する

Tableau Prep 初歩的な使い方(エクセルを選択して対象のシートを読み込む)
エクセルを選択して対象のシートを読み込む

Tableau Prepより「Total Population – Both Sexes.xlsx」を開きます。シートは「ESTIMATE」を選択してください。

Tableau Prep 初歩的な使い方(データによっては列名が認識されない)
データによっては列名が認識されない

▲ 開くと列ヘッダーが正しく認識されていません。元のファイルの上部に説明書きがあり、これが正常な読込を邪魔しています。これはTableau Desktopでもおなじみの「データインタープリター」機能で除外できます。

アンナ
アンナ

国連のしょうもない職員が仕事している雰囲気を出すためにわざとエクセル上部に不要なヘッダー情報を付け加えているのよ。

Tableau Prep 初歩的な使い方(そんな時はデータインタープリターが活躍)
そんな時はデータインタープリターが活躍
Tableau Prep 初歩的な使い方(データインタープリターが正しく動作すれば列名が認識される)
データインタープリターが正しく動作すれば列名が認識される

▲ データインタープリターをONにすることで列ヘッダーが意図したとおりに認識されました。

ステップ2: ステップ処理(データを俯瞰、不要列の削除)

ステップの挿入を行って最初のクリーニング処理を行います。ステップは何度でも追加できます。

Tableau Prep 初歩的な使い方(最初にやるのはステップ追加、データを俯瞰する)
最初にやるのはステップ追加、データを俯瞰する

▲ 「ステップの挿入」を行います。

特に目的なくても 「ステップの挿入」をすることがあります。データの構成がエクセルに近くて俯瞰して見やすいためです。まずはざっとどんなデータか眺めます。

Tableau Prep 初歩的な使い方(ステップ処理で追加される画面を把握しよう)
ステップ処理で追加される画面を把握しよう

▲ ステップで表示されるデータ項目は大まかに二つ。サンプリングされたものと、実際のエクセル表示に近い表示。サンプリングされているデータ項目上で、型変換をしたり、フィルターしたり、置換したりすることができます。

Tableau Prep 初歩的な使い方(いらないフィールドはさっさと消し去る)
いらないフィールドはさっさと消し去る

▲ 使うことはないだろうという列はさっさと消します。「Index」「Variant」「Notes」とはさようなら。

このエクセルは国別、地域別が一緒になっています。地域というのは北アメリカ地方とか、極東地方とか。今回は地方的な情報は外して国別にしたいのでこれらをフィルターして外します。

Tableau Prep 初歩的な使い方(フィルターも自由自在)
フィルターも自由自在

▲ 「Type」⇒「フィルター」⇒「選択した値」⇒「Country/Area」を選びます。これで地方属性が外れて国のみになります。(Macの場合は、同じ操作ができなかったので「Country/Area」を選んで「保持」を行うことで同じ結果が得られました。

変更はすべて記録されている

何らかの処理を行うと変更がすべて記録されています。自分が何を行ったかわかるし、誤った変更は削除すればもとに戻すことが出来ます。

ステップ3: ピボット処理

元のエクセルファイルは、年を示すフィールドが1年単位に大量に列ヘッダーとなっています。

一般的には「年度」のようなフィールドを使って行データとして年をいれたいところです。そのほうが分析するにも扱いやすいですよね。

ということでピボットします。ピボットはTableau Desktopでもできるので詳細な概念説明は省きますが横持ちのデータを縦持ちに変更させるための機能です。

▲ クリーニングしたステップに「ピボットの追加」を行います。

Tableau Prep 初歩的な使い方(Prepではピボット機能が使いやすい)
Prepではピボット機能が使いやすい

▲ 年を示すフィールドをすべて選択して、右のエリアにドロップします。

ピボットは一気に行う

慎重に1年ごとにピボットを行おうとすると弊害が起きます。詳細は Udemy動画「ゼロからの Tableau Prep 入門」icon の中でその弊害を説明してくれています。

Tableau Prep 初歩的な使い方(Prepでのピボット処理結果)
Prepでのピボット処理結果

▲ ピボットした後は、フィールドが二つ出来上がります。それぞれ「年」「総人口」と名前を付けました。「ピボット1の値」はエクセルファイルごとに「男性人口」「女性人口」と名前を変えてください。

ステップ4: ステップ処理

ピボットした後に再度データを俯瞰します。

Tableau Prep 初歩的な使い方(大きな処理をしたらステップ追加する)
大きな処理をしたらステップ追加する

▲ フィルターした後は「Type」もいらないので消します。フィルターがかかったまま外せます。「Parent Code」「Parent Code」「Total population, both sexes…」という列もいらないので消します。

Tableau Prep 初歩的な使い方(列順番も好きなところで)
列順番も好きなところで

▲ 総人口が一番先頭で気持ち悪かったので最後部に持って行きました。列の順番は上記のように変更可能です。

ここまでで「ESTIMATE」シートの処理は終わり、ステップ1~4を同じエクセルファイルの「MEDIUM VARIANT」でも行います。

一つ目のエクセル
  • 「ESTIMATE」
    • 終わった
  • 「MEDIUM VARIANT」
    • ステップ1〜4で同じことをやる。
二つ目のエクセル

一つ目のエクセル完了待ち

三つ目のエクセル

二つ目のエクセル完了待ち

ステップ5: ユニオン処理

「ESTIMATE」シートの処理結果と「MEDIUM VARIANT」シートの処理結果をユニオンで繋げます。

  • 前者は過去データ
  • 後者は未来データ

データ項目を合わせた後に上記をユニオン処理します。

Tableau Prep 初歩的な使い方(データ構造を合わせると機能するユニオン処理)
データ構造を合わせると機能するユニオン処理

▲ いずれかのステップをもう一つのステップへドラッグすると、ユニオンするか結合するかの表示が現れます。ユニオンを行います。

Q.ユニオンっていくつまで出来るの?

A.上記のようなGUIだと10個くらいだったと思います。(Tableau Prep入門動画iconで仕様について解説していました。)それ以上になる場合は、ワイルドカードユニオンと呼ばれるファイル検索でユニオンが生成できます。

Tableau Prep 初歩的な使い方(データ構造を合わせると機能するユニオン処理)

▲ 列名ときれいに合わせておけば上記の通りにユニオンされます(列ごとに青、オレンジ二つの帯が出ていればOK)

ユニオン後は「Table Name」という列が自動生成されます。これも今回はいらないので消します。ステップを追加しても良いし、ユニオン処理の中で消し込んでもどちらでもOKです。

Tableau Prep 初歩的な使い方(列名はわかりやすいものに変更しよう)
列名はわかりやすいものに変更しよう

ついでに右二つのフィールドは、フィールド名を選択して日本語名に変更しましょう。

  • Region, subregion, country or area *
    • 国名に変更
  • Country code
    • 国コードに変更

ステップ5までの処理を三つのエクセルファイルで行います。

一つ目のエクセル
  • 「ESTIMATE」
    • 終わった
  • 「MEDIUM VARIANT」
    • 終わった
二つ目のエクセル

一つ目のエクセルと同じことをやります。

三つ目のエクセル

一つ目、二つ目のエクセルと同じことをやります。

Tableau Prep 初歩的な使い方(フローがたくさんw)
いい感じに隊列を組んでおります

ステップ6: 結合処理

最後に、三つのエクセルから作った表を一つの論理表にまとめます。結合処理を2回行います。

結合するキーは二つ使います。結合方法は初期状態で出てきた内部結合としました。

  • 国コード
Tableau Prep 初歩的な使い方(さぁ、結合しよう)
さぁ、結合しよう

▲ あらかじめ連結するフィールドの名前を合わせておけば、一つは自動でつなげてくれます。今回は年のキーも連結したいので追加しました。

一つの結合がおわったら、残りの結合処理も行います。やり方は同じです。いくつかのフィールドが重複するので余分なものは消します。

Tableau Prep 初歩的な使い方(結合後は重複するフィールドができるので適宜消し去ると良い感じになる)
結合後は重複するフィールドができるので適宜消し去ると良い感じになる

▲ 余分なものが消し終わるとこんな感じになります。

淡々と画像やGIF貼り付けていますが、下処理をエクセルでやるか、Tableauでアレコレやるか思い浮かべてください。結構めんどくさいと思います。それがPrepでチャチャっと。

ステップ7: Tableau Desktopでプレビューする

これはオプションですが、結果を抽出等のファイルに出力する前にTableau Desktopでプレビューを行うことが出来ます。プレビューするにはもちろん、正規のTableau Desktopライセンスが必要です。

アレコレメモ
アレコレメモ

Tableau Publicだと途中で怒られました。Prepのプレビュー機能から勝手に開いたくせに…

Tableau Prep 初歩的な使い方(Tableau Desktopがあれば動くプレビュー)
Tableau Desktopがあれば動くプレビュー

▲ プレビューしたい処理を選択⇒「Tableau Desktopでプレビュー」を押します。あとは、Tableau Desktopが立ち上がり、データが読み込まれます。

ステップ8: 出力する

データを綺麗にする一連の処理が終わったら出力を行います。出力方法は二つあります。

出力方法
  • ファイルに保存
  • データソースとしてパブリッシュ

今回は「ファイルに保存」で出力します。Tableau Online, ServerへのパブリッシュはTableau Prep Conductorのオプション加入が必要ではないかと…Conductorなしだとエラーになった。

Tableau Prep 初歩的な使い方(出力はハイパーで行こう - MDMAは禁止だ)
出力はハイパーで行こう

出力タイプは三つあります。「.hyper」が使える環境がそろっていれば、読込が一番速いのでハイパーにしましょう。

出力で指定できるデータ形式
  • Tableauデータ抽出(.hyper)
  • Tableauデータ抽出(.tde)
  • コンマ区切り値(.csv)

Tableau Prepを身に着けるなら動画が最短

冒頭にも書きましたが、Tableau Prepの学習コンテンツが少ないです。Tableau公式サイトには情報はたくさんあるのですがとっつきづらいんですよね。

もうね、これ必須の講座です

参考 買い切り・繰り返し見れるTableau Prep入門動画icon

Udemyの動画だと買い切りでパソコンでもスマホでも繰り返し見れます。このブログより懇切丁寧に約5時間もの時間をかけて説明してくれています。

わざわざ外出してセミナー・講習会に参加しても繰り返し見れるのはテキストブックだけです。動画だとコーヒー飲みながら忘れたところをTableauの権威者が教えてくれます。

\ 時短効果抜群でPrep学習ができる /

Udemyは領収書発行OKです。社外講習と同じ感覚で会社経費に充てられます。

最後に

機能的にはよく使いそうなところのみを駆け足で紹介しました。

Prepは慣れると手放せなくなります。買い切りライセンスでPrepが試せていない企業もTableauの利用頻度が高いのであれば早めにサブスクリプション形式に移行するのもありかと。

アンナ
アンナ

\ 予算がなーい! /

代理店<br>営業
代理店
営業

・・・

アンナ
アンナ

(追記)あ、パワークエリも便利かも♪

以下、続編。

タイトルとURLをコピーしました