Tableau Prep Builderを操作しながら画面構成・機能(出来ること)を確認する。

Tableau Prep Builderの画面構成。操作インタフェースに触れる。 データ可視化

Tableau Prep Builderのインストールが完了したので実際に触っていきます。

Tablea Prepの操作画面は、Tableau Desktopのデータソース画面に近い感じですが、フローペイン、プロファイルペインという独特なインタフェースが加わっています。

ひとまず画面構成の確認とどこを操作すると何が起きるのか程度でのご紹介です。今回の記事では詳しい使い方までは掘り下げずベーシックな操作にとどめます。

参考 ゼロからの Tableau Prep 入門icon

参考 Tableau Prep for Business Intelligenceicon

スポンサーリンク

Tableau Prep Builderの画面構成

Tableau Prep 画面構成
  1. メニューバー
  2. データ接続ペイン
  3. フローペイン
  4. プロファイルペイン
    • データグリッド
    • 変更ペイン
Tableau Prep メニューバー
Tableau Prep メニューバー
Tableau Prep メニューバー
メニュー コマンド ショートカット(Win) ショートカット(Mac)
ファイル 新規 Ctrl+N Cmd+N
オープン… Ctrl+O Cmd+O
閉じる
保存 Ctrl+S Cmd+S
名前をつけて保存… Alt+Ctrl+S ⇧+Cmd+S
パッケージドフローのエクスポート…
リポジトリの場所
終了 Ctrl+Q Cmd+Q
編集 元に戻す Ctrl+Z Cmd+Z
やり直す Ctrl+Y Cmd+Y
切り取り Ctrl+X Cmd+X
コピー Ctrl+C Cmd+C
貼り付け Ctrl+V Cmd+V
すべて選択 Ctrl+A Cmd+A
フロー すべて実行 Ctrl+R Cmd+R
サーバー サインイン… F11
フローのパブリッシュ F10
ヘルプ はじめに
オンラインヘルプ
サポートの入手
言語の選択
設定およびパフォーマンス
プロダクトキーの管理
Tableau Prep Builderについて

フローのパブリッシュとありますが、これは「Tableau Prep Conductor」の機能のようです。Prepで使ったフローを企業内で共有したり、自動でフローを実行させて使います。最初よくわかっていなくてコネクタへの接続情報が含まれたデータソースをパブリッシュできるのかと勘違いしていました。

アレコレメモ
アレコレメモ

サーバーに繋いでもうんともすんともしませんでした…

ジャル
ジャル

オプション・ライセンスない人はインターフェース自体を表示しないとか、購入促すようなメッセージ出すなりしてわかりやすくして欲しいわ。

接続ペイン(画面左サイドバー)

画面左にはサイドバーがあり、データソースへの接続、接続後のテーブルが表示されます。

Tableau Prep Builder: Mac版で接続可能なデータソース
Tableau Prep Builder: Mac版で接続可能なデータソース

▲ サイドバー「接続」右のプラスボタンで接続できるデータソース一覧が表示されます。Macから使えるデータソースはWindowと比べて少ない印象。

次は本記事投稿時点で有効なデータソースの一覧です。(今後変更があるかもしれませんが)MacはIBMとSAP系のコネクタが少し少ないようです。

分類 Windows Mac
ファイルへ
  • Microsoft Acesss
  • PDFファイル
  • Microsoft Excel
  • 統計ファイル
  • Tableau抽出
  • テキストファイル
サーバーへ
  • Amazon Aurora
  • Amazon EMR Hadoop Hive
  • Azure SQL Data Warehouse
  • Amazon Redshift
  • Apache Drill
  • Aster Database
  • Cloudera Hadoop
  • Denode
  • EXASOL
  • Google Cloud SQL
  • Hortonworks Hadoop Hive
  • IBM BigInsights
  • IBM DB2
  • IBM PDA(Netezza)
  • Kognito
  • MapR Hadoop Hive
  • MariaDB
  • Marklogic
  • MemSQL
  • Microsoft SQL Server
  • MonetDB
  • MongoDB BIコネクタ
  • MySQL
  • Oracle
  • Pivotal Greenplum Database
  • PostgreSQL
  • Presto
  • SAP HANA
  • SAP Sybase IQ
  • SAP Sybase ASE
  • Snowflake
  • Spark SQL
  • Splunk
  • Teradata
  • Vertica
  • Amazon Aurora
  • Amazon EMR Hadoop Hive
  • Azure SQL Data Warehouse
  • Amazon Redshift
  • Apache Drill
  • Aster Database
  • Cloudera Hadoop
  • Denode
  • EXASOL
  • Google Cloud SQL
  • Hortonworks Hadoop Hive
  • Kognito
  • MapR Hadoop Hive
  • MariaDB
  • MemSQL
  • Microsoft SQL Server
  • MonetDB
  • MongoDB BIコネクタ
  • MySQL
  • Oracle
  • Pivotal Greenplum Database
  • PostgreSQL
  • Presto
  • SAP HANA
  • Snowflake
  • Spark SQL
  • Teradata
  • Vertica

フローペイン

Tableau Prepで一番特徴的なフローペイン。作業状況がフロー化されて表示されます。

Tableau Prep フローペイン

基本的に左から右へとフローを構築していきます。作業単位で構築するので、あとで戻って修正がしやすいですね。ユニオンと結合はドラッグアンドドロップでも操作できます。

「基本的に」と書いたのは右側にある処理をあとになってから後ろの処理に結合やユニオンで入れこめたりします。

Tableau Prep フロー構築のオプション
  • 分岐の追加
  • ステップの追加
  • 集計の追加
  • ピボットの追加
  • 結合の追加
  • ユニオンの追加
  • 出力の追加

分岐の追加

Tableau Prep フロー 分岐の追加

処理を途中で分割できます。分岐して一方を出力で処理を終端、もう一方を他の処理にといった処理が可能となります。

Tableau Prep フロー 分岐の追加

ステップの追加

GUIのメニュー上の順番で「分岐の追加」から書きましたが、フローペインで一番利用するのは「ステップの追加」になると思います。

基本的にデータを綺麗にクリーニングするために使います。

それと、データグリッドと呼ばれるスプレッドシートのような見慣れた表形式でデータ構造を確認できます。これを見るためにとりあえずステップを追加することもあります。

ジャル
ジャル

ステップの追加で何をする?

Tableau Prep ステップの挿入

ステップを追加すると勝手に「クリーニング<番号>」という名称がつきます。このことからもデータをクリーニングするのがメインになることがわかります。

Tableau Prep Builder ステップの追加で行う処理(例)
Tableau Prep Builder ステップの追加で行う処理(例)
ステップの追加でやりそうなこと
  • フィールドとデータの構成を確認する。
  • フィールドをアレコレする。
    • 削除する。
    • マージする。
    • 名称を変更する。
    • 型を変更する。
    • 分割する
  • 不揃いなデータは直接修正してしまう。
  • グルーピングや置換をする。
  • クリーニングする(大文字・小文字修正、スペーストリミングなど)。
  • 計算フィールドを作成する。

ステップの追加で作れる計算フィールドでは、集計関数(AVG, SUMなど)が使えません。集計の追加で一定の集計が可能ですが、そちらだと計算フィールド自体が作れない。

集計関数を使った計算フィールドをPrepで作るのか、Desktopで作るのか… この変の線引きをまだ考えています。

集計の追加

Tableau Prep 集計の追加

個人的にまだコツが掴めていない集計の追加。使い方が一番難しい印象があります。

ユニオン、ピボットなどはやりたいことがほぼ決まっていますが、集計は曖昧でありその分自由度が高くなる。

データの粒度を意識して使う必要がありそうです。

Tableau Prep 集計ステップでの処理

グループ化したいフィールドと集計したいフィールドを入れていきます。グループ化したいフィールドの行数をかけ合わせると出来上がる行数になります。

使い方次第で重複行を消去したり、不要なデータを消したりといった処理を行い、フローの前の方に戻って再び結合する…なんて使い方ができるようですがまだ直感的にできません…

アレコレメモ
アレコレメモ

集計の使いどころにお悩み中。

ジャル
ジャル

鍛錬よ。

ビボットの追加

Tableau Prep ピボットの追加

縦横がおかしいデータを入れ替えます。Tableau Desktopよりも直感的にデータ修正できます。

結合の追加

Tableau Prep 結合の追加

内部結合や外部結合は考え方はDesktopと同じ。Prepのほうが視覚的に分かりやすく設定することができます。

▲ 結合句でデータを連結させる処理は視覚的でわかりやすいです。内部結合・外部結合も丸の重なりを操作して簡単です。画面下部には結合句の推奨事項が出てきたりするので迷うときは参考にできます。

ユニオンの追加

Tableau Prep ユニオンの追加

同じデータ構造であれば継ぎ足しできるのがユニオン。GUIで継ぎ足せるのは10個まで、それ以上はワイルドカードユニオンで使って行います。

Tableau PrepのユニオンはGUI操作なら10個データソースまで
Tableau Prepのユニオン状況はデータソースの色分けでわかる。

出力の追加

Tableau Prep 出力の追加

一通りの作業が終わったらファイルかサーバーへ出力。ファイルは抽出ファイル(「.hyper」「.tde」)、CSVなど。

Tableau Prep Builder出力形式
出力形式 手段
ファイルに保存 Tableauデータ抽出(.hyper)
Tableauデータ抽出(.tde)
コンマ区切り値(.csv)
データソースとしてパブリッシュ Tableau Server
Tableau Online
アレコレメモ<br>
アレコレメモ

hyper早いね♪

Windows7 32bitだったから単に遅かっただけかもしれないけど。

hyperのパフォーマンスの良さは体感しています。

プロファイルペイン

フローペイン下、データグリッド上の中央にあるのがプロファイルペイン。データソースに接続後に表示されるようになります。このペインは、使用するステップで表示内容が異なります。

次のGIFアニメーションは次の順序でプロファイルペインを表示しています。選択するアクション毎に画面下部のプロファイルペインの内容が異なることが見て取れます。

  1. データソース
  2. ステップ
  3. ユニオン
  4. 集計
  5. ピボット
  6. 結合
  7. 出力
Tableau Prep プロファイルペインはやりたいアクションで表示内容が変動する

データグリッド

プロファイルペイン下の最下部にあるデータグリッド。スプレッドシートのように行単位で情報が見れます。ここで何かのデータ変更をすることはあまりなさそう。

データグリッドは普通に表示すると、画面の下部1/4程度の領域なのですが、プロファイルペインの右上ボタンを押すと表示領域が広がります。最初気付きませんでした。

Tableau Prep データグリッド

非常に地味ですが実際に使っている様子。

Tableau Prep データグリッド

変更ペイン

Tableau Prep 変更ペイン

いくつかのオプションで表示される「変更ペイン」。操作履歴が全て記録されます。

スポンサーリンク

かいつまんで機能を実感するためには

なるべくわかりやすく記事を投稿しているつもりですが、やはり触らないとなかなかイメージは掴めないと思います。そういう人は「Tableau Prep Builder」をとりあえずダウンロードしてTableauの「Tableau Prep Builderを使いはじめる」にある練習お題をやってみましょう。

物語のようでとっつきづらいのですが… 説明見ながら真似るとひとまずの操作方法はわかります。

練習お題だけだとふわふわした理解に終わるのであとは実際のお勤め先データで色々やると練習になります。私は、込み入ったダッシュボードを作っていた案件でデータ準備部分をPrepに移しました。実践練習が色々考えて一番身につきやすいです。

アレコレメモ
アレコレメモ

個人的に集計、結合をいかに使いこなすか…が肝に感じています。一旦抽出したファイルもデータソースにして使いまわせます。思考を張り巡らせましょう。

より詳細に身に着けるならUdemy講座がオススメです。私も受講しました。

まとめ

Tablea Prepでデータの準備作業としてできることはTableau Desktopでも実現できます。データクリーニングに特化している分、作業の効率性が格段に上がります。

できるので両ツールの「線引き」を考えながら使う必要がありそうです。複雑になりやすい計算フィールド処理はPrep側で行い、Desktop側のフィールド構成をシンプルにするようなイメージが良いのでしょうね。

参考 ゼロからの Tableau Prep 入門icon

参考 Tableau Prep for Business Intelligenceicon

タイトルとURLをコピーしました