Tableau Prep Builderのインストールが完了したので実際に触っていきます。
Tablea Prepの操作画面は、Tableau Desktopのデータソース画面に近い感じですが、フローペイン、プロファイルペインという独特なインタフェースが加わっています。
ひとまず画面構成の確認とどこを操作すると何が起きるのか程度でのご紹介です。今回の記事では詳しい使い方までは掘り下げずベーシックな操作にとどめます。
参考 Tableau Prep for Business Intelligence
Tableau Prep Builderの画面構成

- メニューバー
- データ接続ペイン
- フローペイン
- プロファイルペイン
- データグリッド
- 変更ペイン

メニュー | コマンド | ショートカット(Win) | ショートカット(Mac) |
---|---|---|---|
ファイル | 新規 | Ctrl+N | Cmd+N |
オープン… | Ctrl+O | Cmd+O | |
閉じる | — | — | |
保存 | Ctrl+S | Cmd+S | |
名前をつけて保存… | Alt+Ctrl+S | ⇧+Cmd+S | |
パッケージドフローのエクスポート… | — | — | |
リポジトリの場所 | — | — | |
終了 | Ctrl+Q | Cmd+Q | |
編集 | 元に戻す | Ctrl+Z | Cmd+Z |
やり直す | Ctrl+Y | Cmd+Y | |
切り取り | Ctrl+X | Cmd+X | |
コピー | Ctrl+C | Cmd+C | |
貼り付け | Ctrl+V | Cmd+V | |
すべて選択 | Ctrl+A | Cmd+A | |
フロー | すべて実行 | Ctrl+R | Cmd+R |
サーバー | サインイン… | F11 | — |
フローのパブリッシュ | F10 | — | |
ヘルプ | はじめに | — | — |
オンラインヘルプ | — | — | |
サポートの入手 | — | — | |
言語の選択 | — | — | |
設定およびパフォーマンス | — | — | |
プロダクトキーの管理 | — | — | |
Tableau Prep Builderについて | — | — |
フローのパブリッシュとありますが、これは「Tableau Prep Conductor」の機能のようです。Prepで使ったフローを企業内で共有したり、自動でフローを実行させて使います。最初よくわかっていなくてコネクタへの接続情報が含まれたデータソースをパブリッシュできるのかと勘違いしていました。

サーバーに繋いでもうんともすんともしませんでした…

オプション・ライセンスない人はインターフェース自体を表示しないとか、購入促すようなメッセージ出すなりしてわかりやすくして欲しいわ。
接続ペイン(画面左サイドバー)
画面左にはサイドバーがあり、データソースへの接続、接続後のテーブルが表示されます。

▲ サイドバー「接続」右のプラスボタンで接続できるデータソース一覧が表示されます。Macから使えるデータソースはWindowと比べて少ない印象。
次は本記事投稿時点で有効なデータソースの一覧です。(今後変更があるかもしれませんが)MacはIBMとSAP系のコネクタが少し少ないようです。
分類 | Windows | Mac |
---|---|---|
ファイルへ |
|
|
サーバーへ |
|
|
フローペイン
Tableau Prepで一番特徴的なフローペイン。作業状況がフロー化されて表示されます。

基本的に左から右へとフローを構築していきます。作業単位で構築するので、あとで戻って修正がしやすいですね。ユニオンと結合はドラッグアンドドロップでも操作できます。
「基本的に」と書いたのは右側にある処理をあとになってから後ろの処理に結合やユニオンで入れこめたりします。
分岐の追加

処理を途中で分割できます。分岐して一方を出力で処理を終端、もう一方を他の処理にといった処理が可能となります。

ステップの追加
GUIのメニュー上の順番で「分岐の追加」から書きましたが、フローペインで一番利用するのは「ステップの追加」になると思います。
基本的にデータを綺麗にクリーニングするために使います。
それと、データグリッドと呼ばれるスプレッドシートのような見慣れた表形式でデータ構造を確認できます。これを見るためにとりあえずステップを追加することもあります。

ステップの追加で何をする?

ステップを追加すると勝手に「クリーニング<番号>」という名称がつきます。このことからもデータをクリーニングするのがメインになることがわかります。

- フィールドとデータの構成を確認する。
- フィールドをアレコレする。
- 削除する。
- マージする。
- 名称を変更する。
- 型を変更する。
- 分割する
- 不揃いなデータは直接修正してしまう。
- グルーピングや置換をする。
- クリーニングする(大文字・小文字修正、スペーストリミングなど)。
- 計算フィールドを作成する。
ステップの追加で作れる計算フィールドでは、集計関数(AVG, SUMなど)が使えません。集計の追加で一定の集計が可能ですが、そちらだと計算フィールド自体が作れない。
集計関数を使った計算フィールドをPrepで作るのか、Desktopで作るのか… この変の線引きをまだ考えています。
集計の追加

個人的にまだコツが掴めていない集計の追加。使い方が一番難しい印象があります。
ユニオン、ピボットなどはやりたいことがほぼ決まっていますが、集計は曖昧でありその分自由度が高くなる。
データの粒度を意識して使う必要がありそうです。

グループ化したいフィールドと集計したいフィールドを入れていきます。グループ化したいフィールドの行数をかけ合わせると出来上がる行数になります。
使い方次第で重複行を消去したり、不要なデータを消したりといった処理を行い、フローの前の方に戻って再び結合する…なんて使い方ができるようですがまだ直感的にできません…

集計の使いどころにお悩み中。

鍛錬よ。
ビボットの追加

縦横がおかしいデータを入れ替えます。Tableau Desktopよりも直感的にデータ修正できます。
結合の追加

内部結合や外部結合は考え方はDesktopと同じ。Prepのほうが視覚的に分かりやすく設定することができます。

▲ 結合句でデータを連結させる処理は視覚的でわかりやすいです。内部結合・外部結合も丸の重なりを操作して簡単です。画面下部には結合句の推奨事項が出てきたりするので迷うときは参考にできます。
ユニオンの追加

同じデータ構造であれば継ぎ足しできるのがユニオン。GUIで継ぎ足せるのは10個まで、それ以上はワイルドカードユニオンで使って行います。


出力の追加

一通りの作業が終わったらファイルかサーバーへ出力。ファイルは抽出ファイル(「.hyper」「.tde」)、CSVなど。
出力形式 | 手段 |
---|---|
ファイルに保存 | Tableauデータ抽出(.hyper) |
Tableauデータ抽出(.tde) | |
コンマ区切り値(.csv) | |
データソースとしてパブリッシュ | Tableau Server |
Tableau Online |

hyper早いね♪
Windows7 32bitだったから単に遅かっただけかもしれないけど。
hyperのパフォーマンスの良さは体感しています。
プロファイルペイン
フローペイン下、データグリッド上の中央にあるのがプロファイルペイン。データソースに接続後に表示されるようになります。このペインは、使用するステップで表示内容が異なります。
次のGIFアニメーションは次の順序でプロファイルペインを表示しています。選択するアクション毎に画面下部のプロファイルペインの内容が異なることが見て取れます。
- データソース
- ステップ
- ユニオン
- 集計
- ピボット
- 結合
- 出力

データグリッド
プロファイルペイン下の最下部にあるデータグリッド。スプレッドシートのように行単位で情報が見れます。ここで何かのデータ変更をすることはあまりなさそう。
データグリッドは普通に表示すると、画面の下部1/4程度の領域なのですが、プロファイルペインの右上ボタンを押すと表示領域が広がります。最初気付きませんでした。

非常に地味ですが実際に使っている様子。

変更ペイン

いくつかのオプションで表示される「変更ペイン」。操作履歴が全て記録されます。
かいつまんで機能を実感するためには
なるべくわかりやすく記事を投稿しているつもりですが、やはり触らないとなかなかイメージは掴めないと思います。そういう人は「Tableau Prep Builder」をとりあえずダウンロードしてTableauの「Tableau Prep Builderを使いはじめる」にある練習お題をやってみましょう。
物語のようでとっつきづらいのですが… 説明見ながら真似るとひとまずの操作方法はわかります。
練習お題だけだとふわふわした理解に終わるのであとは実際のお勤め先データで色々やると練習になります。私は、込み入ったダッシュボードを作っていた案件でデータ準備部分をPrepに移しました。実践練習が色々考えて一番身につきやすいです。

個人的に集計、結合をいかに使いこなすか…が肝に感じています。一旦抽出したファイルもデータソースにして使いまわせます。思考を張り巡らせましょう。
より詳細に身に着けるならUdemy講座がオススメです。私も受講しました。
まとめ
Tablea Prepでデータの準備作業としてできることはTableau Desktopでも実現できます。データクリーニングに特化している分、作業の効率性が格段に上がります。
できるので両ツールの「線引き」を考えながら使う必要がありそうです。複雑になりやすい計算フィールド処理はPrep側で行い、Desktop側のフィールド構成をシンプルにするようなイメージが良いのでしょうね。