Googleデータポータルに慣れてきました。
仕事でTableauというBIツールを使用しています。細かい使い勝手は異なるもののお作法にたいした違いはないと感じてます。
Googleデータポータルは、多用なデータソースへのアクセスが出来てウェブ経由でサクサクとグラフが作れる無料とは思えない素晴らしいツールです。データをビジュアライズすることに馴染みがない方でもドラッグ&ドロップでカンタンにグラフが作れます。
直感的に使えて便利なGoogleデータポータル。BIツールとしての基本的な概念を知っているともっと活用できるかも。
BIツール10の基礎概念
BIツールとは何か

BIとは、”Business Intelligence (ビジネスインテリジェンス)”の略称で企業内に蓄積されたデータを分析するためのテクノロジーや戦略の総称です。BIツールを使うことで、企業内に蓄積された膨大なデータを分析することができ、可視化することにより意思決定を促します。
データをグラフで可視化するツールですが、BIツールを使うと次のようなことができます。
- 既存のデータをドラッグ&ドロップで簡単ビジュアライズ
- たくさんの種類のデータベースに接続できる
- データには変更を加えないから安全
- フィルターを使ってグラフを動的に変化させられる
- グラフを組み合わせてひと目でわかるダッシュボードが作れる
- Webでグラフを共有、見る人に分析環境を提供できる
データソース

データソースとはデータの入手元となる接続先のことです。一般的なBIツールではエクセル、Access、CSV、ローカル環境やクラウド上の各種データベースを扱うことが出来ます。
コネクタ | 説明 |
---|---|
BigQuery | BigQuery テーブルとカスタムクエリに接続します。 |
Cloud Spanner | Google Cloud Spanner データベースに接続します。 |
Cloud SQL for MySQL | Google Cloud SQL for MySQL データベースに接続します。 |
Google Cloud Storage | Google Cloud Storage でファイルを表示します。 |
Google アド マネージャー 360 | Google アド マネージャーのデータに接続します。 |
Google アナリティクス | Google アナリティクスのレポートビューに接続します。 |
Google スプレッドシート | Google スプレッドシートに接続します。 |
Google 広告 | Google 広告の掲載結果レポートのデータに接続します。 |
MySQL | MySQL データベースに接続します。 |
PostgreSQL | PostgreSQL データベースに接続します。 |
Search Console | Search Console データに接続します。 |
YouTube アナリティクス | YouTube アナリティクス データに接続します。 |
テレビ アトリビューション | テレビ アトリビューションのデータに接続します。 |
キャンペーン マネージャー | キャンペーン マネージャーのデータに接続します。 |
ディスプレイ&ビデオ 360 | ディスプレイ&ビデオ 360 のレポートデータに接続します。 |
データの抽出 | 接続してデータを抽出 |
検索広告 360 | 検索広告 360 のパフォーマンス レポートに接続します。 |
ファイルのアップロード | CSV(カンマ区切り)形式のファイルに接続します。 |
データ形式
データソースの1つにエクセル(Googleデータポータルの場合はスプレッドシート)と記載しましたが、エクセルであればなんでも良いというわけではなく、データの記載方法には「お作法」があります。
たいした話しではありませんが、項目とデータがしっかりと入力された一次元、または二次元的な表をデータソースとして扱うことができます。
エクセル内に表的な情報はあっても余計な説明文章が先頭にあったり、行や列を結合していたりすると正しく読み込むことが出来ません。BIツールの利用者は特に「行や列の結合」をキラいます。
ディメンションと指標(メジャー)

データポータルを使う上で一番重要な概念がディメンションと指標(メジャー)。端的に言うといずれもフィールドですが使われ方が異なります。
データソースには、ディメンションと指標の2種類のフィールドがあります。ディメンションとはデータのカテゴリのことで、そのカテゴリ内の何かしらの要素を定量化する数値が指標です。データポータルのレポートでは、ディメンションと指標をグラフで視覚化することができます。
Googleデータポータル ヘルプ
ディメンション=カテゴリだけだとちょっと浅いかな… 指標は説明の通りで数値化できるデータです。
ディメンション(dimension)の辞書上の意味には「〔物事の〕側面、様相、特質、特徴」というものがあります。指標はディメンションを変更することでいろんな見方をすることができます。たとえば、サーチコンソール上にはクリック数という指標があります。

クリック数は、国別、デバイス毎、URL単位など視点を変更することができます。この視点を変更できる機能を持つのがディメンションです。一般的には非数値データということになりますが、流通しているBIツールでは指標もディメンションとして使うことができます。
データ型
データを格納する上でのお作法・約束事みたいなものです。数値型のフィールドには文字列を入れられないし、文字列フィールドに数値をいれても文字列という扱いになるので演算処理にはつかえなくなります。
Googleデータポータルでは次のデータ型が用意されています。サーチコンソール上の型を確認しましたが、コネクタで多少異なるかも知れません。
データ型 | 説明 |
---|---|
数値 |
|
テキスト | 文字列 |
日付と時刻 | 日付(YYYYMMDD) |
ブール値 | True/False |
地域 | 例)国、地域、都市、緯度・経度 |
通貨 | 例)JPY, USD |
URL | www.yahoo.com |
データソースの統合(結合)

(最初は使わなくて良いですが)一般的なBIツールやGoogleデータポータルでは複数のデータソースを1つにまとめて扱うことが出来ます。
データベース用語では「結合」や「JOIN」と呼ばれます。Googleデータポータルでは「データソースの統合」と呼ぶそうです。データソースを統合するには、まとめる対象の表に共通のディメンションが必要となります。
集計
説明が難しいのですが「指標をどういう観点でまとめあげるか」みたいなことです。
データサイエンス用語としての集計には、「複数の行の値を特定の基準で1つにまとめ、より大きな意味または尺度を持つ1つの値に統合する機能またはフィールド」という意味があります(出典: Wikipedia)。
Googleデータポータル ヘルプ
GoogleがWikipediaを引用していようとは…
- 平均値
- 件数
- 個別件数
- 最大値
- 最小値
- 合計

これに時間や何らかの分類項目を組み合わせて使うのよ。
使い方はアイデア次第。
- 月、週、日の平均値
- 時間単位の件数
- 一定期間の最大値や最小値
データポータルからサチコに接続した時点のデフォルトでクリック数、インプレッション数は「合計」、CTRは「平均値」でした。1ヶ月という単位であれば、その期間の合計クリック数やインプレッション数、平均CTRということになります。ちなみに集計方法を変更することもできます。
計算フィールド
データソースを読み込んでそのまま用意されているディメンションや指標で分析やデータの可視化をしてもよいのですが、存在するフィールドから別のフィールドを作ることが出来ます。
これを「計算フィールド」と呼びます。
計算フィールドを使うことで、新たなディメンションやメジャーを作ることができ分析の幅を広げることが出来ます。エクセルで言うと、元の列データから関数を使って別の列データを作るイメージです。制御構文も使えるのでエクセルの関数よりは複雑な処理が出来ます。

計算フィールドが使える人、使えない人でレベル差が出てしまいます。制御構文も含めて自由自在にすることで人よりも一歩先に行くことができます。
フィルター

一般的なBIツール、Googleデータポータルがエクセルやスプレッドシートで作るグラフに対して最大の強みになるのがフィルターの機能です。
フィルターを介して、グラフ描写を動的に変更することが出来ます。
ダッシュボード

これもBIツールの強みの機能です。グラフを1つの場所にまとめることができます。

常に把握しておきたいKPIなどを1つのページにまとめておくことができて便利です。ダッシュボード上のグラフを相互にフィルター連携することもできます。
まとめ
駆け足ですが、Googleデータポータルを楽しむ上でのBIツールの基礎概念をご紹介しました。ググって調べる上でも多少の概念は抑えていた方が解決への近道になると思います。
また、時間があるときに関連記事を投稿したいと思います。
参考 Udemyで見れる Google Data Portalに関する入門動画
Udemy(ユーデミー)の特徴
- コロナ禍でもオンラインで手軽に学べる
- 趣味にビジネスに豊富なジャンル
- 動画は買い切り・繰り返し視聴可能
- PCでもスマホでも見れる
- コンテンツのクオリティが高い