エクセルの分析ツール(Power Query, Pivotなど)に触れているので記事を投稿します。
エクセルは広く使われている割に、この辺りのいわゆる「モダンExcel」関連の情報があまりないですね。書籍も数えるほど。
私の職場でも使っている人がいないというか、そもそも認知すらされていない。そして、こちらが言わなければ向こう数年は知らないままというか(放置しておこ
まとまった記事はもうちょっと使ってから…と考えていますが、データ接続の際に、指定フォルダから複数ファイルを読み込む操作が違和感ある操作で忘れそうなのでメモとして記事にします。
Power Queryでフォルダへアクセスする
Power Queryでは、ファイル、データベース、オンラインサービスなどをデータソースとして接続することが出来ます。一旦、表形式で読み込むことができれば、その後は接続先にかかわらず一貫した操作性になります。
ファイルの場合は、一つのファイルを指定する形になります。複数ファイルを一括して読み込みたい場合は、フォルダアクセスを使うことになります。
これは、データ構成が同じCSVファイル、エクセルファイルを読み込む場合に有用です。
何らかの業務システムからCSVファイルを落として分析に使う場面とかありますよね。ファイルの格納場所を決めておいて、Power Queryでフォルダ指定をしておけば更新作業も楽々です。
フォルダから複数ファイルを読み込む方法・やり方
指定フォルダからファイルを読み込む
フォルダ内のすべてのCSVを読み込みます。
▲ エクセルのリボンメニュー「データ」から「データの取得」をクリックして、「ファイル(F)」⇒「フォルダから(F)」を選びます。
▲ フォルダのパスを指定するダイアログが表示されるので、読み込みたいフォルダを指定します。
▲ 続いてダイアログが表示され、指定フォルダ内の(サブフォルダを除く)ファイルがすべて表示されます。ここでは「データの変換」を選び次に進みます。
▲ Power Queryエディタが開きます。エクセルのような表形式でデータが読み込まれますが、フォルダ指定最初の段階では、ファイル名称やファイルプロパティに関する情報が表示されます。
▲ フォルダ内に読み込む対象ではないファイルが含まれる場合は、テキストフィルターを使うことで対象ファイル群のみに絞ることが出来ます。
- 指定の値に等しい…
- 指定の値と等しくない…
- 指定の値で始まる…
- 次の値で始まらない…
- 指定の値で終わる
- 次の値で終わらない…
- 指定の値を含む…
- 指定の値を含まない…
▲「Name」の右端「▼」から「テキストフィルター」で条件を指定します。
▲ ファイル名称に合わせたフィルターを使って対象ファイルのみに絞ります。上記の例はファイルが少ないので、拡張子でもよいかもしれません。
▲ 「Extension」列から右の列は使わないので、Shiftキーを押しながら列を選択して一括削除します。
▲ 「Content」列の右端にある「↓↓」を押し下げします。
▲ ファイルの結合ダイアログが表示されます。大抵の場合、CSVファイルの想定したデータが読み込まれます。正しくない場合は、「元のファイル(読込みのエンコード)」や「区切り記号」を使って調整しましょう。OKを押して次に進みます。
▲ CSVファイル内のデータが読み込まれました。整形する必要があれば、続いてPower Queryでクリーニング作業を行うことになります。
Sharepointのドキュメントライブラリから読み込む
(プラン・テナント環境に依るようなのですが)Sharepointのドキュメントライブラリ上のフォルダも読み取ることが出来ます。
URLを指定して読み込みますが、ライブラリ上のフォルダURLではなく、サイト上のトップアドレスを指定します(サブサイトの場合は、サブサイトのトップアドレス)。
SharepointのURL体系はやりきれないほど複雑だからトップアドレスだけなのかしら
手順
- エクセルのリボンメニュー「データ」から「データの取得」をクリックして、「ファイル(F)」⇒「SharePointフォルダーから(O)」を選びます。
- SharePoint上のサイトURLを指定するダイアログが表示されます。
- サイトのトップアドレス、サブサイトの場合はサブサイトのトップアドレスをURL指定します。
- 認証が求められるので、組織アカウントでサイトへログインします。
- サイトURLを指定すると新たなダイアログが表示され、サイト内のファイルがすべて表示されます。不要なファイルも数多くありますが、ここでは「データの変換」を選び次に進みます。
- Power Queryエディタが開きます。不要なファイルはフィルター機能で除外します。
- ここからの操作は、PCフォルダー指定と同様です。
プライベートでは「Business Standard」のサブスクプランを使っています。エクセルからSharepoint上のデータ利用については制限があるそうで、エンタープライズ版が必要とのことです(サポートからの回答)。
まとめ
Power Queryを使った、指定フォルダから複数ファイルを読み込む操作について記事投稿しました。
インターフェースがいままでのエクセルとはだいぶ異なるので最初は戸惑います。
少しずつ使って記事にします。
紹介する書籍の中で翔泳社出版のものは、紙媒体やKindleのほかに公式サイト「SEshop」でPDF書籍が購入できます。オフィスで画面に移しながら手を動かせるので使い勝手抜群!!
全国送料無料!IT書、ビジネス書、資格書が豊富なSEshop
「SEShop」だとクーポン利用可、PDF版での入手となり扱いやすいです。現在、10%オフとなるクーポンが配布されていました。アマゾンとかで買うよりもお得です。