【ChatGPT活用例】AIでオープンデータを分析をしよう

Advanced Data Analysis(旧Code Interpreter)は皆さん利用されましたか?Advanced Data AnalysisとはChatGPTの有料版で利用できる機能ですが、その分とても強力。この機能を利用すれば、Excelやプログラムを駆使しないと難しいかった集計作業が、簡単にできるようになります。

今回は、Advanced Data Analysisを利用して、オープンデータを分析する方法を紹介します。オープンデータとは、国や団体が公開しているデータのことで、交通事故や過去の天気の情報などを自由に取得できます。

今回紹介するデータの分析方法を応用すれば、次のようなことができるようになるでしょう。

  • 学校の自由研究
  • 大学のレポート作成
  • 仕事の売り上げ分析・資料作成

今回の記事はAinova様の記事を参考にしております。Ainova様は生成AIに関する情報を図解を用いてとてもわかりやすいので、ぜひ一度ご覧ください!

目次

Advanced Data Analysisとは?

Advanced Data Analysisとは、ChatGPTのデータ分析に便利な機能を搭載したモードです。ExcelファイルやCSVなどのデータをアップロードし解析を依頼することで、様々な情報を得ることができます。

次は、警視庁のオープンデータから事故が多い都道府県TOP3を分析した例です。普通だとExcelスキルをある程度必要とする作業ですが、Advanced Data Analysisを利用すれば簡単に行えます。Excelが苦手な方はぜひ一度お試しください。

交通事故のデータを分析する

警察庁は全国の交通事故の情報を公開しています。Advanced Data Analysisの練習台としてピッタリです。

https://www.npa.go.jp/publications/statistics/koutsuu/opendata/index_opendata.html

解析の前準備

まずは下記からデータをダウンロードしましょう。今回は「本票」と「各種コード表」を利用します。本票は交通事故の情報です。この情報は都道府県や事故の種類に数字が割り当てられているので、理解するには各種コード表が必要になります。

https://www.npa.go.jp/publications/statistics/koutsuu/opendata/index_opendata.html

「各種コード表」は分析に不向きなレイアウトになっているので、まずはそちらを手作業で直しましょう。ChatGPTにトライアンドエラーで読み込ませることもできますが、失敗しやすいです。

各種コード表の内容。各シートの先頭に項目名が書かれており、ChatGPTは内容を分析しづらい。
先頭の説明を削除し、空白の列も削除することでChatGPTは解析をスムーズに行える。
消した説明はChatGPTに直接伝えよう。

また、グラフで日本語を表示するときに文字が正しく表示されない場合があります。そのときは、下記のリンクからフォントをダウンロードし、一緒にお願いしましょう。

グラフを日本語で出力しようとすると、文字化けする。フォントデータをアップロードして再描画を依頼しよう。

事故数を都道府県別に円グラフで表示する

一番事故の多い都道府県を調べる方法を紹介します。先ほどダウンロードした「hojuhyo_2022.csv」「codebook_2022.xlsx」をアップロードし、ChatGPTに解析を依頼しましょう。

2つのファイルをアップロードし、集計を指示。各ファイルの説明と注意点を書くこと。

これに対しChatGPTは、まずコード表から都道府県コードを取得し、都道府県の集計を行いました。正しく集計できているようです。

ここで、フォントファイルをアップロードし円グラフを描画するよう指示を出しましょう。添付されたフォントファイルを利用すること、ソートすることなど、適宜指示を追加して調整してください。

ChatGPTは指示を理解し、描画処理を行いました。

これまでの指示は簡単にみえますが、以下のような工夫がされています。

  • 一度に難しい処理を依頼すると、一度に応答できるリソースを超えて失敗してしまいます。
    段階的に指示をしましょう。今回の例であれば
    「集計だけ指示する」→「円グラフの描画を指示する」と2段階で指示しています。
  • 各ファイルの説明や注意点を事前に説明しましょう。失敗したら、補足して再度指示を出しましょう。

一度で成功することは、ほぼありません。何度か指示を出し直しながら、理想の結果を得られるよう調整してください。

事故の統計から、効果的な注意喚起フレーズを提案する

自動車を運転していると、「スリップ注意!」などの注意を促すフレーズをよく見かけます。ここではChatGPTに事故が多発するシチュエーションを分析し、効果的な注意喚起フレーズを提案してもらいましょう。

一度に指示すると生成に失敗してしまうので、各分析→フレーズ生成 の手順で行います。ここでは、「事故の発生日時」「天候」「路面状況」「年齢」を調べてもらいました。

事故の多い月と時間帯の分析を指示
結果として、昼間の事故が最も多かった。日照時間の関係上、当然の結果となってしまった。
6,7,5月は交通量が多くなるため事故も発生しやすくなるようだ。
晴の事故が最も多い結果となった。晴の日が割合として多いので、これも当然の結果となってしまった。
乾燥状態が最も事故の発生回数が多かった。割合として乾燥している場合のほうが多いので、これも当然か。
事故の多い年齢の件数は、45~54歳が最も多い結果となった。これも人口比率を考えると当然か。

これらの分析結果から、注意喚起フレーズを考案してもらいました。

分析結果を元に、晴れた日でも注意を怠らないようなフレーズを多数提案してくれました。

今回の分析結果では、単純に事故の数をカウントしたため面白味のない結果となってしまいました。割合を考慮するような指示を行うと、より実践的な結果になるでしょう。

オススメのオープンデータ・無料データ

Advanced Data Analysisを試すのにぴったりなデータを公開しているサイトを紹介します。

  • 警察庁 事故リスト
    このページで利用した事故の情報をまとめたオープンデータです。どのような全国でどのような事故が起こっているのか、どのような対策が有効なのか調べることができます。
  • 気象庁
    気象庁が観測しているデータを自由にダウンロードできるサービスです。全国で、過去にどのような天気なのか様々な条件をつけてダウンロードすることができます。
  • 駅データ
    全国の駅の位置や路線の情報を調べられます。。
  • 国土交通省
    全国の道路の位置情報を調べられます。

Advanced Data Analysisを利用して色んなデータを分析してみよう

Advanced Data Analysisは、Excelやプログラムが苦手でもデータ分析ができるツールです。これとオープンデータを活用すれば、身近なことを手軽に調べられ、客観的な情報を得られるようになるでしょう。

AINOVA様は、ChatGPTのAdvanced Data Analysisを利用した様々な分析方法を紹介するだけでなく、様々なAIを紹介しています。ぜひ一度ご覧ください。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

元プログラマーのパソコンオタク。ChatGPTをきっかけにAIの凄まじさを認識し、ブログで情報発信を行う決意をする。基本インドアだが稀に山を登りごく稀にキャンプをする。

目次