Advanced Data Analysis(旧Code Interpreter)は皆さん利用されましたか?Advanced Data AnalysisとはChatGPTの有料版で利用できる機能ですが、その分とても強力。この機能を利用すれば、Excelやプログラムを駆使しないと難しいかった集計作業が、簡単にできるようになります。
今回は、Advanced Data Analysisを利用して、オープンデータを分析する方法を紹介します。オープンデータとは、国や団体が公開しているデータのことで、交通事故や過去の天気の情報などを自由に取得できます。
今回紹介するデータの分析方法を応用すれば、次のようなことができるようになるでしょう。
- 学校の自由研究
- 大学のレポート作成
- 仕事の売り上げ分析・資料作成
今回の記事はAinova様の記事を参考にしております。Ainova様は生成AIに関する情報を図解を用いてとてもわかりやすいので、ぜひ一度ご覧ください!
Advanced Data Analysisとは?
Advanced Data Analysisとは、ChatGPTのデータ分析に便利な機能を搭載したモードです。ExcelファイルやCSVなどのデータをアップロードし解析を依頼することで、様々な情報を得ることができます。
次は、警視庁のオープンデータから事故が多い都道府県TOP3を分析した例です。普通だとExcelスキルをある程度必要とする作業ですが、Advanced Data Analysisを利用すれば簡単に行えます。Excelが苦手な方はぜひ一度お試しください。
交通事故のデータを分析する
警察庁は全国の交通事故の情報を公開しています。Advanced Data Analysisの練習台としてピッタリです。
https://www.npa.go.jp/publications/statistics/koutsuu/opendata/index_opendata.html
解析の前準備
まずは下記からデータをダウンロードしましょう。今回は「本票」と「各種コード表」を利用します。本票は交通事故の情報です。この情報は都道府県や事故の種類に数字が割り当てられているので、理解するには各種コード表が必要になります。
https://www.npa.go.jp/publications/statistics/koutsuu/opendata/index_opendata.html
「各種コード表」は分析に不向きなレイアウトになっているので、まずはそちらを手作業で直しましょう。ChatGPTにトライアンドエラーで読み込ませることもできますが、失敗しやすいです。
また、グラフで日本語を表示するときに文字が正しく表示されない場合があります。そのときは、下記のリンクからフォントをダウンロードし、一緒にお願いしましょう。
事故数を都道府県別に円グラフで表示する
一番事故の多い都道府県を調べる方法を紹介します。先ほどダウンロードした「hojuhyo_2022.csv」「codebook_2022.xlsx」をアップロードし、ChatGPTに解析を依頼しましょう。
これに対しChatGPTは、まずコード表から都道府県コードを取得し、都道府県の集計を行いました。正しく集計できているようです。
ここで、フォントファイルをアップロードし円グラフを描画するよう指示を出しましょう。添付されたフォントファイルを利用すること、ソートすることなど、適宜指示を追加して調整してください。
ChatGPTは指示を理解し、描画処理を行いました。
これまでの指示は簡単にみえますが、以下のような工夫がされています。
- 一度に難しい処理を依頼すると、一度に応答できるリソースを超えて失敗してしまいます。
段階的に指示をしましょう。今回の例であれば
「集計だけ指示する」→「円グラフの描画を指示する」と2段階で指示しています。 - 各ファイルの説明や注意点を事前に説明しましょう。失敗したら、補足して再度指示を出しましょう。
一度で成功することは、ほぼありません。何度か指示を出し直しながら、理想の結果を得られるよう調整してください。
事故の統計から、効果的な注意喚起フレーズを提案する
自動車を運転していると、「スリップ注意!」などの注意を促すフレーズをよく見かけます。ここではChatGPTに事故が多発するシチュエーションを分析し、効果的な注意喚起フレーズを提案してもらいましょう。
一度に指示すると生成に失敗してしまうので、各分析→フレーズ生成 の手順で行います。ここでは、「事故の発生日時」「天候」「路面状況」「年齢」を調べてもらいました。
これらの分析結果から、注意喚起フレーズを考案してもらいました。
分析結果を元に、晴れた日でも注意を怠らないようなフレーズを多数提案してくれました。
今回の分析結果では、単純に事故の数をカウントしたため面白味のない結果となってしまいました。割合を考慮するような指示を行うと、より実践的な結果になるでしょう。
オススメのオープンデータ・無料データ
Advanced Data Analysisを試すのにぴったりなデータを公開しているサイトを紹介します。
Advanced Data Analysisを利用して色んなデータを分析してみよう
Advanced Data Analysisは、Excelやプログラムが苦手でもデータ分析ができるツールです。これとオープンデータを活用すれば、身近なことを手軽に調べられ、客観的な情報を得られるようになるでしょう。
AINOVA様は、ChatGPTのAdvanced Data Analysisを利用した様々な分析方法を紹介するだけでなく、様々なAIを紹介しています。ぜひ一度ご覧ください。