ChatGPTの新機能、Advanced Data Analysis(旧Code Interpreter)は試されましたか?ChatGPT上でプログラムが実行できるようになっただけでなく、様々な種類のファイル入出力に対応したため、多くのことができるようになりました。
この記事では、ChatGPTのAdvanced Data Analysisが対応しているファイル形式と、それらの使用例を紹介します。
対応しているファイル形式
ChatGPTのCode Inrerpreterは、様々なファイルの読み書きに対応しています。
- テキスト(txt)
- データ形式(csv,xml,json 等)
- Microsoft オフィスファイル(docx, xmlx, pptx 等)
- 画像ファイル(jpg, png, bmp, gif 等)
- PDFファイル
- ZIPファイル
- QRコード
- プログラムやhtml,csv などのソースコード
- 動画ファイル(mp4, avi, mov)
利用例
テキスト(.txt)
適当な内容が書かれているテキストファイルを用意しました。
ChatGPTにこのファイルをアップロードし、ファイルに書かれている文章について説明してもらいました。ファイルの内容を読み込み、理解していることがわかります。
データ形式(.csv, .json, .xml等)
CSVやjsonなどの、データ形式を読み込ませることができます。解析に便利かもしれませんね。
試験として、ここでは顧客情報を模したデータをCSVで用意しました。
age,sex,occupation,address
28,Male,Company employee,Tokyo
35,Female,Teacher,Kanagawa
42,Male,Engineer,Osaka
19,Female,Student,Hokkaido
56,Male,Doctor,Fukuoka
32,Female,,
45,Male,,
24,Female,,
・・・これが50行ほど
これをアップロードし、ChatGPTに分析依頼をしてみました。
ChatGPTに依頼された通り、基本的な統計量を見ていきましょう。
Microsoft オフィスファイル
Word(docx)やExcel(xlsx)などのMicrosoft オフィスのデータも読み込むことができます。試しにPowerPointのデータ形式であるpptxをアップロードし、内容をまとめさせてみました。
PDFファイル
PDFファイルを読み込むことができます。ただし、テキストで保存される内容に限られます。
ここでは、ChatGPTで用いられている「GPT-4」の技術報告PDFを読み込ませてみました。最初はPDFが読めないとしてテキスト解析を拒みます。
しかし、「読めるとこだけでまとめてください」というようなお願いをすれば、テキストが読める箇所に限定して解析してくれます。
画像ファイル(jpg, png, bmp等)
画像を読み込み、コントラストを上げたり特定の色のみを削除するような画像処理や、OCR(画像の文字の読み込み)をさせることができます。
ここでは、OCRを試しました。先ほども用いた、「GPT-4」の技術報告PDFの序文をスクショしたものです。
これをChatGPTに読み込ませて文字をそのまま出力させました。言語の指定をしないとChatGPTは読み込もうとしないので気を付けてください。
ソースコード(各種プログラム、html, cssなど)
Javascript やC言語、html、CSSなどのファイルをアップロードすることで、様々な処理を行わせることができます。簡単なプログラムであれば、違う言語をPythonに変換させ、そのプログラムをCodeInterpreter上で実行させることもできるでしょう。
ここでは、簡単なRubyのプログラムをPythonに変換させ、CodeInterpreterによりその結果を得ることをさせてみました。次のプログラムは、「hello」を続けて3回出力するRubyのプログラムです。
3.times { print("hello") }
これをChatGPTにアップロードし、Pythonに変換させてみました。
プログラムを解釈し、Pythonに変換してCodeInterpreterにより結果を得ることができました。