OpenAIのGPT-4o miniをbatchで使う方法を試す

参考サイト

platform.openai.com

github.com

とりあえず最初なので上記の公式を参考にしてみました。 このページの通りすれば、バッチファイルの作り方、バッチジョブの作成、進捗の確認、結果、アウトプットの取得と、一通りを経験できます。

ここをする前に以下のページも経由しておけば、苦労少なくできると思います。

platform.openai.com

対応が必要だったところ

cook book通りですと、日本語に対応しないところがあり、そこも調べなければいけませんでした。

jsonlファイルに書き込むところで、Pythonの標準モジュール codecsでエンコーディングutf-8に指定する、非アスキー文字をそのまま出力する、ensure_ascii=Falseを指定するなどの処理が日本語の場合は必要です。

また、cook book通りですと、jsonlで返ってきたアウトプットを、ハッシュライクな形式のまま、文字列で表示するだけなのですが、自分の使用の想定とは違っており、そこも変更が必要でした。

それぞれのキーの値を取得して、webページに反映したいと考えているので、文字列になっているハッシュライクな形式を辞書に変換して、dict["キー"]で取り出しました。 本番では、もうひと工夫必要になりますが、使える算段はできました。

設定等で思わぬエラーに遭遇していたかも

OpenAIのことをあまり知らないので、アカウントや課金、プロジェクトの設定あたりの不備が原因で、けっこう時間を溶かしてしまいましたが、一応、バッチ処理を一通り経験できましたので、してみてよかったです。

課金に関しては、確かAPIでの利用は、いくらかクレジットしないとエラーになるらしい?ので、最初なので、5ドル分だけクレジットしましたが、GPT-4o miniでなら、このbatchを体験する間の処理では、余裕で無課金の範囲内で使えています。

今後

AIは従来のキーワードでの検索方法の代わりにプロンプトから利用する場合が圧倒的に多そうですが、API経由での利用もいろいろと可能性を広げてくれそうです。