Model yang disediakan OpenAI

Model

Berikut family model yang disediakan oleh openAI:

Dall-E: generate dan edit images (Beta).
Whisper: convert audio menjadi text (Beta).
Moderation: mendeteksi apakah sebuah teks aman atau tidak.
GPT-3: memahami dan mengenerate natural language.
GPT-3.5: model yang ditingkatkan dari GPT-3.
GPT-4: versi terbaru dari openAI LLM (Limited Beta).

GPT4

GPT-4 adalah large multimodal model (saat ini menerima input teks dan menghasilkan output teks, masa mendatang akan mendukung input gambar) yang dapat memecahkan masalah sulit dengan akurasi lebih tinggi daripada model sebelumnya. Seperti gpt-3.5-turbo, GPT-4 dioptimalkan untuk chat tetapi bekerja dengan baik untuk tugas completion menggunakan Chat Completion API.

GPT 3.5

Model GPT-3.5 dapat memahami dan menghasilkan natural language atau kode. Model yang paling mumpuni dan hemat biaya dalam family GPT-3.5 adalah gpt-3.5-turbo yang telah dioptimalkan untuk chat tetapi juga berfungsi dengan baik untuk tugas completion.

Moderation

Model moderation dirancang untuk memeriksa apakah konten mematuhi kebijakan penggunaan OpenAI. Model memberikan kemampuan klasifikasi yang memeriksa konten dalam kategori berikut: kebencian, kebencian/ancaman, menyakiti diri sendiri, seksual, seksual/anak di bawah umur, kekerasan, dan kekerasan/grafis.

GPT-3

Model GPT-3 dapat memahami dan menghasilkan natural language. Model ini digantikan oleh model generasi GPT-3.5 yang lebih powerful.

Pricing

Berikut beberapa informasi pricing dari models per 1K tokens:

text-davinci-003 : $0.02.
text-curie-001: $0.002.
text-babbage-001 : $0.005.
text-ada-001 : $0.0004.
gpt-3.5-turbo : $0.002.
gpt-4: $ 0.06 – $0.12.

Melihat tabel pricing diatas mungkin sedikit membuat kita bingung memilih model. Sederhananya jika Anda ingin menggunakan text completion tanpa memasalahkan biaya, text-davinci-003 adalah yang paling powerful dan yang paling mahal dan paling lambat.

Rekomendasi dari OpenAI sendiri adalah untuk text completion disarankan menggunakan gpt-3.5-turbo, paling murah dari keluarga GPT-3.5 dan cukup powerful. Walaupun dapat melakukan text completion, gpt-3.5-turbo dioptimisasi untuk chat.

Playground

Anda dapat menggunakan Playground yang disediakan OpenAI untuk mencoba model yang tersedia. Jadi Anda dapat bandingkan kemampuan masing-masing model dengan menggunakan prompt yang sama, model mana yang paling akurat dan sesuai dengan kebutuhan Anda.

Playground dapat diakses di https://platform.openai.com/playground

Anda bisa saja menggunakan model yang paling akurat namun mahal namun overkill. Tergantung dari tugas yang ingin dicapai Anda dapat memilih model yang lebih murah.

Pada contoh diatas, tugas yang dilakukan adalah mengekstrak kode airport, setelah melakukan percobaan dengan beberapa model, kita dapat menggunakan text-curie-001 untuk melakukan tugas sederhana diatas dengan biaya yang lebih murah.

Namun jika Anda mengharapkan result yang terasa lebih human (berusaha meniru akal manusia), misalnya menulis lirik, disarankan menggunakan text-davinci-003. Anda dapat lakukan percobaan di playground misalnya dengan prompt:

write me a limerick about a dog who hates baths

Coba bandingkan tiap-tiap model, dapat Anda lihat text-davinci-003 akan memberikan hasil terbaik.

Sharing is caring: