OpenAI Embedding – Part 2

Pada modul ini kita akan membuat embedding untuk plot dari movies. Data dapat download di Kaggle Wikipedia Movie Plots. Tujuan dari tutorial ini adalah menggunakan plot movies yang di embedd menggunakan OpenAI untuk merekomendasikan plot yang mirip. Untuk mempermudah mengikuti, gunakan Jupyter Notebook. Import Library Pertama kita akan import library yang digunakan. Jika Anda mengikuti … Read more

Sharing is caring:

OpenAI Embedding – Part 1

Embedding adalah proses mengubah input text menjadi vector agar computer mudah dalam memahami relasi antar vector. OpenAI memiliki embedding model text-embedding-ada-002. Model akan mengembalikan 1536 dimension vector. Embedding yang dihasilkan dapat kita simpan untuk melakukan searchs, recomendations dan lainnya. Contoh melakukan embedding Model akan mengembalikan result hasil embedding berupa 1536 dimension vector seperti berikut. Sampai … Read more

Sharing is caring:

Estimasi Biaya Menggunakan TikToken

TikToken adalah library tokenizer yang disediakan oleh OpenAI. Berguna untuk mengubah teks menjadi token. Untuk instalasi gunakan perintah berikut: Encoding Hal yang perlu diperhatikan adalah encoding. Encodings menentukan bagaimana teks dikonversi menjadi token. Setiap model memiliki encoding berbeda. Encoding name OpenAI models cl100k_base gpt-4, gpt-3.5-turbo, text-embedding-ada-002 p50k_base Codex models, text-davinci-002, text-davinci-003 r50k_base (or gpt2) GPT-3 … Read more

Sharing is caring:

Project Code Reviewer Sederhana

Melanjutkan dari modul code menggunakan ChatGPT, kali ini kita akan mengimplementasikan untuk membuat program sederhana untuk mereview program dalam Bahasa Python. Pada project digunakan nama program reviewer.py yang menerima parameter nama file Python yang akan direview dan parameter optional –model untuk memilih model yang akan digunakan, secara default digunakan gpt-3.5-turbo. Jika dijalankan, menggunakan code tree.py … Read more

Sharing is caring: