Menggunakan Parameter parse_dates

Data yang digunakan adalah https://www.kaggle.com/c/rossmann-store-sales/data Import library pandas, lalu gunakan read_csv untuk load data. Akan tampil error seperti dibawah. Peringatan diatas bisa dimatikan dengan menambahkan parameter low_memory=False. Error ini terjadi karena pandas berusaha menentukan column dtype. Jika Anda check dengan menggunakan fungsi info(), akan terlihat column Date dan StateHoliday memiliki tipe data object. Kita dapat … Read more

Sharing is caring:

DataFrame Slicing dan Filtering

Data yang digunakan masih data airbnb pada modul sebelumnya. Untuk mengambil sebagian dataset dari sebuah dataframe, Anda dapat lakukan slicing. Slicing bisa dilakukan terhadap column atau row. Memilih Kolom Data Anda bisa memilih kolom tertentu saja. Bisa single column atau multicolumn. Filtering DataFrame Contohnya tampilkan data dengan host_name= “Taz”. Jika logic filtering rumit, Anda bisa … Read more

Sharing is caring:

Membuat Index dan Sorting

Data yang digunakan untuk tutorial ini adalah https://www.kaggle.com/dgomonov/new-york-city-airbnb-open-data DataFrame Index Index adalah kolom dengan nilai unik yang digunakan untuk identifikasi data masing-masing row. Secara default, index digenerate oleh pandas mulai dari angka nol (0). Jika data yang digunakan sudah memilki id dan Anda ingin menggunakannya sebagai index, dapat dilakukan dengan mudah. Contohnya kolom id pada … Read more

Sharing is caring:

Membuat dan Menyimpan DataFrame

Pandas dataframe dapat dibuat dari beberapa macam sumber input. Membuat Dataframe dari Array Kita gunakan numpy untuk membuat data random array. Membuat Dataframe dari Dictionary Kita juga bisa membuat dataframe dari Python Dictionary. Menyimpan DataFrame Untuk menyimpan Dataframe kedalam file cukup mudah. Umumnya disimpan dalam format csv. Parameter lainnya yang dapat digunakan adalah index=false, data … Read more

Sharing is caring: