Dalam era big data dan data science, proses mengumpulkan data yang berbeda format dan media sangat dibutuhkan.
Web merupakan salah satu sumber data yang dapat diakses siapa saja. Namun cukup sulit untuk mengambil data dari web jika kita lakukan dengan manual.
Web scrapping adalah suatu proses mengambil data dari web secara otomatis.
Oleh karena itu, akan sangat mempermudah para praktisi data scientist untuk mendapatkan data dan melakukan formating.
Course ini akan membahas web scrapping dengan dua metoda, yaitu menggunakan http request object dan menggunakan headless browser.
Setelah mengikuti tutorial ini, diharapkan dapat memilih menggunakan tools yang tepat untuk melakukan scrapping.
Prasyarat tutorial
- Memahami Javascript
- Memahami HTML
Berikut kurikulum Course Web Scrapping Menggunakan Node.js
- Hal Penting Seputar Web Scrapping
- HTTP Request dengan request-promise
- Headless Browser Automation
- Project Setup
- Project Scrapper Menggunakan Request
- Login Form Menggunakan Request
- Project Instagram Scrapper Menggunakan Request
- Intro Puppeteer – Instalasi dan Pengenalan
- Intro Puppeteer – Input dan Keypress
- Puppeteer – Tips Optimisasi
- Puppeteer – Otomasi Twitter Posting