Introduction

Saat ini, masyarakat di Indonesia lebih memilih untuk berbelanja menggunakan online shopping melalui e-commerce yang semakin marak dibandingkan dengan berbelanja secara konvensional. Semakin tersebar luasnya akses Internet memungkinkan seseorang untuk mencari barang yang mereka inginkan dalam waktu singkat tanpa lagi dibatasi oleh jarak. Indonesia sendiri merupakan pasar e-commerce terbesar di Asia Tenggara (E-Conomy SEA 2018) dengan total transaksi mencapai 12,2 milyar US Dollar di tahun 2018 dan diprediksi akan mencapai 53 milyar US Dollar di tahun 2025 mendatang. Dari hasil survey tersebut Lazada, Shopee dan Tokopedia dinobatkan sebagai tiga perusahaan ecommerce terbesar di Asia Tenggara mengalahkan para pesaing lainnya.

Berkembangnya e-commerce yang diikuti dengan perubahan perilaku konsumen dalam melakukan transakti tentu menjadi suatu fenomena baru untuk ditangkap dalam statistik official Indonesia yang dihasilkan oleh Badan Pusat Statistik. Saat ini sebagian besar statistik yang dihasilkan masih dilakukan dengan metode pengumpulan data yang tradisional di mana petugas mendatangi responden satu persatu untuk mengumpulkan data. Belum ada statistik ofisial yang mampu merekam dan menganalisis data yang dihasilkan dari kegiatan online shopping ini. Salah satu penyebabnya adalah besaran dan kecepatan data transaksi yang terjadi sehingga sulit untuk dilakukan menggunakan pendekatan tradisional. Diperlukan adanya pendekatan baru menggunakan teknik analisis big data untuk mampu menghasilkan statistik yang dapat menangkap fenomena fenomena baru ini.

Beberapa manfaat yang dapat dihasilkan dengan teknik analisis big data untuk BPS antara lain BPS dapat memanfaatkan big data untuk menghasilkan control terhadap statistic yang sudah ada, pengganti dari metode pengumpulan data tradisional yang memakan waktu biaya dan tenaga yang besar, serta produk statistik baru untuk mendukung kebutuhan data masyarakat di Indonesia yang semakin berkembang. Dalam penelitian kali ini peneliti mengaplikasikan pendekatan analisis big data untuk menghasilkan pengganti dari metode pengumpulan data tradisional sekaligus produk baru yang dapat dimanfaatkan khusunya oleh BPS

Methodology

Analisis Big Data merupakan suatu teknik menganalisis data dalam jumlah besar yang sulit di analisis menggunakan pendekatan analisis tradisional. Analisis dilakukan untuk mengambil insight dan mengungkap pattern-patern tertentu yang dapat muncul di dalamnya. Big data memiliki 4 karakteristik yaitu volume yang besar, variasi data yang beragam, kecepatan kemunculan data dan tingkat kebenaran yang bergantung pada sumber dan teknik pengolahan yang dilakukan.

Crawling merupakan suatu cara untuk melakukan penelusuran website secara otomatis dan sistematis menggunakan robot atau yang lebih dikenal spider. Scraping di sisi lain merupakan suatu teknik pengambilan data yang ditampilkan di dalam suatu website secara otomatis termasuk hasil dari website yang telah di crawl. Penggabungan penggunaan keduanya dapat dilakukan untuk melakukan pengumpulan data secara otomatis dari suatu website. Dalam mengumpulkan data melalui website beberapa teknik yang dapat digunakan antara lain menggunakan API, melakukan Reverse Engineering terhadap situs yang ingin diakses, atau membaca langsung dari halaman website yang ditampilkan.

Result

Dengan melakukan proses crawling dari salah satu e-commerce terbesar di Asia Tenggara, data dapat dikumpulkan secara cepat dan efisien sehingga kegiatan dapat difokuskan kepada proses analisis bukan kepada proses pengumpulan data seperti pada kasus tradisional. Beberapa visualisasi yang dapat dihasilkan antara lain:

Dashboard

Online Shop Growth and Distribution in Indonesia

Video yang menampilkan perkembangan kemunculan E Commerce di Indonesia dari tahun 2015 sampai dengan 2019 di atas merupakan animasi dari dashboard yang dibuat menggunakan Tableau. Tampilan interaktif dari tayangan di atas dapat dilihat pada dashboard di bawah ini (untuk tampilan terbaik, gunakan pilihan full screen). Atur timeline di bagian bawah untuk menyesuaikan periode yang diinginkan. Pilih salah satu bar provinsi untuk melakukan zoom in pada provinsi tersebut di periode tertentu untuk melihat ke level yang lebih detail (kabupaten). Klik kembali bar yang telah di pilih untuk kembali ke tampilan sebelumnya.

Maps

Density map showing the location distributions of all the items currently on sale

Tree Maps

Bar Charts

Average item price per category. Products within technology category have slightly higher average price than others. There is high probability that there are outliers in Souvenir dan Pesta category.
Average item sold for each product in the last 30 days per category. Kecantikan category dominates with more than 800 items sold for each product in this category.

Column Bar Chart

Rating percentage per category. People tend to have higher level of satisfaction when buying products within Household Needs category compared to others.

Bubble Charts

Bubble chart showing percentage of number of item per category