Utilization of Online Travel Agency Data Scraping as Tourism Potential Projection
Web Scraping

Utilization of Online Travel Agency Data Scraping as Tourism Potential Projection

This article describes the use of Big Data in tourism statistics, especially in accommodation statistics. The collected data is then processed to see how the accommodation is distributed, seeing the movement of occupancy and prices in each province day by day.

Latar Belakang

Di sektor pariwisata, layanan akomodasi merupakan bagian penting. Layanan akomodasi bertindak sebagai bagian mendasar dari pasokan pariwisata. Sejauh ini, BPS telah mengumpulkan data akomodasi di Indonesia melalui sensus dan survei. Salah satu kegiatan pencatatan data akomodasi BPS adalah survei jasa akomodasi perusahaan / bisnis, baik pencacahan lengkap (VHTL) yang dilakukan setiap tahun, dan pencacahan informasi harian akomodasi (VHTS) yang dilakukan setiap bulan.

Beberapa masalah yang dapat muncul dalam proses pengumpulan data pariwisata di BPS adalah kerangka sampel yang tidak lengkap dan kurang up to date yang dapat menjadi masalah dalam proses pengumpulan data. Sampel yang tidak lengkap akan meningkatkan kesalahan non-sampling. Selain itu, proses pengumpulan data melalui survei VHTL dan VHTS masih menggunakan kuesioner cetak. Untuk sampai pada tahap diseminasi, proses yang dilakukan sangat panjang. Salah satu solusi yang dapat digunakan untuk mengatasi permasalahan adalah dengan menggunakan metode web scraping. Web scraping adalah metode atau teknik ekstraksi yang dilakukan oleh suatu program perangkat lunak komputer untuk mendapatkan informasi dari situs web. Program tersbut biasanya bekerja dengan cara melakukan simulasi permintaan data dari sisi pengguna dengan mengimplementasikan low-level HTTP atau dengan menyisipkan program pada web browser. Metode web scraping digunakan untuk mengambil data yang tidak terstruktur yang tersedia kemudian diubah menjadi data yang terstruktur.

Metodologi

Penelitian ini dilakukan dengan menggunakan metode web scraping yang dibagi dalam enam tahap.

Alur penelitian

Pada tahapan pengolahan data, hasil crawling diolah terlebih dahulu menjadi angka okupansi agar dapat dilakukan perbandingan dengan angka Tingkat Penghunian Kamar (TPK) yang dihasilkan oleh BPS. TPK yang dihasilkan oleh BPS dihitung dengan menggunakan rumus berikut

tpk = (jumlah_malam_kamar_dihuni / jumlah_malam_kamar_tersedia) * 100

Data yang didapatkan dari Agoda dan Pegipegi beberapa diantaranya adalah data jumlah kamar tersisa dan data jumlah kamar total. Untuk menghitung angka okupansi, dilakukan pendekatan dengan menggunakan rumus berikut

okupansi = (sum(jumlah_kamar_total - jumlah_kamar_tersisa) / sum(jumlah_kamar_total)) * 100

Untuk akomodasi yang tidak menyediakan data jumlah kamar total, pendekatan yang dilakukan adalah menyamakan jumlah kamar total dengan jumlah kamar tersisa. Selanjutnya, angka okupansi akan dihitung menjadi angka harian untuk melihat fluktuasi tingkat okupansi, dan menjadi angka bulanan untuk dilakukan perbandingan dengan angka TPK BPS.

Tahap terakhir adalah analisis hasil. Analisis yang digunakan pada penelitian kali ini
adalah analisis deskriptif. Analisis deskriptif digunakan untuk menganalisis fluktuasi tingkat okupansi dan harga akomodasi dari waktu ke waktu. Selain itu, analisis deskriptif dengan menggunakan grafik digunakan untuk mengevaluasi jumlah direktori di setiap provinsi di Indonesia, baik direktori akomodasi hasil crawling, maupun direktori akomodasi BPS.

Hasil

Heat map persebaran akomodasi di Indonesia
Heat map persebaran akomodasi di Indonesia

Grafik persebaran akomodasi diatas menunjukkan persebaran dari data akomodasi di Indonesia yang telah dikumpulkan menggunakan web scraping. Terlihat dengan jelas bahwa persebaran data akomodasi tidak merata pada masing-masing provinsi di Indonesia. Dari heat map diatas, akomodasi banyak tersebar di Provinsi Bali dan
provinsi-provinsi yang ada di Pulau Jawa.

Rata-rata okupansi per provinsi

Hasil lain dari penelitian ini adalah tingkat okupansi. Dari hasil yang didapat, untuk pola data harian dari tingkat okupansi antara Agoda dan Pegipegi cenderung sama. Namun, untuk data harian dari harga akomodasi, harga akomodasi dari Agoda lebih tinggi dari harga akomodasi dari Pegipegi. Selain itu, dari gambar yang ada, tingkat okupansi dan harga akomodasi memiliki pola hubungan yang searah. Ketika tingkat okupansi tinggi (akomodasi diminati oleh wisatawan) maka harga akomodasi cenderung tinggi, begitu juga dengan sebaliknya.


Share Tweet Send
0 Comments
Loading...
You've successfully subscribed to Big Data STIS
Great! Next, complete checkout for full access to Big Data STIS
Welcome back! You've successfully signed in
Success! Your account is fully activated, you now have access to all content.