Latar Belakang

Statistik pariwisata merupakan nilai yang menggambarkan kondisi pariwisata suatu negara. Nilai tersebut dapat berupa tingkat penghunian kamar hotel bintang dan non bintang, jumlah tamu indonesia dan tamu asing pada hotel bintang dan non bintang, hingga rata-rata lama menginap tamu hotel. Untuk dapat menghitung nilai statistik tersebut BPS membutuhkan data. Berdasarkan UU Nomor 16 Tahun 1997 Pasal 7 tentang statistik disebutkan bahwa proses pengumpulan data dapat dilakukan dengan melaksanakan sensus, survey, kompilasi produk administrasi dan cara lain sesuai dengan perkembangan ilmu pengetahuan dan teknologi. Sejauh ini, untuk mengumpulkan data pariwisata BPS menggunakan survey dan kompilasi produk administrasi. Metode ini membutuhkan waktu yang panjang dan biaya yang tidak sedikit, yang mana menyebabkan data pariwisata tidak bisa dirilis dengan cepat.

Seiring dengan pesatnya perkembangan teknologi dan ilmu pengetahuan, sumber data yang digunakan untuk menghitung nilai statitstik tidak hanya sebatas pada survey, sensus, atau catatan administrasi. Salah satu dampak pesatnya perkembangan teknologi adalah adanya fenomena big data. Big data adalah sebuah istilah yang menggambarkan fenomena ledakan data digital dengan jumlah besar dan dengan bentuk (format) yang beragam . Salah satu faktor yang mendukung terciptanya big data adalah internet.

Berdasarkan hasil survey yang dilakukan oleh BPS terkait telekomunikasi pada tahun 2017, ditemukan bahwa persentase rumah tangga yang sudah mengakses internet dalam 3 bulan terakhir berkisar 57,33%, dimana rumah tangga di daerah perkotaan yang mengakses internet mencapai 70,89% dan rumah tangga di daerah perdesaan sekitar 41,99%

Tujuan mengakses internet beragam, seperti untuk mendapat berita/informasi, mengerjakan tugas, mengirim/menerima email, media sosial, pembelian/penjualan barang/jasa, hiburan, fasilitas finansial, dan lainnya. Diantara tujuan yang disebutkan diatas, 82,66% rumah tangga yang mengakses internet bertujuan untuk membuka media sosial, yang merupakan tujuan dengan persentase terbanyak. (Publikasi BPS, 2017)

Instagram adalah sebuah platform media sosial yang befokus pada sharing foto dan video yang dirilis pada bulan Oktober 2010 dan sejak saat itu jumlah penggunanya meningkat dengan pesat. Berdasarkan laporan dari Instagram, jumlah pengguna aktif Instagram pada bulan Juni 2018 telah mencapai angka 1 miliar. Hingga bulan April 2019, pengguna instagram di indonesia berjumlah 56 juta orang (statista.com). Saat pengguna menggunggah foto atau video di instagram, biasanya disertai dengan informasi lain seperti hashtag, lokasi dimana foto atau video tersebut kemungkinan diambil, dan caption atau tulisan yang menyampaikan maksud dari pengguna saat mengunggah postingan tersebut namun tidak selalu sesuai mendeskripsikan tampilan foto yang diunggah.

Pada penelitian ini akan dilakukan scraping data instagram dengan tema pariwisata dan menggunakan data tersebut khususnya data lokasi (data geospasial) yang biasanya dicantumkan oleh pengguna saat menggunggah foto. Data lokasi di instagram berupa titik koordinat yang terdiri atas latitude dan longitude, yang menunjukkan posisi dari tempat tersebut di permukaan bumi. Dengan data lokasi tersebut penulis ingin mengetahui persebaran wisatawan di Indonesia berdasarkan post instagram.

Metodologi

Pengumpulan Data

Metode pengumpulan data yang digunakan pada penelitian ini meliputi studi pustaka yang dilakukan dengan mengkaji penelitian-penelitian terkait yang telah dilakukan sebelumnya mengenai penggunaan teori, metodologi dan hasil dari penelitian tersebut. Selain itu penelitian ini juga menggunakan data sekunder yang diperoleh dari media sosial Instagram. Proses pengambilan data instagram menggunakan python3.7 dan package Scrapy

Contoh tampilan post instagram yang diunggah oleh salah satu pengguna yang akan di scrap

Preprocessing

Selanjutnya masuk ke tahap preprocessing yang mana mempersiapkan data yang telah dikumpulkan agar siap digunakan untuk memasuki proses analisis. Pada proses preprocessing terdapat beberapa tahap, antara lain:

  1. Memilih post yang termasuk dalam batas waktu (1 Januari 2018 hingga 31 Maret 2019)
  2. Menghapus post tentang bisnis (online shop, jasa travelling, jasa akomodasi)
  3. Mengambil postingan yang mengandung geotag
  4. Menggabungkan data
  5. Menghilangkan duplikasi

Visualisasi

Setelah data selesai melewati tahap preprocessing, tahap selanjutnya adalah tahap analisis, dimana akan dilakukan dilakukan analisis deskriptif dan analisis spasial. Data tersebut akan dilihat persebarannya pada peta Indonesia dengan menggunakan choropleth dan heatmap. Choropleth adalah salah satu jenis peta tematik yang digunakan untuk memvisualisasikan data pada peta dimana poligon-poligon yang ada pada peta akan diberikan warna sesuai dengan nilainya masing-masing, sedangkan heatmap digunakan untuk melihat titik atau spot tempat dimana data banyak berkumpul. Peta choropleth dibuat dengan menggunakan aplikasi QGIS dengan memanfaatkan fitur count points in polygon dan choropleth map. Heatmap dibuat dengan menggunakan package gmaps yang merupakan package yang disediakan oleh Google Maps untuk memvisualisasikan data geospasial. Selain itu dilakukan analisis untuk melihat jumlah post berdasarkan waktu post .

Hasil

Data yang telah dikumpulkan sebanyak 2.280.700 data dan akan melalui tahap preprocessing selanjutnya memasuki tahap visualisasi. Pada tahap ini data yang tersisa dan sudah sudah melewati proses preprocessing adalah sebanyak 480.111 data dan akan dilihat persebarannya berdasarkan provinsi dan kota/kabupaten di Indonesia. Untuk melihat persebaran data akan digunakan heatmap dan peta choropleth.

Heatmap persebaran post instagram hasil scraping
Choropleth persebaran post instagram tentang pariwisata per provinsi di Indonesia bulan Januari 2018 – Maret 2019
Choropleth persebaran post instagram tentang pariwisata per kabupaten di Indonesia bulan Januari 2018 – Maret 2019
Grafik jumlah post instagram per minggu

Gambar di atas menggambarkan grafik jumlah post per minggu dari bulan Januari 2018 hingga bulan Maret 2019. Berdasarkan grafik tersebut dilihat bahwa jumlah post pada bulan Desember 2018 meningkat dan puncaknya ada di minggu ketiga dan keempat di bulan tersebut, lalu mulai menurun lagi pada bulan Januari 2019. Minggu ke iga dan keempat di bulan Desember bertepatan dengan libur hari Natal dan Tahun Baru. Hal ini menunjukkan bahwa libur Natal dan Tahun Baru banyak dimanfaatkan oleh pengguna instagram untuk melakukan perjalanan wisata