Arsy Arlina

Sabtu, 24 November 2018

Twitter Advance Search,HTML to CSV

Mengambil Data Twitter Dalam Jangka Waktu Bebas

Bismillah..

Apakah data media sosial kita selama ini dapat dimanfaatkan secara positif? 💁 Jawabannya jelas iya, ternyata data yang selama ini kita publikasikan melalui media sosial dapat dimanfaatkan oleh para pengolah data untuk memperoleh informasi penilaian masyarakat terhadap suatu hal misalnya penilaian terhadap politik, penilaian suatu produk, atau penilaian suatu kinerja perusahaan dan lain sebagainya. 👏👏 Sebelumnya hal-hal ini biasa dilakukan dengan membagikan kuesioner, namun ternyata saat ini hal tersebut dapat dilakukan hanya dengan menggunakan data media sosial. Kita hanya perlu mengumpulkan data media sosial yang sudah ada sesuai dengan kriteria informasi yang ingin diperoleh. 😌😌 Kali ini saya akan membahas terlebih dahulu mengenai teknik pengambilan data salah satu media sosial yaitu twitter dalam jangka waktu yang tidak berbatas

Pada tulisan ini saya akan jelaskan bagaimana cara pengambilan data pada twitter sampai dengan merubahnya kedalam bentuk excel sehingga dapat digunakan lebih lanjut untuk memperoleh informasi..


 

[1] Log in / Sign up twitter

Pastikan kalian memiliki akun twitter terlebih dahulu, jika belum memiliki akun segera daftarkan diri anda (https://twitter.com/).

[2] Buka dan Isi Twitter Search Advance


Buka twitter search advance (https://twitter.com/search-advanced?lang=en), kemudian isi sesuai dengan yang diinginkan seperti contoh pada gambar dibawah ini. Pengisian dilengkapi sesuai kebutuhan data yang ingin diperoleh.
 
Dari gambar, terdapat 4 bagian yang dapat kita lengkapi untuk memudahkan pencarian :
  1. Kolom words, terdapat 6 sub kolom didalamnya yang membantu pencarian tweet berdasarkan kata-kata unik yang biasa disebutkan dalam pembicaraan topik tertentu.
    • All of these words: pencarian dilakukan terhadap semua yang mengandung kata yang diinginkan. Bisa jadi nama user atau tweetnya yang mengandung kata-kata ini.Contoh kata: 2019gantipresiden, lgbt, hijrah dan lain sebagainya. Kata pencarian dapat terdiri dari 2 kata kunci atau lebih, dan jika menggunakan spasi mengartikan bahwa tweet yang diambil harus memuat kata-kata tersebut (contoh: "lesbian gay" maka tweet yang dikumpulkan haruslah yang mengandung kedua kata tersebut).

    • This exact phrases: pencarian dilakukan pada data yang mengandung ungkapan pada sub kolom ini didalamnya. Hanya pada ungkapan atau tweetnya saja yang mengandung kata ini. Jika kata terdiri dari 2 suku kata maka pada tweet harus mengandung 2 kata tersebut, artinya harus mengadung semua kata yang diminta.
    • Any of these words: pencarian dilakukan pada data yang mengandung apa saja atau salah satu atau beberapa saja yang ada pada sub kolom ini. (contoh: "lesbian gay", maka hasil akan menunjukan ada yang mengandung kata gay saja, atau ada yang mengandung kata lesbian saja)
    • None of these words: pencarian dilakukan terhadap tweet yang tidak mengandung kata-kata ini. Hal ini biasa digunakan jika pencarian dilakukan pembatasan agar lebih spesifik.
    • These hashtags: pencarian dilakukan hanya yang mengandung hashtag dengan kata-kata ini. Dan jika terdapat 2 kata atau lebih maka pencarian dilakukan yang mengandung salah satu kata saja atau semuanya.
  2. Kolom Peoples
    • From these accounts : menginginkan pengambilan data dari tweet user ini saja, dengan format penulisan tanpa @. Jika terdapat lebih dari 1 user yang ingin diambil tweetnya, maka gunakan spasi yang berartikan "atau", mengartikan semua tweet yang diambil dari salah satu user atau keduanya atau semuanya.
    • To these accounts : menginginkan pengambilan data dari tweet yang dituju kepada user ini saja, dengan format penulisan tanpa penulisan pencarian sama seperti pada sub kolom from these account
    • Mentioning these accounts: menginginkan pengambilan data dari tweet yang me-mention user ini saja, dengan format penulisan tanpa penulisan pencarian sama seperti pada sub kolom from these account.
  3. Kolom Places, untuk memperjelas lokasi yang digunakan dalam tweet yang ingin diambil selama proses pencarian data
  4. Kolom Dates,  berisikan tanggal tweet yang ingin diambil, dari sampai dengan kapannya dipilih secara bebas. Range atau jangka waktu data dalam pencarian dapat dilakukan secara bebas.

[3] HTML/HTM to CSV

Setelah pencarian menghasilkan data berupa halaman web (html/htm), maka data diubah terlebih dahulu kedalam bentuk standar data yaitu CSV. Berikut source code yang dapat digunakan :
CSV yang dihasilkan akan tersimpan otomatis pada directory (dataPath) yang dituliskan pada code dan akan berbentuk seperti pada tabel berikut :


TimeUsernameRepliesRetweetsLikesLanguageTweet
1-Jan@EdiyantoGuntoro012Thn 2019 ganti Presiden. Thn 2019 Indonesia punya Presiden baru...Aamiin YRA.
1-Jan@Navy30nkri716Metro tipu muncul lagi dg tipuannya.....tahun 2019 ganti presiden dan metro tipu kita bredel....media laknat....
31-Dec@mkhumaini1245119SAPI sama KEBO ribut mulu. yang seneng BANTENG, KODOK, CEBONG sama turunannya. Sudahlah tujuan kita itu 2019 Ganti Presiden Baru, kalau berantem mulu mana bisa ngalahin Pakde.
31-Dec@MasKUNTENG001Dan yg angkat berita ini... pasti media @kompas.com Ora gumun... 2019 ganti presiden baelah..


Peringatan: Untuk memperoleh data yang lengkap, perlu dilakukan scroll down sampai akhir yaaa, kadang untuk meyakinkan sudah terambil semua datanya sih tweet yang terambil suka melewati batas waktu range yang kita tentuin. It's okay, gk masalah..kan kita bisa saring lagi datanya nanti yang berganda, yang penting sudah terambil semua datanya. Diingatkan juga, selama pencarian harus terkoneksi internet yang kuat yaaaa, jangan putus nyambung kaya status kamu hehe..... #hempppp. 
Penutup: Setelah data terkumpul rapih dalam bentuk CSV, pasti bingung mau diapain lagi datanya kannn ..belum dapet informasi apa-apa nihhh #pertanyaan saya dulu hehe.. Pastinya data tersebut bisa dimanfaatkan untuk kebutuhan analisa informasi dalam berbagai hal ko. Hal ini ternyata bisa dilakukan dengan menggunakan model statistika/data science/machine learning yang ada. Dilain kesempatan akan saya coba sharing kembali bagaimana aplikasi penggunaan model sampai dengan diperolehnya informasi berharga.

Sekian dulu yaa..
Jika ada yang kurang jelas atau keliru, silahkan ditulis aja di kolom comment yaa, barang kali kita bisa semakin luas sharingnya...
Terimakasih

[Arsy Arlina]


Tidak ada komentar:

Belajar Data Science / Python Mulai Dari Mana?

Belajar Data Science / Python Mulai Dari Mana? Salah satu guru saya mengajarkan bahwa untuk menjadi seorang data science intinya ...