Kamis, 20 Januari 2011

Apa itu Sentiment Analysis / Opinion Mining ?

Apa itu Sentiment Analysis / Opinion Mining ?

Opinion Mining / Sentiment Analysis (sebagian besar researcher menganggap dua istilah ini sama/interchangeable) merupakan sebuah cabang penelitian di domain Text Mining yang mulai booming pada awal tahun 2002-an. Riset-nya mulai marak semenjak paper dari B.Pang dan L.Lee [1] keluar. Secara umum, Sentiment analysis ini dibagi menjadi 2 kategori besar :
  1. Coarse-grained sentiment analysis
  2. Fined-grained sentiment analysis
Coarse-grained sentiment analysis - kita mencoba melakukan proses analysis pada level Dokumen. Singkatnya adalah kita mencoba mengklasifikasikan orientasi sebuah dokumen secara keseluruhan. Orientasi ini ada 3 jenih : Positif, Netral, Negatif. Akan tetapi, ada juga yang menjadikan nilai orientasi ini bersifat kontinu / tidak diskrit.

Fined-grained sentiment analysis - kategori kedua ini yang sedang Naik Daun sekarang. Maksudnya adalah para researcher sebagian besar fokus pada jenis ini. Obyek yang ingin diklasifikasi bukan berada pada level dokumen melainkan sebuah kalimat pada suatu dokumen.
contoh :
  • Saya tidak suka programming. (negatif)
  • Hotel yang baru saja dikunjungi sangat indah sekali. (positif)
Hingga sekarang, hampir sebagian besar penelitian di bidang sentiment analysis hanya ditujukan untuk Bahasa Inggris karena memang Tools/Resources untuk bahasa inggris sangat banyak sekali. Beberapa resources yang sering digunakan untuk sentiment analysis adalah SentiWordNet dan WordNet.

Sentiment analysis terdiri dari 3 subproses besar [2]. Masing-masing subproses ini bisa kita jadikan bahan/topik riset secara terpisah karena masing-masing subproses ini membutuhkan teknik yang tidak mudah :
  1. Subjectivity Classification
  2. Orientation Detection
  3. Opinion Holder and Target Detection
Subjectivity Classification - menentukan kalimat yang merupakan opini.
  • A bike has 2 wheels VS It is a good bike !

Orientation Detection - setelah berhasil diklasifikasi untuk kategori Opini, sekarang kita tentukan apakah dia positif, negatif, netral ?
  • It is a good bike ! VS ah, It is a bad bike !

Opinion Holder and Target Detection - menentukan bagian yang merupakan Opinion Holder dan bagian yang merupakan Target.
  • Harry said it is a good bike.

[1] Silakan gunakan search engine dengan kata kunci sentiment analysis B. Pang L. Lee
[2] Taras Zagibalov (slide) and J. Caroll. Automatic seed word selection for unsupervised sentiment classification of chinese text. In proceedings of the 22nd international conference on computational linguistics. vol 1, page 1073 (ACL)

9 komentar:

  1. Assalamualaikum,

    Fan, saya ikhsan if03 lagi ingin belajar terus searching2 nemu referensi dari Alfan. Boleh nanya2 kan :P, saya masih bingung nih untuk nentukan proses hasilin kesimpulan dari dokumen/fitur. Flow yang kepikiran saya tuh kayak gini :

    1. Analisis struktur kalimat pake post tagger
    2. Klasifikasikan dokumen pake model. model yang kebayang saya sih kayaknya bakal buat rule untuk menentukan positif/negatif. misal : jika ada kata sifat yang termasuk sifat negatif setelah kata benda maka sentimen dia akan negatif dst.
    3. Jadi tingkat kesuksesan dalam menentukan sentimen adalah penentuan struktur kalimat, kelengkapan dictionary (kata sifat negatif/positif), dan kelengkapan rule.

    Kira-kira bener gak tuh pendekatannya? atau ada saran untuk melengkapi/meningkatkan akurasi dari analisis sentimen ini?

    BalasHapus
  2. Ass, Mas saya mau membuat tesis tentang opinion mining dengan data set dokumen indonesia, kira2 mas Alfan punya tutorial ndak? kalo punya boleh disharing dong?

    BalasHapus
  3. Baru ngunjungi blognya mas Alfan, mantap tulisannya. Penjelasannya singkat tapi sangat jelas.

    Mas, aktifin lagi dong nulisnya. :)

    BalasHapus
  4. nice ajoy... kalo dah selesai study nya balik ke indo g??

    BalasHapus
  5. thanks for sharing

    BalasHapus
  6. makasi untuk postingannya..sangat membantu saya dalam mencari materi TA saya..sekali lagi terima kasih banyak.. :)

    BalasHapus
    Balasan
    1. Jika butuh corpus untuk sentiment analysis (berbahasa indonesia)

      http://alfan-farizki.blogspot.kr/2013/03/movie-review-corpus-berbahasa-indonesia.html

      Hapus
  7. Hallo Mas Alfan saya salah satu Mahasiswa Universitas Gunadarma Jurusan TI, saya sudah mengirimkan email ... Mohoon bantuannya ya untuk menjawab pertanyaan saya... Terimakasi Mas

    BalasHapus