Apa itu Sentiment Analysis / Opinion Mining ?
Opinion Mining / Sentiment Analysis (sebagian besar researcher menganggap dua istilah ini sama/interchangeable) merupakan sebuah cabang penelitian di domain Text Mining yang mulai booming pada awal tahun 2002-an. Riset-nya mulai marak semenjak paper dari B.Pang dan L.Lee [1] keluar. Secara umum, Sentiment analysis ini dibagi menjadi 2 kategori besar :
Fined-grained sentiment analysis - kategori kedua ini yang sedang Naik Daun sekarang. Maksudnya adalah para researcher sebagian besar fokus pada jenis ini. Obyek yang ingin diklasifikasi bukan berada pada level dokumen melainkan sebuah kalimat pada suatu dokumen.
contoh :
Sentiment analysis terdiri dari 3 subproses besar [2]. Masing-masing subproses ini bisa kita jadikan bahan/topik riset secara terpisah karena masing-masing subproses ini membutuhkan teknik yang tidak mudah :
Orientation Detection - setelah berhasil diklasifikasi untuk kategori Opini, sekarang kita tentukan apakah dia positif, negatif, netral ?
Opinion Holder and Target Detection - menentukan bagian yang merupakan Opinion Holder dan bagian yang merupakan Target.
[1] Silakan gunakan search engine dengan kata kunci sentiment analysis B. Pang L. Lee
[2] Taras Zagibalov (slide) and J. Caroll. Automatic seed word selection for unsupervised sentiment classification of chinese text. In proceedings of the 22nd international conference on computational linguistics. vol 1, page 1073 (ACL)
Opinion Mining / Sentiment Analysis (sebagian besar researcher menganggap dua istilah ini sama/interchangeable) merupakan sebuah cabang penelitian di domain Text Mining yang mulai booming pada awal tahun 2002-an. Riset-nya mulai marak semenjak paper dari B.Pang dan L.Lee [1] keluar. Secara umum, Sentiment analysis ini dibagi menjadi 2 kategori besar :
- Coarse-grained sentiment analysis
- Fined-grained sentiment analysis
Fined-grained sentiment analysis - kategori kedua ini yang sedang Naik Daun sekarang. Maksudnya adalah para researcher sebagian besar fokus pada jenis ini. Obyek yang ingin diklasifikasi bukan berada pada level dokumen melainkan sebuah kalimat pada suatu dokumen.
contoh :
- Saya tidak suka programming. (negatif)
- Hotel yang baru saja dikunjungi sangat indah sekali. (positif)
Sentiment analysis terdiri dari 3 subproses besar [2]. Masing-masing subproses ini bisa kita jadikan bahan/topik riset secara terpisah karena masing-masing subproses ini membutuhkan teknik yang tidak mudah :
- Subjectivity Classification
- Orientation Detection
- Opinion Holder and Target Detection
- A bike has 2 wheels VS It is a good bike !
Orientation Detection - setelah berhasil diklasifikasi untuk kategori Opini, sekarang kita tentukan apakah dia positif, negatif, netral ?
- It is a good bike ! VS ah, It is a bad bike !
Opinion Holder and Target Detection - menentukan bagian yang merupakan Opinion Holder dan bagian yang merupakan Target.
- Harry said it is a good bike.
[1] Silakan gunakan search engine dengan kata kunci sentiment analysis B. Pang L. Lee
[2] Taras Zagibalov (slide) and J. Caroll. Automatic seed word selection for unsupervised sentiment classification of chinese text. In proceedings of the 22nd international conference on computational linguistics. vol 1, page 1073 (ACL)
Assalamualaikum,
BalasHapusFan, saya ikhsan if03 lagi ingin belajar terus searching2 nemu referensi dari Alfan. Boleh nanya2 kan :P, saya masih bingung nih untuk nentukan proses hasilin kesimpulan dari dokumen/fitur. Flow yang kepikiran saya tuh kayak gini :
1. Analisis struktur kalimat pake post tagger
2. Klasifikasikan dokumen pake model. model yang kebayang saya sih kayaknya bakal buat rule untuk menentukan positif/negatif. misal : jika ada kata sifat yang termasuk sifat negatif setelah kata benda maka sentimen dia akan negatif dst.
3. Jadi tingkat kesuksesan dalam menentukan sentimen adalah penentuan struktur kalimat, kelengkapan dictionary (kata sifat negatif/positif), dan kelengkapan rule.
Kira-kira bener gak tuh pendekatannya? atau ada saran untuk melengkapi/meningkatkan akurasi dari analisis sentimen ini?
Ass, Mas saya mau membuat tesis tentang opinion mining dengan data set dokumen indonesia, kira2 mas Alfan punya tutorial ndak? kalo punya boleh disharing dong?
BalasHapusBaru ngunjungi blognya mas Alfan, mantap tulisannya. Penjelasannya singkat tapi sangat jelas.
BalasHapusMas, aktifin lagi dong nulisnya. :)
nice ajoy... kalo dah selesai study nya balik ke indo g??
BalasHapusthanks for sharing
BalasHapusmakasi untuk postingannya..sangat membantu saya dalam mencari materi TA saya..sekali lagi terima kasih banyak.. :)
BalasHapusJika butuh corpus untuk sentiment analysis (berbahasa indonesia)
Hapushttp://alfan-farizki.blogspot.kr/2013/03/movie-review-corpus-berbahasa-indonesia.html
Hallo Mas Alfan saya salah satu Mahasiswa Universitas Gunadarma Jurusan TI, saya sudah mengirimkan email ... Mohoon bantuannya ya untuk menjawab pertanyaan saya... Terimakasi Mas
BalasHapus