My Live Journals

Selasa, 14 November 2017

Daftar Tutorial Deep Learning untuk NLP

Link berikut berisi tutorial Deep Learning untuk Natural Language Processing (NLP). Tutorial akan memperkenalkan terlebih dahulu konsep dari deep learning, yang langsung dikhususkan untuk NLP atau pemrosesan data tekstual secara umum. Kemudian, tutorial akan menyampaikan isu yang sedang ramai diperbincangkan di NLP saat itu, yaitu terkait Distributed Semantic Model. Setelah itu, Tutorial akan berisi sesi hands-on untuk mencoba mengimplementasikan beberapa arsitektur Deep Learning dasar yang biasa digunakan pada NLP. Hands-on akan menggunakan tools berupa Python 2, Tensorflow, dan Gensim.

Berikut adalah link tutorial ini:

http://ir.cs.ui.ac.id/alfan/tutorial/list.html

--
Alfan F. Wicaksono
26 Safar 1439 H/15 November 2017

Tutorial Latent Dirichlet Allocation (LDA) dengan Gensim dan Salah Satu Aplikasi-nya

Kita sudah mengetahui bersama bahwa Latent Dirichlet Allocation (LDA) adalah sebuah metode untuk mendeteksi topik-topik yang ada pada koleksi dokumen beserta proporsi kemunculan topik tersebut, baik di koleksi maupun di dokumen tertentu. LDA juga mampu mengasosiasikan kata-kata yang ada pada dokumen dan koleksi ke topik tertentu. Pada tutorial kali ini, kita akan mencoba menggunakan LDA untuk mendeteksi topik-topik yang ada pada kumpulan tweet. Kita dapat bayangkan bahwa ada banyak sekali tweet yang dihasilkan oleh pengguna dalam waktu 1 menit, bahkan 1 detik. Dalam durasi waktu yang singkat tersebut, berbagai macam tweet dari berbagai macam topik bertumpuk menjadi satu tanpa ada pemisah. Tentunya, mengetahui distribusi topik (yang tersembunyi) pada kumpulan tweet tersebut akan sangat berguna untuk mengorganisasikan, memahami, bahkan membuat summary dari apa-apa yang "diperbincangkan" pada kumpulan tweet tersebut.

Tutorial kali ini bukanlah untuk memahami apa yang terjadi di dalam LDA, tetapi lebih kepada aplikasi LDA untuk deteksi topik pada data microblog.

Berikut adalah link dari tutorial tersebut:

http://ir.cs.ui.ac.id/alfan/tutorial/tutorial_lda.html

Alfan F. Wicaksono

26 Safar 1439H/Rabu 15 November 2017

Minggu, 15 November 2015

Mini Workshop: Simple Classifier for Determining The Sentiment Orientation of A Review Sentence

Last week, Faculty of Computer Science (UI) successfully held mini workshop on big data analytics as part of joint collaboration between UI and Deakin University. One of the topics addressed at this mini workshop was about sentiment analysis from social media. I was the speaker on the Hands-On session at this mini workshop.

I delivered a tutorial on how to build a simple classifier for automatically determining the sentiment orientation of a review sentence. Sentiment orientation of an opinionated sentence can be positive or negative. This tutorial would be beneficial for those who want to learn a simple text classification problem, that is, sentiment orientation classification.

If you are interested in this tutorial, you can download the instructions as well as the dataset and resources used in this tutorial:

This tutorial will require you to do several steps:

Make sure you have Python installed on your PC since we are going to do fun programming using Python language as an interface.
After you have successfully installed Python, you need to install NLTK package. If you install Python using Anaconda Python Distribution, then you don't need this step since Anaconda includes more than 300 of the famous Python packages (including NLTK).

--
Ditulis di Bekasi, Indonesia
3 Safar 1437 H (15 November 2015)