Kamis, 25 Maret 2010

Rencana riset kedepan : Indonesian "OpenNLP"

Sadar atau tidak, bahasa Indonesia merupakan bahasa yang digunakan oleh lebih dari 200 juta penduduk dan menyatukan seluruh penduduk Indonesia yang terdiri dari lebih 700 bahasa daerah. Oleh karena itu, kebutuhan penelitian dan aplikasi NLP bahasa Indonesia sangat tinggi sekali. Apalagi sekarang ini teknologi internet dan komputer sudah maju.

Tapi sayangnya penelitian NLP di Indonesia tidak begitu kelihatan dan masih terpisah-pisah....

Untuk itu, ada rencana untuk menggabungkan seluruh Tools Dev atau Hasil penelitian NLP bahasa Indonesia dari seluruh stake holder NLP Indonesia.

yang pertama adalah Pembentukan Indonesia OpenNLP. => rencana untuk menggabungkan seluruh tools NLP bahasa Indonesia menjadi satu kesatuan SDK.

tools ini nantinya berisi:
- tokenizer
- POS tagger bahasa indonesia
- NER bahasa indonesia
- Morphological Analyzer bahasa indonesia
- Parser
- dll....

Jadi, kalau ada temen-temen yang seneng ngoprek atau udah bikin salah satu toolsnya, dan mau di-share...
boleh ikutan...

tinggal kontak awak aja...

mari kita majukan NLP bahasa Indonesia yang merupakan identitas bangsa ini, jangan kalah sama Thai, Vietnam, dan beberapa negara ASEAN lain yang risetnya sangat gencar sekali...

3 komentar:

  1. mangstap gan. ntar ane ikutan turun, lagi bikin web scraper nih, messy abis.

    BalasHapus
  2. wah kebetulan banget.
    gw juga disuruh riset STEI yg mirip ini,
    disuruh bikin versi semantic webnya.
    bisa gak diskusi kapan2?

    BalasHapus
  3. Waduh, Para Master berkomentar, awak jadi malu...
    Awak hanya menyampaikan pesan dari teman-teman dari BPPT. kalau kang Ammar dan Kak Petra mau bantu, awak seneng banget...

    BalasHapus