出版社:Indonesia Association of Computational Linguistics (INACL)
摘要:Normalisasi merupakan salah satu tahapan text preprocessing dalam Natural Language Processing. Pengaruh normalisasi dengan kamus normalisasi dalam analisis sentimen berbahasa Indonesia belum diketahui. Dengan membandingkan data yang tidak dinormalisasi dan data yang dinormalisasi dari beberapa dataset, penelitian ini bertujuan untuk mengetahui bagaimana pengaruh normalisasi dan pengaruh kamus yang digunakan dalam analisis sentimen. Kamus yang digunakan pada penelitian ini antara lain Colloquial Indonesian Lexicon dan modul formalizer pada INANLP. Sebagai kontrol, dalam analisis sentimen, metode klasifikasi Multinomial Naïve Bayes diterapkan pada seluruh dataset. Performa dari delapan dataset kemudian dianalisis dan diuji secara statistik. Akurasi, presisi, dan recall diuji dengan menggunakan uji wilcoxon signed rank test untuk menentukan apakah normalisasi mampu meningkatkan performa dari analisis sentimen. Dari hasil uji hipotesis diperoleh bahwa hasil uji keseluruhan dari performa kamus menunjukkan nilai p-value kurang dari 0,05. Dengan begitu, normalisasi pada analisis sentimen berbahasa indonesia tidak menyebabkan kenaikan performa dari indikator akurasi, presisi, dan recall.