SEMARANG- Dosen Teknik Informatika Universitas Bina Darma Palembang Ari Muzakir MCs berhasil meraih gelar Doktor usai mempertahankan disertasinya pada sidang terbuka ujian disertasi Program Studi Doktor Sistem Informasi (DSI) Universitas Diponegoro (Undip) pada Senin, 5 Agustus 2024 di Gedung TTB A Sekolah Pascasarjana Undip.
Dr Ari Muzakir MCs melakukan penelitian disertasi dengan judul “Klasifikasi Teks Ujaran Kebencian Berbahasa Indonesia Menggunakan Fusion of Semantic Enrichment And Convolution Neural Network (FuSE-CNN)”.
Tim Penguji terdiri dari Prof Ir Mochamad Agung Wibowo MM MSc PhD (Dekan Pascasarjana Undip), Prof Dr Rahmat Gernowo MSi (Kaprodi DSI Undip), Prof Dr Kusworo Adi SSi MT (Promotor), Dr Retno Kusumaningrum SSi MKom (Co Promotor), Prof Dr Ir R Rizal Isnanto ST MM MT IPU ASEAN Eng (Penguji 1), Dr Eng Adi Wibowo SSI MKom (Penguji 2), dan Prof Dr Ridwan Sanjaya SE SKom MS IEC sebagai Penguji Eksternal dari Unika Soegijapranata.
Menurut Dr Ari Muzakir bahwa perkembangan teknologi digital telah mempermudah produksi dan penyebaran konten ujaran kebencian dengan biaya rendah, waktu nyata, dan terdistribusi secara anonimitas. Identifikasi kalimat menggunakan pola kalimat dapat menjadi strategi efektif untuk mengenali ujaran kebencian yang tersebar di media sosial “X” (Twitter) dalam bentuk teks singkat.
“Pola kalimat ujaran kebencian umumnya melibatkan target, kategori, dan level yang sulit diidentifikasi karena keterbatasan semantik dan informasi kontekstual yang tidak jelas, serta berdampak pada kinerja klasifikasi dengan data berlabel jamak. Pendekatan konvensional umumnya melakukan ekstraksi fitur semantik secara terpisah, sehingga menyebabkan model sulit menangkap konteks makna yang kompleks dalam teks ujaran kebencian. Pendekatan ini seringkali gagal memperhitungkan konteks yang mendasari ujaran kebencian,” unkap Dr Ari Muzakir.
Lebih lanjut pengembangan metode yang mampu mengintegrasikan dan memahami konteks secara luas menjadi krusial dalam mengatasi tantangan ini melalui strategi penggabungan yang berbeda. Penelitian ini bertujuan mengembangkan pendekatan baru untuk meningkatkan kinerja klasifikasi ujaran kebencian pada data label jamak dengan menggunakan fusion of semantic enrichment and convolutional neural network (FuSE-CNN). Pendekatan FuSE menggabungkan beberapa strategi pemrosesan seperti terjemahan balik, disambiguasi teks, ekspansi, dan kemiripan semantik.
Ia menambahkan bahwa strategi ini memungkinkan model dapat mengidentifikasi makna yang lebih halus dari suatu kalimat melalui terjemahan balik, disambiguasi kata dan ekspansi teks untuk memperkaya makna, dan kemiripan semantik untuk mendapatkan konteks yang lebih mendalam. Sementara itu, CNN mengekstraksi fitur-fitur penting dari teks dan melakukan klasifikasi pada data berlabel jamak. Dataset yang digunakan bersumber dari media sosial “X” yang terdiri dari 13.169 baris dengan 12 label.
Tahapan penelitian meliputi prapengolahan, pengayaan semantik berbasis fusi, pembagian data (80/20), dan klasifikasi teks ujaran kebencian berlabel jamak. Kinerja model yang dihasilkan dievaluasi menggunakan confusion matrix dan AUC. Pelatihan model dilakukan dengan hyperparameter tuning yaitu learning rate, batch size, dan epoch untuk mendapatkan model terbaik, serta validasi pelatihan menggunakan k-fold=5. Model dengan kinerja terbaik diperoleh melalui strategi FuSE-CNN dengan parameter learning rate 0.001, batch size 16, dan epoch 30.
Hasil analisis model dengan kinerja terbaik pada strategi FuSE-CNN mencapai kinerja tinggi: precision 76%, recall 84%, F1-Score 80%, accuracy 93%, dan AUC 91%. Hasil ini mengungguli dari strategi tanpa FuSE dan metode klasifikasi lain seperti BiGRU dan BiLSTM. Misalnya pada strategi terjemahan balik yang menghasilkan precision 58%, recall 71%, F1-Score 64%, accuracy 86%, dan AUC 84%. Hasil ini melampaui kinerja penelitian sebelumnya yang menggunakan dataset yang sama tanpa strategi FuSE yang dievaluasi dengan metrik akurasi. Analisis pengujian pada aplikasi waktu nyata menunjukkan bahwa strategi FuSE-CNN sering mengalami kesalahan prediksi pada kelas Kategori ujaran kebencian. Model cenderung kesulitan mengenali dan mengklasifikasikan berbagai kategori kebencian yang kompleks dan sering kali tumpang tindih.