Stemming teks sor-singgih Bahasa Bali
Abstract
Bahasa Bali memiliki tingkatan penggunaanya yaitu Bali Alus, Bali Madya dan Bali Kasar yang lebih dikenal dengan sor-singgih Bahasa Bali. Text mining menggunakan dokumen Bahasa Bali merupakan suatu tantangan karena sor-singgih Bahasa Bali tersebut. Sor-singih Bahasa Bali menyebabkan masalah pada hasil stemming, karena setiap level Bahasa memiliki kata dasar sendiri – sendiri tetapi memiliki sematik yang sama. Sehingga, dimensi kata dasar akan menjadi sangat banyak pada saat proses text mining. Pada penelitian ini, akan dikembangkan algoritma stemming khusus untuk Bahasa Bali dalam menanggani sor-singgih pada dukumen bahasa Bali. Pada proses stemming algoritma yang akan digunakan yaitu algoritma Porter Stemmer for Bahasa Indonesia yang disesuaikan kembali dengan morfologi dan Afiks dari bahasa Bali dan juga akan disediakan padanan kata dasar dari Bahasa Bali sor-singgih dengan bahasa Indonesia. Dari hasil pengujian 85% kata distemming dengan benar. Hasil dari stemming yang berupa kata dasar kemudian ditranslate / dicarikan padanannya dengan bahasa Indonesia.