Pendekatan Rule Handmade untuk Menentukan Klausa Bahasa Indonesia
Abstract
Penelitian yang dilakukan dalam paper ini adalah pembentukan klausa sebuah kalimat Bahasa Indonesia, dengan memanfaatkan teknik chunking RegexpParser dari Natural Language Toolkit dan Rule Based System. Langkah pertama yang dilakukan dalam penelitian ini adalah mengubah level kata hasil part of speech menjadi 5 level frasa, yaitu: NP (Noun Phrase), VP (Verb Phrase), PP (Preposition Phrase), AP (Adjective Phrase) dan ADVP (Adverb Phrase). Mengingat klausa merupakan bagian kalimat yang minimal memiliki unsur Subjek dan Predikat, maka langkah kedua adalah merubah 5 level frasa dengan melihat fungsi dan kedudukannya terhadap kalimat menjadi Subjek (Subj), Predikat (P), Objek (O), Keterangan (K) dan Pelengkap (PEL). Penelitian ini mencapai akurasi hingga 95,3% dan error 4,7% dari 100 kalimat (820 kata) yang telah di ujicoba dengan menggunakan 101 rule. Terjadinya error ini disebabkan tidak adanya rule yang tepat untuk memproses hasil part of speech.