ABSTRACTIVE TEXT SUMMARIZATION PADA ULASAN BUKU BERBAHASA INDONESIA MENGGUNAKAN METODE SEQUENCE-TO-SEQUENCE LSTM DAN PEGASUS
No Thumbnail Available
Date
2023-07-10
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Berdasarkan hasil riset World’s Most Literate Nations Ranked, Indonesia berada pada tingkat 60 dari 61 negara dalam hal minat membaca. Salah satu cara agar menyukai membaca adalah dengan menemukan bacaan yang diinginkan dengan tepat. Melalui ulasan buku pada media yang bernama GoodReads, masyarakat dapat mengenal lebih dalam isi bahasan dalam sebuah buku. Sayangnya beberapa ulasan buku tersebut sangat panjang. Sehingga diperlukan sistem peringkasan teks untuk meringkas hal tersebut. Dengan maksud agar mudah memahami inti dari tiap ulasan dari banyaknya ulasan yang ada.
Penelitian ini mengimplementasikan Abstractive Summarization dengan model Sequence-to-Sequence pada LSTM dan BiLSTM juga dengan metode fine- tuning model PEGASUS. Keduanya dilatih dengan dataset data ulasan buku Berbahasa Indonesia dari situs GoodReads dan dataset benchmark yaitu IndoSum. Serta juga mengembangkan sebuah Web App yang bekerja untuk meringkas teks menggunakan model yang telah dibangun.
Didapatkan hasil terbaik dari metode Seq2Seq LSTM yaitu dengan menggunakan jenis Bidirectional LSTM (BiLSTM), tiga lapisan, dan attention mechanism. Kemudian pada metode fine-tuning PEGASUS didapati hasil terbaik dengan data pelatihan sebanyak 4000 data dan pelatihan sebanyak 10 epoch. Dari kedua metode tersebut, hasil yang terbaik adalah model PEGASUS yang dilatih menggunakan dataset benchmark (IndoSum) yaitu ROUGE-1 sebesar 0.74 dan ROUGE-2 0.67. Skor hasil model PEGASUS lebih tinggi dibandingkan dengan skor yang dihasilkan model LSTM dan BiLSTM.
Description
Keywords
Abstractive Summarization, Seq2Seq, LSTM