Analisis Aplikasi Peringkas Teks Berita Otomatis Menggunakan Metode Term Frequency Inverse Document Frequency

Abstract

Dalam media internet, berita merupakan suatu pengetahuan informasi dari kumpulan fakta. Perkembangan teknologi media internet berdampak pada bertambahnya jumlah situs berita dan menciptakan ledakan informasi. Membaca teks berita secara keseluruhan akan membutuhkan waktu yang sangat lama untuk mendapatkan informasi penting. Peringkas teks otomatis (auto text summarization) menawarkan solusi untuk membatu mendapatkan informasi penting dengan membaca berita dalam bentuk ringkasan (summary). Dengan adanya ringkasan, proses mendapatkan informasi dalam suatu berita akan didapatkan dengan waktu yang cepat dengan cara mengambil isi paling penting dari teks berita. Penelitian ini menggunakan data berita dari situs resmi Universitas Padjadjaran. Penelitian diawali dengan tahap preprocessing, feature selection, dan pembobotan tf-idf. penelitian ini melakukan evaluasi dengan cara membandingkan hasil ringkasan aplikasi dan hasil ringkasan manual. Penelitian ini menghasilkan sebuah ringkasan secara otomatis dengan tingkat kompresi sebesar 50% memiliki nilai accuracy sebesar 64,06%, rata-rata nilai recall sebesar 67% rata-rata nilai precision sebesar 64%, dan nilai rata-rata f-measure sebesar 0,65 yang berarti hasil ringkasan aplikasi memiliki kesamaan sebesar 65% dengan hasil ringkasan manual.

Description

Keywords

Berita, Confusion Matrix, Peringkas Teks Otomatis

Citation