Meringkas artikel kini bisa dilakukan dengan bantuan komputer. Sebuah terobosan yang membuat penulis tidak terlalu pusing dengan aktivitas manual.

Meringkas artikel merupakan salah satu kegiatan yang sering kita lakukan. Di tingkat sekolah menengah, meringkas dapat menjadi salah satu jenis tugas favorit para guru bagi murid-muridnya. Di bidang sastra, sinopsis merupakan bentuk ringkasan yang memberikan gambaran singkat bagi sebuah novel. Bahkan di jaman internet seperti sekarang, di mana volume informasi yang ada sangat besar, ringkasan menjadi hal yang esensial untuk menentukan informasi yang paling cocok untuk kebutuhan tertentu.

Saat ini, meringkas memang masih banyak dilakukan oleh manusia, dengan hasil yang cukup memuaskan. Namun, ternyata mesin pun dapat melakukan kegiatan meringkas ini, walaupun hasilnya tidak sebaik buatan manusia. Lalu, untuk apakah ringkasan hasil buatan mesin? Kelebihan ringkasan oleh mesin terletak pada sisi kecepatannya. Jika Anda pernah mencoba membuka situs Google News , Anda akan menjumpai banyak topik berita yang dikumpulkan dari berbagai situs serta dirangkum dalam satu tempat. Inilah salah satu aplikasi dari peringkasan otomatis.

Otomatis

Penelitian mengenai peringkasan otomatis sendiri telah dimulai setidaknya pada tahun 1958 oleh H.P. Luhn. Banyak penelitian lain pun dilakukan dengan memperbaiki kelemahan-kelemahan metode yang lama, selain memanfaatkan kekuatan komputasi yang semakin tinggi seiring perkembangan teknologi perangkat keras. Beberapa penelitian lainnya dilakukan oleh Kupiec pada tahun 1995 serta Teufel dkk pada tahun 1997. Penelitian peringkasan otomatis juga telah dilakukan untuk bahasa-bahasa selain bahasa Inggris. Untuk bahasa Indonesia, Sitawati mengadaptasi metode peringkasan ini ke bahasa Indonesia pada tahun 2005. Selain itu, Alfadian juga melakukan penelitian lainnya pada tahun 2007.

Lalu, bagaimana cara mesin bisa mengetahui bagian-bagian mana yang harus diringkas dari sebuah artikel? Prinsip yang paling sering digunakan adalah penghilangan kalimat yang tidak penting. Dengan kata lain, mesin tidak akan membuat kalimat baru pada ringkasan. Bandingkan dengan ringkasan manual yang dapat menggabungkan dua kalimat atau lebih menjadi satu kalimat.

Untuk menentukan kalimat mana yang harus dihilangkan, setiap kalimat akan diberikan sebuah nilai yang menunjukkan seberapa penting kalimat tersebut dalam artikel. Jelas bahwa kalimat yang memiliki nilai yang rendah mendapat prioritas untuk dihilangkan dari artikel.

Metode

Cara menilai pentingnya sebuah kalimat pun bisa bermacam-macam. Salah satu cara yang paling sering dilakukan dan terbukti efektif adalah dengan menggunakan metode kata kunci (keyword). Pertama-tama, mesin akan mengekstraksi kata kunci-kata kunci yang terdapat pada artikel. Misalnya, artikel mengenai kesehatan dapat mengandung kata kunci seperti “pencernaan”, “olah raga”, “sistem saraf”, dan sebagainya. Nah, kalimat-kalimat yang banyak mengandung kata kunci tersebut akan mendapatkan nilai lebih. Metode ekstraksi kata kunci ini pun bermacam-macam dan sering menjadi topik penelitian tersendiri di luar peringkasan otomatis. Cara termudah adalah dengan menghitung jumlah kemunculan kata tersebut dalam artikel. Semakin banyak kata tersebut muncul dalam artikel maka dianggap kata tersebut cukup penting dan layak dijadikan kata kunci. Namun, metode ini masih memiliki kelemahan. Kata-kata yang sering muncul belum tentu menandakan bahwa kata tersebut penting. Sebagai contoh, kata “yang” atau “dan” akan sering muncul di setiap artikel. Kata-kata seperti ini sering disebut dengan stopwords.

Selain metode di atas, masih banyak pula metode-metode lain yang dapat digunakan. Walau begitu, tetap saja hasilnya masih kalah bagus dengan ringkasan buatan manusia. Singkat kata, peringkas otomatis menawarkan kecepatan daripada ketepatan.