Implementasi Web Document Clustering Dengan Menggunakan Metode Suffix Tree Clustering

Marsetio, Lenny (2004) Implementasi Web Document Clustering Dengan Menggunakan Metode Suffix Tree Clustering. [Undergraduate thesis]

[thumbnail of TI_531_Abstrak.pdf]
Preview
PDF
TI_531_Abstrak.pdf

Download (71kB) | Preview
Official URL / DOI: http://digilib.ubaya.ac.id/pustaka.php/137385

Abstract

Kemajuan teknologi internet telah memberikan dampak pada ketersediaan informasi melalui web yang begitu pesat. Demikian pula, jumlah informasi yang tersedia pada situs web bertambah secara cepat. Di sisi lain informasi yang dapat diperoleh dari web search engine merupakan semua hal yang berkaitan dengan kata kunci yang dicari. Hal ini menyebabkan pengguna terpaksa menyaring untuk mendapatkan dokumen yang relevan. Oleh karena itu diperlukan cara untuk mengelompokkan (clustering) banyaknya informasi yang tersedia, yang dibutuhkan pengguna sehingga memudahkan pengguna untuk mendapatkan dokumen yang diinginkan. Dalam tugas akhir ini dibuat perangkat lunak untuk mengelompokkan dokumen web dengan menggunakan metode Suffu Tree Clustering. Metode ini menggunakan algoritma suffix tree dalam mengidentifikasikan secara efisien sekumpulan dokumen yang berbagi frase, dan menggunakan informasi tersebut untuk membuat kelompok dan meringkas kesimpulan yang berupa kelompok gabungan yang akan diberikan ke pengguna. Metode ini dilakukan dengan cara persiapan dokumen, pembersihan dokumen, pembuatan suffix tree, pengidentifikasian kelompok dasar, penggabungan kelompok dasar menjadi kelompok gabungan, pemberian nilai terhadap kelompok gabungan. Perangkat lunak yang dibuat menerima masukan berupa dokumen web hasil pencarian dari web search engine tertentu berdasarkan kata kunci yang diberikan pengguna. Dari hasil yang diperoleh tadi, kemudian dilakukan proses pengelompokan dengan menggunakan algoritma suffix tree. Setelah dilakukan pemrosesan, hasil pengelompokan tersebut ditampilkan pada pengguna. Perangkat lunak tersebut telah dilakukan ujicoba verifikasi untuk mengetahui kesalahan yang mungkin terjadi. Uji coba ini dilakukan dengan menggunakan berbagai kata kunci dan jumlah dokumen maksimal yang bervariasi. Hasil uji coba menunjukkan bahwa jumlah maksimal pencarian mempengaruhi waktu yang diperlukan untuk mengelompokkan dokumen. Selain itu, adanya parameter (ex) untuk mencari kemiripan dokumen, dari basil uji coba menunjukkan bahwa nilai 0.6 merupakan paramater yang optimal karena untuk nilai yang lebih dan kurang dari 0.6 kenaikan jumlah kelompok relatif kecil.

Item Type: Undergraduate thesis
Subjects: Q Science > QA Mathematics > QA75 Electronic computers. Computer science
Divisions: Faculty of Engineering > Department of Informatic
Depositing User: Sugiarto
Date Deposited: 08 Apr 2014 07:28
Last Modified: 08 Apr 2014 07:29
URI: http://repository.ubaya.ac.id/id/eprint/10188

Actions (login required)

View Item View Item