Marsetio, Lenny (2004) Implementasi Web Document Clustering Dengan Menggunakan Metode Suffix Tree Clustering. [Undergraduate thesis]
Preview |
PDF
TI_531_Abstrak.pdf Download (71kB) | Preview |
Abstract
Kemajuan teknologi internet telah memberikan dampak pada ketersediaan informasi melalui web yang begitu pesat. Demikian pula, jumlah informasi yang tersedia pada situs web bertambah secara cepat. Di sisi lain informasi yang dapat diperoleh dari web search engine merupakan semua hal yang berkaitan dengan kata kunci yang dicari. Hal ini menyebabkan pengguna terpaksa menyaring untuk mendapatkan dokumen yang relevan. Oleh karena itu diperlukan cara untuk mengelompokkan (clustering) banyaknya informasi yang tersedia, yang dibutuhkan pengguna sehingga memudahkan pengguna untuk mendapatkan dokumen yang diinginkan. Dalam tugas akhir ini dibuat perangkat lunak untuk mengelompokkan dokumen web dengan menggunakan metode Suffu Tree Clustering. Metode ini menggunakan algoritma suffix tree dalam mengidentifikasikan secara efisien sekumpulan dokumen yang berbagi frase, dan menggunakan informasi tersebut untuk membuat kelompok dan meringkas kesimpulan yang berupa kelompok gabungan yang akan diberikan ke pengguna. Metode ini dilakukan dengan cara persiapan dokumen, pembersihan dokumen, pembuatan suffix tree, pengidentifikasian kelompok dasar, penggabungan kelompok dasar menjadi kelompok gabungan, pemberian nilai terhadap kelompok gabungan. Perangkat lunak yang dibuat menerima masukan berupa dokumen web hasil pencarian dari web search engine tertentu berdasarkan kata kunci yang diberikan pengguna. Dari hasil yang diperoleh tadi, kemudian dilakukan proses pengelompokan dengan menggunakan algoritma suffix tree. Setelah dilakukan pemrosesan, hasil pengelompokan tersebut ditampilkan pada pengguna. Perangkat lunak tersebut telah dilakukan ujicoba verifikasi untuk mengetahui kesalahan yang mungkin terjadi. Uji coba ini dilakukan dengan menggunakan berbagai kata kunci dan jumlah dokumen maksimal yang bervariasi. Hasil uji coba menunjukkan bahwa jumlah maksimal pencarian mempengaruhi waktu yang diperlukan untuk mengelompokkan dokumen. Selain itu, adanya parameter (ex) untuk mencari kemiripan dokumen, dari basil uji coba menunjukkan bahwa nilai 0.6 merupakan paramater yang optimal karena untuk nilai yang lebih dan kurang dari 0.6 kenaikan jumlah kelompok relatif kecil.
Item Type: | Undergraduate thesis |
---|---|
Subjects: | Q Science > QA Mathematics > QA75 Electronic computers. Computer science |
Divisions: | Faculty of Engineering > Department of Informatic |
Depositing User: | Sugiarto |
Date Deposited: | 08 Apr 2014 07:28 |
Last Modified: | 08 Apr 2014 07:29 |
URI: | http://repository.ubaya.ac.id/id/eprint/10188 |
Actions (login required)
View Item |