Klasifikasi Data URL Dengan Menggunakan K-Nearest Neghbor (KNN) untuk Deteksi Hishing Website
DOI:
https://doi.org/10.60036/ab6g2a89Keywords:
Phising, Klasifikasi URL, KNN, K-Nearest Neighbor, Machine Learning, confusion matrixAbstract
Phishing merupakan salah satu bentuk ancaman keamanan siber yang sering terjadi
dengan memanfaatkan URL palsu. Penelitian ini bertujuan untuk melakukan klasifikasi
terhadap URL yang berpotensi sebagai phishing menggunakan metode K-Nearest Neighbor
(KNN). Dataset yang digunakan memiliki tiga fitur utama: panjang URL, panjang hostname,
dan panjang path, serta label target berupa kategori phishing (1) atau bukan phishing (0).
Dengan melakukan preprocessing dan normalisasi data, model KNN diimplementasikan dan
dievaluasi menggunakan confusion matrix dan classification report. Hasil evaluasi
menunjukkan akurasi sebesar 59% dengan distribusi performa yang tidak seimbang pada
masing-masing kelas. Meskipun hasilnya belum optimal, pendekatan ini menunjukkan
potensi dalam mendeteksi phishing berbasis karakteristik URL.
References
1. UCI Machine Learning Repository. https://archive.ics.uci.edu/
2. OpenML. https://www.openml.org/
3. Kaggle Datasets. https://www.kaggle.com/datasets
4. Pedregosa et al., Scikit-learn: Machine Learning in Python, JMLR 2011
Downloads
Published
Issue
Section
License
Copyright (c) 2025 Fartiwi Angreini, Adlian Jefiza (Author)

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
