Klasifikasi Data URL Dengan Menggunakan K-Nearest Neghbor (KNN) untuk Deteksi Hishing Website

Authors

  • Fartiwi Angreini Teknik Mekatronika, Teknik Elektro, Politeknik Negeri Batam Author
  • Adlian Jefiza Politeknik Negeri Batam Author

DOI:

https://doi.org/10.60036/ab6g2a89

Keywords:

Phising, Klasifikasi URL, KNN, K-Nearest Neighbor, Machine Learning, confusion matrix

Abstract

Phishing merupakan salah satu bentuk ancaman keamanan siber yang sering terjadi 
dengan memanfaatkan URL palsu. Penelitian ini bertujuan untuk melakukan klasifikasi 
terhadap URL yang berpotensi sebagai phishing menggunakan metode K-Nearest Neighbor 
(KNN). Dataset yang digunakan memiliki tiga fitur utama: panjang URL, panjang hostname, 
dan panjang path, serta label target berupa kategori phishing (1) atau bukan phishing (0). 
Dengan melakukan preprocessing dan normalisasi data, model KNN diimplementasikan dan 
dievaluasi menggunakan confusion matrix dan classification report. Hasil evaluasi 
menunjukkan akurasi sebesar 59% dengan distribusi performa yang tidak seimbang pada 
masing-masing kelas. Meskipun hasilnya belum optimal, pendekatan ini menunjukkan 
potensi dalam mendeteksi phishing berbasis karakteristik URL. 

References

1. UCI Machine Learning Repository. https://archive.ics.uci.edu/

2. OpenML. https://www.openml.org/

3. Kaggle Datasets. https://www.kaggle.com/datasets

4. Pedregosa et al., Scikit-learn: Machine Learning in Python, JMLR 2011

Downloads

Published

2025-12-29