Upload
others
View
8
Download
0
Embed Size (px)
Citation preview
15
BAB III
METODELOGI PENELITIAN
Inisialisasi Penelitian
3.1.1 Studi Literatur
Studi literatur merupakan acuan teori yang digunakan untuk mengerjakan sebuah
penelitian. Pada penelitian ini peneliti menggunakan metode improved k-nearest
neighbor yang ditemukan oleh Wei Yuan pada tahun 2004 [3].
3.1.2 Wawancara
Kegiatan wawancara dilakukan kepada sekertaris prodi teknik informatika institut
teknologi sumatera yaitu Bapak Amirul Iqbal, S.Kom,. M.Eng. mengenai
kurikulum dan kelompok keilmuan.
3.1.3 Pengumpulan Data
Pada tahapan ini peneliti akan mengumpulkan data yang digunakan dan
diolah untuk penelitian. Pengumpulan data akan dilakukan melalui sebuah
kuisioner. Target responden yaitu mahasiswa teknik informatika angkatan 2016
yang telah melakukan seminar proposal. Kriteria pemilihan responden yang telah
melakukan seminar proposal dikarenakan untuk mengetahui kelompok keilmuan
dari tugas akhir yang dikerjakan sudah pasti. Adapun data yang dikumpulkan
merupakan nilai-nilai mata kuliah wajib prodi teknik informatika.
Persiapan Data
3.2.1 Pembersihan Data
Pada tahapan ini akan dilakukan pemeriksaan mengenai kelengkapan data yang
dibutuhkan dan penghapusan data dupliklat.
3.2.2 Transformasi Data
Pada tahapan ini akan dilakukan penyesuain mata kuliah terkait perbedaan
mata kuliah wajib pada kurikulum 2016 yang disesuaikan dengan kurikulum 2020
dan konversi data penelitian menjadi bentuk data numerik. Hal ini diperlukan
supaya data dapat diolah pada tahapan selanjutnya. Pada tabel 3.1 merupakan
konversi data nilai yang akan digunakan dalam penelitian.
16
Tabel 3.1 Konversi Data Nilai
Nilai Konversi
A 4
AB 3,5
B 3
BC 2,5
C 2
D 1
E 0
Pada tabel 3.2 merupakan keterangan kode singkatan nama mata kuliah yang
digunakan dalam dataset penelitian ini.
Tabel 3.2 Data Mata Kuliah
Mata Kuliah Kode
Pengantar Teknologi Informasi B PTI
Dasar Pemrograman Daspro
Matriks dan Ruang Vektor MRV
Logika Informatika LogIf
Matematika Diskrit MD
Teori Bahasa Formal dan Otomata TBFO
Algoritma dan Struktur Data ASD
Organisasi dan Arsitektur Komputer OAK
Strategi Algoritma SA
Probabilitas dan Statistika PS
Basis Data BS
Pemrograman Berorientasi Objek PBO
Sistem Operasi SO
Dasar Rekayasa Perangkat Lunak DRPL
Inteligensi Buatan IB
Jaringan Komputer JK
Interaksi Manusia dan Komputer IMK
Sistem Informasi SI
Information Retrieval IR
Data Warehouse / Data Mining DM
Manajemen Basis Data MBD
Pengolahan Citra Digital PCD
Teknologi Basis Data TBD
17
Tabel 3.3 Data Mata Kuliah (Lanjutan)
Mata Kuliah Kode
Teknologi Game TG
Pengolahan Sinyal Digital PSD
Jaringan Komputer Lanjut JKL
Pengembangan Aplikasi Mobile PAM
Kriptografi KRPT
Pemrograman Web Web
Sistem Tertanam ST
Sistem / Teknologi Multimedia TM
Pemrograman Web Lanjut WebL
Pervasive Computing Pervasif
Keamanan Jaringan KEJAR
Manajemen Proyek Teknologi Informasi MPTI
Proyek Teknologi Informasi PPL
Sistem Informasi Lanjut SIL
Adapun penyesuain mata kuliah wajib 2016 yang disesuaikan dengan kurikulum
2020 dapat dilihat pada Tabel 3.4.
Tabel 3.4 Penyesuaian Mata Kuliah
Mata Kuliah Kurikulum 2020 Mata Kuliah Kurikulum 2016
Algoritma Pemrograman I Pengantar Teknologi Informasi B
Algoritma Pemrograman II Dasar Pemrograman
Matematika diskrit Logika Informatika
Matematika Diskrit
Penyesuain mata kuliah ini berdasarkan ekuivalensi antara kurikulum sebelumnya
dengan kurikulum 2020
Perancangan Sistem
Pada tahap ini dilakukan perancangan sistem yang akan diterapkan sebelum
diimplementasikan. Tahapan ini sebagai gambaran dari proses model klasifikasi
yang digunakan dalam penelitian. Perancangan sistem prediksi kelompok keilmuan
tugas akhir menggunakan metode KNN+ ditunjukkan pada Gambar 3.1.
18
Gambar 3.1 Perancangan Sistem
Pada perancangan sistem Gambar 3.1 terdiri dari 3 blok yaitu input, proses,
dan output. Input dari sistem ini berupa data nilai mata kuliah wajib teknik
informatika dan mata kuliah pilihan yang telah dikumpulkan dari kuisioner.
Kemudian pada tahap proses dilakukan pengolahan data dengan menggunakan
metode KNN+, dimana tahapan awal yaitu menghitung euclidean distance antara
data uji dengan semua data latih. Tahapan selanjutnya mengurutkan nilai euclidean
distance dari yang terkecil dan mengambil data latih yang memiliki jarak terdekat
sebanyak nilai k yang telah ditentukan.
Sebelum masuk ke tahap perhitungan nilai voting, akan terlebih dahulu
dicari koefisien korelasi data uji terhadap dataset untuk masing-masing kelompok
keilmuan dan nilai bobot setiap kelompok keilmuan yang dimiliki data uji. Nilai
bobot didapatkan dari perhitungan nilai mata kuliah yang tergolong pada suatu
kelompok keilmuan. Pada hasil perhitungan nilai voting dari masing-masing label,
nilai voting tertinggi/maksimal akan digunakan untuk menentukan label data uji[9].
Selanjutnya pada proses output yaitu sistem akan memberikan hasil prediksi
kelompok keilmuan tugas akhir pada mahasiswa.
3.3.1 Proses Klasifikasi Metode Improved k-Nearest Neighbor (KNN+)
Pada proses awal dari improved k-nearest neighbor tidak berbeda dengan
proses k-nearest neighbor yang biasa. Tahapan ini dimulai dengan perhitungan
jarak antara data latih dan data uji dengan menggunakan rumus euclidean distance.
Setelah didapatkan nilai euclidean distance, nilai tersebut diurutkan dari nilai
terkecil. Berikut ini diberikan sebuah contoh data yang akan menggambarkan
19
proses prediksi untuk memperjelas proses improved k-nearest neighbor. Pada tabel
3.5 dan tabel 3.6 merupakan contoh data latih dan data uji yang akan digunakan
dalam proses perhitungan. Pada Tabel 3.7 dan tabel 3.8 merupakan hasil konversi
data latih dan data uji ke bentuk data numerik untuk memudahkan proses
perhitungan.
20
Tabel 3.5 Contoh Data Latih
NO NIM Mata Kuliah Wajib IF
KK TA PTI Daspro MRV MD TBFO ASD OAK SA PS BD PBO SO DRPL IB JK IMK SI
1 2016-1 RPLSI D C B B B BC AB AB C B BC A B B A B A
2 2016-2 RPLSI AB AB B A AB A A A BC AB A A B BC A B A
3 2016-3 KSP C BC BC B A AB A A BC A AB AB C C AB BC AB
4 2016-4 AIDE C A B B B BC A B C BC BC B BC BC B AB A
5 2016-5 AIDE D D C C B BC B C C BC BC BC BC C B B AB
6 2016-6 RPLSI D D AB B A BC A A C B BC A BC B AB B A
7 2016-7 AIDE C B C BC BC BC A AB C AB A A BC C A C A
8 2016-8 AIDE BC A B AB A A A A AB A A A A B A AB A
9 2016-9 RPLSI D C BC C C C C D C C C BC AB C B BC BC
10 2016-10 KSP D D C C D BC C BC C C BC BC BC C BC BC B
11 2016-11 RPLSI D B B BC BC AB B BC B BC C B BC C A AB AB
12 2016-12 AIDE C B B AB C AB AB AB B AB B B BC B A A A
13 2016-13 KSP D BC B B C C C C D BC C B BC D B AB AB
14 2016-14 KSP C BC B AB B BC A B AB C BC BC C C A BC AB
Tabel 3.6 Contoh Data Uji
NO NIM KK TA PTI Daspro MRV MD TBFO ASD OAK SA PS BD PBO SO DRPL IB JK IMK SI
1 2016-20 ? C A B B BC AB A A C AB A A B C A BC AB
21
Tabel 3.7 Contoh data latih yang telah dikonversi
NO NIM Mata Kuliah Wajib IF
KK TA PTI Daspro MRV MD TBFO ASD OAK SA PS BD PBO SO DRPL IB JK IMK SI
1 2016-1 RPLSI 1 2 3 3 3 2,5 3,5 3,5 2 3 2,5 4 3 3 4 3 4
2 2016-2 RPLSI 3,5 3,5 3 4 3,5 4 4 4 2,5 3,5 4 4 3 2,5 4 3 4
3 2016-3 KSP 2 2,5 2,5 3 4 3,5 4 4 2,5 4 3,5 3,5 2 2 3,5 2,5 3,5
4 2016-4 AIDE 2 4 3 3 3 2,5 4 3 2 2,5 2,5 3 2,5 2,5 3 3,5 4
5 2016-5 AIDE 1 1 2 2 3 2,5 3 2 2 2,5 2,5 2,5 2,5 2 3 3 3,5
6 2016-6 RPLSI 1 1 3,5 3 4 2,5 4 4 2 3 2,5 4 2,5 3 3,5 3 4
7 2016-7 AIDE 2 3 2 2,5 2,5 2,5 4 3,5 2 3,5 4 4 2,5 2 4 2 4
8 2016-8 AIDE 2,5 4 3 3,5 4 4 4 4 3,5 4 4 4 4 3 4 3,5 4
9 2016-9 RPLSI 1 2 2,5 2 2 2 2 1 2 2 2 2,5 3,5 2 3 2,5 2,5
10 2016-10 KSP 1 1 2 2 1 2,5 2 2,5 2 2 2,5 2,5 2,5 2 2,5 2,5 3
11 2016-11 RPLSI 1 3 3 2,5 2,5 3,5 3 2,5 3 2,5 2 3 2,5 2 4 3,5 3,5
12 2016-12 AIDE 2 3 3 3,5 2 3,5 3,5 3,5 3 3,5 3 3 2,5 3 4 4 4
13 2016-13 KSP 1 2,5 3 3 2 2 2 2 1 2,5 2 3 2,5 1 3 3,5 3,5
14 2016-14 KSP 2 2,5 3 3,5 3 2,5 4 3 3,5 2 2,5 2,5 2 2 4 2,5 3,5
Tabel 3.8 Contoh data uji yang telah dikonversi
NO NIM Mata Kuliah Wajib IF
KK TA PTI Daspro MRV MD TBFO ASD OAK SA PS BD PBO SO DRPL IB JK IMK SI
1 2016-20 ? 2 4 3 3 2,5 3,5 4 4 2 3,5 4 4 3 2 4 2,5 3,5
22
3.3.1.1 Menghitung Euclidean Distance
Selisih jarak atau euclidean distance ini bertujuan untuk mengetahui
kedekatan nilai antara setiap data latih dan data uji. Proses perhitungan euclidean
distance dilakukan sebanyak jumlah data uji. Berikut ini merupakan salah satu
contoh mencari euclidean distance antara data uji pada Tabel 3.8 dengan data latih
pertama pada Tabel 3.7.
𝑑(1,1) =
√
(2 − 1)2 + (4 − 2)2 + (3 − 3)2 + (3 − 3)2 + (2,5 − 3)2 + (3,5 − 2,5)2 +(4 − 3,5)2 + (4 − 3,5)2 + (2 − 2)2 + (3,5 − 3)2 + (4 − 2,5)2 + (4 − 4)2 +
(3 − 3)2 + (2 − 3)2 + (4 − 4)2 + (2,5 − 3)2 + (3,5 − 4)2
𝑑(1,1) = 3,278719262151
Setelah dilakukan perhitungan euclidean distance dengan seluruh data uji,
hasilnya dapat dilihat pada Tabel 3.9.
Tabel 3.9 Hasil Perhitungan Euclidean Distance
NO NIM Nilai ED KK TA
1 2016-1 3,278719 RPLSI
2 2016-2 2,397916 RPLSI
3 2016-3 2,645751 KSP
4 2016-4 3,041381 AIDE
5 2016-5 5,024938 AIDE
6 2016-6 4,242641 RPLSI
7 2016-7 2,061553 AIDE
8 2016-8 2,95804 AIDE
9 2016-9 5,700877 RPLSI
10 2016-10 5,567764 KSP
11 2016-11 3,708099 RPLSI
12 2016-12 2,95804 AIDE
13 2016-13 4,898979 KSP
14 2016-14 3,840573 KSP
3.3.1.2 Mengurutkan Euclidean Distance
Setelah mengetahui jarak antar kedekatan data uji dan data latih, hal
selanjutnya yang dilakukan yaitu mengurutkan nilai euclidean distance dari yang
terkecil. Kedekatan jarak ini akan berpengaruh pada pengambilan data latih terdekat
sebanyak nilai k. Hasil urutan nilai euclidean distance dapat dilihat pada Tabel 3.10.
23
Tabel 3.10 Urutan nilai euclidean distance data uji terhadap data latih
NO NIM NILAI ED KK TA
1 2016-7 2,061553 AIDE
2 2016-2 2,397916 RPLSI
3 2016-3 2,645751 KASPER
4 2016-8 2,95804 AIDE
5 2016-12 2,95804 AIDE
6 2016-4 3,041381 AIDE
7 2016-1 3,278719 RPLSI
8 2016-11 3,708099 RPLSI
9 2016-14 3,840573 KASPER
10 2016-6 4,242641 AIDE
11 2016-13 4,898979 KASPER
12 2016-5 5,024938 AIDE
13 2016-10 5,567764 KASPER
14 2016-9 5,700877 RPLSI
3.3.1.3 Mengambil Data Latih Sesuai Nilai K
Nilai euclidean distance yang telah diurutkan dari jarak terdekat akan
berpengaruh pada pengambilan data latih sebanyak nilai k yang telah ditentutkan.
Pada contoh ini k yang digunakan adalah 5, maka pada Tabel 3.11 merupakan
kelima data latih yang memiliki jarak terdekat dengan data uji.
Tabel 3.11 Euclidean distance terdekat k=5
No NIM NILAI ED KK TA
1 2016-7 2,061553 1
2 2016-2 2,397916 3
3 2016-3 2,645751 2
4 2016-8 2,95804 1
5 2016-12 2,95804 1
Pada metode K-Nearest Neighbor yang biasa hasil prediksi label kelas
ditentukan melalui label kelas paling dominan pada data terdekat sebanyak nilai k.
Misalnya melalui tabel 3.11 dapat diketahui bahwa kelompok keilmuan 1 atau
Artificial Intelegence dan Data Engineering (AIDE) merupakan label dominan
pada kelima data terdekat. Berbeda dengan Improved K-Nearest Neighbor dimana
untuk menentukan label data uji akan dilakukan perhitungan nilai voting terhadap
atribut data.
24
3.3.1.4 Menentukan Nilai Bobot
Dalam menentukan nilai bobot untuk setiap kelompok keilmuan dari sebuah
data uji, pada penelitian ini peneliti menggunakan cara menghitung nilai IPK pada
setiap kelompok keilmuan. Perhitungan IPK suatu kelompok keilmuan dilakukan
dengan cara mengelompokkan mata kuliah yang sesuai dengan kode kelompok
keilmuan yang telah ditentukan oleh prodi. Berikut ini merupakan contoh
perhitungannya :
a. Nilai bobot untuk kelas/label kelompok keilmuan AIDE
𝑚1 =∑ 𝑆𝐾𝑆 𝑚𝑘 𝑥 𝑛𝑖𝑙𝑎𝑖 𝑚𝑘 𝑘𝑘 𝐾𝐵𝑅𝐷𝑡
𝑡𝑜𝑡𝑎𝑙 𝑆𝐾𝑆
𝑚1 = (3𝑥3) + (4𝑥3) + (3𝑥2,5) + (3𝑥4) + (3𝑥2) + (3𝑥3,5) + (3𝑥2)
22
𝑚1 = 63
22= 2,86
b. Nilai bobot untuk kelas kelompok keilmuan KSP
𝑚2 =∑ 𝑆𝐾𝑆 𝑚𝑘 𝑥 𝑛𝑖𝑙𝑎𝑖 𝑚𝑘 𝑘𝑘 𝐾𝑆𝑃𝑡
𝑡𝑜𝑡𝑎𝑙 𝑆𝐾𝑆
𝑚2 = (3𝑥2) + (3𝑥4) + (4𝑥3,5) + (3𝑥4) + (4𝑥4) + (3𝑥4) + (3𝑥4)
23
𝑚2 = 84
23= 3,65
c. Nilai bobot untuk kelas kelompok keilmuan RPLSI
𝑚3 =∑ 𝑆𝐾𝑆 𝑚𝑘 𝑥 𝑛𝑖𝑙𝑎𝑖 𝑚𝑘 𝑘𝑘 𝑅𝑃𝐿𝑆𝐼𝑡
𝑡𝑜𝑡𝑎𝑙 𝑆𝐾𝑆
𝑚3 = = (2𝑥3) + (2𝑥2,5) + (2𝑥3,5)
6
𝑚3 = 18
6= 3
25
3.3.1.5 Menghitung Koefisien Korelasi
Untuk menemukan nilai voting, terlebih dahulu menentukan nilai koefisien
korelasi (𝑘𝑡𝑖) dari data latih terhadap data uji [3]. Adapun rumus mencari koefisien
korelasi yaitu 𝑘𝑡𝑖 = ∑𝑖=1
𝑛 (𝑥𝑖−�̅�)(𝑦−�̅�)
√Σ𝑖=1𝑛 (𝑥𝑖−�̅�)2(𝑦−�̅�)2
. Proses perhitungan koefisien korelasi akan
dibagi menjad menjadi dua bagian, dimana yang pertama menemukan nilai dari
∑𝑖=1𝑛 (𝑥𝑖 − �̅�)(𝑦 − �̅�) dan yang kedua √Σ𝑖=1
𝑛 (𝑥𝑖 − �̅�)2(𝑦 − �̅�)2.
Pada bagian pertama proses awal yang dilakukan yaitu menentukan nilai
rata-rata dari setiap atribut data latih ditambah data yang diuji. Misalnya untuk
menemukan rata-rata nilai atribut dari PTI pada data yang diuji adalah sebagai
berikut
𝑥𝑃𝑇𝐼̅̅ ̅̅ ̅̅ ̅ =𝑑𝑎𝑡𝑎1 + 𝑑𝑎𝑡𝑎2 + ⋯ + 𝑑𝑎𝑡𝑎14 + 𝑑𝑎𝑡𝑎𝑢𝑗𝑖
𝑡𝑜𝑡𝑎𝑙𝑑𝑎𝑡𝑎
𝑥𝑃𝑇𝐼̅̅ ̅̅ ̅̅ ̅ = (1+3,5+2+2+1+1+2+2,5+1+1+1+2+1+2+2)
15= 1,66666666666667
Pada Tabel 3.12 merupakan hasil perhitungan nilai rata-rata dari setiap atribut.
Tabel 3.12 Nilai rata-rata pada setiap atribut
NO PTI Daspro MRV MD TBFO ASD OAK SA
1 1 2 3 3 3 2,5 3,5 3,5
2 3,5 3,5 3 4 3,5 4 4 4
3 2 2,5 2,5 3 4 3,5 4 4
4 2 4 3 3 3 2,5 4 3
5 1 1 2 2 3 2,5 3 2
6 1 1 3,5 3 4 2,5 4 4
7 2 3 2 2,5 2,5 2,5 4 3,5
8 2,5 4 3 3,5 4 4 4 4
9 1 2 2,5 2 2 2 2 1
10 1 1 2 2 1 2,5 2 2,5
11 1 3 3 2,5 2,5 3,5 3 2,5
12 2 3 3 3,5 2 3,5 3,5 3,5
13 1 2,5 3 3 2 2 2 2
14 2 2,5 3 3,5 3 2,5 4 3
15 2 4 3 3 2,5 3,5 4 4
X̅ 1,667 2,6 2,767 2,9 2,8 2,9 3,4 3,1
26
Tabel 3.13 Nilai rata-rata pada setiap atribut (lanjutan)
PS BD PBO SO DRPL IB JK IMK SI
2 3 2,5 4 3 3 4 3 4
2,5 3,5 4 4 3 2,5 4 3 4
2,5 4 3,5 3,5 2 2 3,5 2,5 3,5
2 2,5 2,5 3 2,5 2,5 3 3,5 4
2 2,5 2,5 2,5 2,5 2 3 3 3,5
2 3 2,5 4 2,5 3 3,5 3 4
2 3,5 4 4 2,5 2 4 2 4
3,5 4 4 4 4 3 4 3,5 4
2 2 2 2,5 3,5 2 3 2,5 2,5
2 2 2,5 2,5 2,5 2 2,5 2,5 3
3 2,5 2 3 2,5 2 4 3,5 3,5
3 3,5 3 3 2,5 3 4 4 4
1 2,5 2 3 2,5 1 3 3,5 3,5
3,5 2 2,5 2,5 2 2 4 2,5 3,5
2 3,5 4 4 3 2 4 2,5 3,5
2,333 2,933 2,9 3,3 2,7 2,267 3,567 2,967 3,633
Setelah menemukan nilai rata-rata pada setiap atribut, tahapan selanjutnya
menghitung selisih antara setiap nilai dari data suatu atribut dengan nilai rata-
ratanya. Misalnya pada atribut PTI untuk menemukan selisih pada data pertama
yaitu sebagai berikut
𝑃𝑇𝐼1 − 𝑥𝑃𝑇𝐼̅̅ ̅̅ ̅̅ ̅ = 1 − 1,667 = −0,667
Tabel 3.14 merupakan nilai selisih antara data setiap atribut dengan nilai rata-
ratanya.
Tabel 3.14 Hasil selisih data atribut dengan nilai rata-rata
NO PTI-x̅ Dp-x̅ MRV-
x̅ MD-x̅ TBFO-x̅ ASD-x̅ OAK-x̅ SA-x̅
1 -0,67 -0,6 0,233 0,1 0,2 -0,4 0,1 0,4
2 1,833 0,9 0,233 1,1 0,7 1,1 0,6 0,9
3 0,333 -0,1 -0,27 0,1 1,2 0,6 0,6 0,9
4 0,333 1,4 0,233 0,1 0,2 -0,4 0,6 -0,1
... ... ... ... ... ... ... ... ...
15 0,333 1,4 0,233 0,1 -0,3 0,6 0,6 0,9
27
Tabel 3.15 Hasil selisih nilai atribut dengan nilai rata-rata (lanjutan)
PS-x̅ BD-x̅ PBO-x̅ SO-x̅ DRPL-x̅ IB-x̅ JK-x̅ IMK-x̅ SI-x̅
-0,33 0,067 -0,4 0,7 0,3 0,733 0,433 0,033 0,367
0,167 0,567 1,1 0,7 0,3 0,233 0,433 0,033 0,367
0,167 1,067 0,6 0,2 -0,7 -0,27 -0,07 -0,47 -0,13
-0,33 -0,43 -0,4 -0,3 -0,2 0,233 -0,57 0,533 0,367
... ... ... ... ... ... ... ... ...
-0,33 0,567 1,1 0,7
0,3 -0,27 0,433 -0,47 -0,13
Tahapan selanjutnya setelah menemukan nilai selisih dari data setiap atribut
yaitu melakukan perkalian nilai selisih pada setiap atribut. Berikut ini merupakan
contoh perkalian pada data pertama dari Tabel 3.15. Kemudian hasil perkalian
seluruh data dapat dilihat pada Tabel 3.16.
(𝑃𝑇𝐼 − �̅�)𝑥(𝐴𝑃2 − �̅�)𝑥(𝑀𝑅𝑉 − �̅�)𝑥(… )𝑥(𝐽𝐾 − �̅�)𝑥(𝐼𝑀𝐾 − �̅�)𝑥(𝑆𝐼 − �̅�)= (−0,67)𝑥(−0,6)𝑥(0,23)𝑥(… )𝑥(0,43)𝑥(0,033)𝑥(0,367)= 2,16535E − 10
Tabel 3.16 Hasil perkalian dari atribut (𝑷𝑻𝑰 − �̅�)𝒙(… )𝒙(𝑺𝑰 − �̅�)
No (PTI-x̅)x(… )x(SI-x̅)
1 -2,16535E-10
2 4,74761E-06
3 -5,70891E-09
4 4,68502E-09
5 -1,60848E-07
6 -1,50765E-08
7 1,40302E-06
8 0,009012511
9 0,002910381
10 -0,000745112
11 -1,37829E-07
12 -9,78118E-08
13 2,74676E-06
14 3,9284E-08
15 -3,32051E-07
JMLH 0,011185972
Pada bagian kedua yaitu melakukan pemangkatan untuk hasil selisih data
atribut dengan nilai rata-rata (Tabel 3.14). Adapun contoh perhitungannya yaitu
28
sebagai berikut (𝑷𝑻𝑰𝟏 − �̅�)2 = (−0,67)2 = 0,4489. Pada Tabel 3.17 merupakan
hasil selisih data atribut dipangkatkan dua.
Tabel 3.17 Hasil selisih data atribut dengan rata-rata dipangkatkan dua
NO (PTI-x̅)2 (Dp-x̅)2 (MRV-x̅)2 (MD-x̅)2 (TBFO-x̅)2 (ASD-x̅)2 (OAK-x̅)2 (SA-x̅)2 (PS-x̅)2
1 0,445 0,360 0,054 0,010 0,040 0,160 0,010 0,160 0,111
2 3,349 0,810 0,054 1,210 0,490 1,210 0,360 0,810 0,028
3 0,109 0,010 0,071 0,010 1,440 0,360 0,360 0,810 0,028
4 0,111 1,960 0,054 0,010 0,040 0,160 0,360 0,010 0,111
... ... ... ... ... ... ... ... ... ...
11 0,444 0,160 0,054 0,160 0,090 0,360 0,160 0,360 0,444
12 0,111 0,160 0,054 0,360 0,640 0,360 0,010 0,160 0,444
13 0,444 0,010 0,054 0,010 0,640 0,810 1,960 1,210 1,778
14 0,111 0,010 0,054 0,360 0,040 0,160 0,360 0,010 1,361
15 0,111 1,960 0,054 0,010 0,090 0,360 0,360 0,810 0,111
Tabel 3.18 Hasil selisih data atribut dengan rata-rata dipangkatkan dua (lanjutan)
(BD-x̅)2 (PBO-x̅)2 (SO-x̅)2 (DRPL-x̅)2 (IB-x̅)2 (JK-x̅)2 (IMK-x̅)2 (SI-x̅)2
0,004 0,160 0,490 0,090 0,538 0,188 0,001 0,134
0,321 1,210 0,490 0,090 0,054 0,188 0,001 0,134
1,138 0,360 0,040 0,490 0,071 0,004 0,218 0,018
0,188 0,160 0,090 0,040 0,054 0,321 0,284 0,134
... ... ... ... ... ... ... ...
0,188 0,810 0,090 0,040 0,071 0,188 0,284 0,018
0,321 0,010 0,090 0,040 0,538 0,188 1,068 0,134
0,188 0,810 0,090 0,040 1,604 0,321 0,284 0,018
0,871 0,160 0,640 0,490 0,071 0,188 0,218 0,018
0,321 1,210 0,490 0,090 0,071 0,188 0,218 0,018
Setelah hasil pemangkatan ditemukan, selanjutnya yaitu mengkalikan data
hasil pemangkatan antar setiap atribut. Adapun contoh proses yang dimaksud
adalah sebagai berikut
(𝑷𝑻𝑰 − �̅�)𝟐𝒙(… )𝒙(𝑺𝑰 − �̅�)𝟐 = 0,445 x … x 0,134 = 4,69341E − 20
Pada Tabel 3.19 merupakan hasil perkalian dari selisih atribut yang telah
dipangkatkan.
Tabel 3.19 Hasil perkalian dari (𝑷𝑻𝑰 − �̅�)𝟐𝒙(… )𝒙(𝑺𝑰 − �̅�)𝟐
No (PTI-x̅)2x(… )x(SI-x̅)2
1 4,69341E-20
2 2,24579E-11
29
Tabel 3.20 Hasil perkalian dari (𝑷𝑻𝑰 − �̅�)𝟐𝒙(… )𝒙(𝑺𝑰 − �̅�)𝟐 (lanjutan)
No (𝑷𝑻𝑰 − 𝒙)𝟐𝒙(… )𝒙(𝑺𝑰 − 𝒙)̅𝟐
3 3,19431E-17
4 2,19494E-17
5 2,5872E-14
6 2,27301E-16
7 1,96847E-12
8 8,12253E-05
9 8,47032E-06
10 5,55192E-07
11 1,8997E-14
12 9,56714E-15
13 7,54469E-12
14 1,54323E-15
15 1,10258E-13
Jumlah 9,02509E-05
Setelah mendapatkan hasil pada bagian pertama (Tabel 3.16) dan bagian kedua
(Tabel 3.20), nilai koefisien korelasi dapat dihitung dengan sebagai berikut :
𝑘𝑡1 = ∑𝑖=1
15 (𝑷𝑻𝑰 − �̅�)𝒙(… )𝒙(𝑺𝑰 − �̅�)
√Σ𝑖=115 (𝑷𝑻𝑰 − �̅�)𝟐𝒙(… )𝒙(𝑺𝑰 − �̅�)𝟐
𝑘𝑡1 = −3,0948E − 37
√9,57776E − 74
𝑘𝑡1 = −1
Berdasarkan contoh hasil perhitungan koefisien korelasi (𝑘𝑡𝑖) pada data uji
t dengan data latih yang memiliki label AIDE (𝑘𝑡1) , maka nilai 𝑘𝑡1 yang digunakan
untuk perhitungan nilai voting terhadap data yang diujikan adalah -1.
3.3.1.6 Menghitung Nilai Voting
Nilai voting (𝑉𝑡→𝑖) dihitung dengan cara sebagai berikut
(𝑉𝑡→𝑖) = ∑𝑐𝑙𝑎𝑠𝑠(𝑗)=𝑖 𝑚𝑖 𝑥 𝑘𝑡𝑖
𝑑𝑡𝑗2
Pada data pertama berdasarkan Tabel 3.11, untuk menemukan nilai (𝑉𝑡→1) atau
nilai voting nilai voting KK AIDE yaitu sebagai berikut:
𝑚1= 2,86
𝑘𝑡1= -1
30
𝑑𝑡12 = 2,0615532
𝑑𝑡42 = 2,958042
𝑑𝑡52 = 2,958042
(𝑉𝑡→1) =2,86𝑥−1
2,0615532+
2,86𝑥−1
2,958042+
2,86𝑥−1
2,958042= -1,328342246
Untuk menemukan nilai (𝑉𝑡→2) atau nilai voting KK KSP diketahui
𝑚2 = 3,65
𝑘𝑡2= -1
𝑑𝑡𝑗2 = 2,6457512
(𝑉𝑡→2) =3,65𝑥−1
2,6457512 =-0,52173913
Untuk menemukan nilai (𝑉𝑡→3) atau nilai voting KK RPLSI diketahui
𝑚3 = 3
𝑘𝑡3= 1
𝑑𝑡𝑗2 = 2,3979162
(𝑉𝑡→3) =3𝑥1
2,3979162 = 0,52173913
3.3.1.7 Menentukan Hasil Prediksi Data Uji
Hasil prediksi dari data uji, ditentukan nilai maksimum dari perhitungan
nilai voting. Hal ini karena nilai voting merupakan refleksi hubungan antara data
uji dengan label data latih. Berikut ini merupakan contoh untuk menentukan hasil
prediksi :
(𝑉𝑡→1) = −1,328342246
(𝑉𝑡→2) = −0,52173913
(𝑉𝑡→3) = 0,52173913
𝐶𝑙𝑎𝑠𝑠(𝑡) = max{−1,328342246 , −0,52173913, 0,52173913}= 0,52173913
Berdasarkan contoh tersebut diketahui bahwa nilai maksimum dari nilai voting
yaitu 0,52173913 yang merupakan hasil dari (𝑉𝑡→3). Jadi hasil prediksi label dari
data uji tersebut adalah 3 atau Rekayasa Perangkat Lunak dan Sistem Informasi
(RPLSI).
31
3.3.2 Implementasi Metode Improved k-Nearest Neighbor (KNN+)
Pada tahap implementasi yaitu dimana sistem akan dibangun dari tahapan
perancangan. Implementasi program dalam penelitian ini menggunakan bahasa
pemrograman PHP dan MySQLi, dimana proses manualisasi data menggunakan
microsoft excel.
Perancangan Pengujian
Rancangan pengujian pada penelitian ini menggunakan metode leave one out
cross validation (LOOCV) yang terdiri dari pengujian perbedaan nilai K pada
dataset yang digunakan, pengujian seleksi atribut, dan membandingkan hasil
pengujian seleksi atribut antara metode KNN+ dan KNN. Tujuan dari pengujian ini
untuk mengevaluasi kemampuan metode KNN+ dalam melakukan prediksi
kelompok keilmuan.
3.4.1 Pengujian Perbedaan Nilai K
Kinerja metode Improved K-Nearest Neighbor (KNN+) dipengaruhi oleh
nilai K atau nilai ketetanggaan. Oleh sebab itu, pada pengujian ini akan dilakukan
pengujian terhadap nilai K dengan rentan 1 sampai 20.
3.4.2 Pengujian Seleksi Atribut
Pengujian ini bertujuan untuk memperbaiki atau meningkatkan kemampuan
sistem dengan cara menghapus atribut-atribut yang tidak relevan dalam proses
klasifikasi. Adapun teknik seleksi atribut yang digunakan dalam penelitian ini yaitu
information gain, dimana proses perhitungannya dilakukan dengan perangkat lunak
Weka.
3.4.3 Pengujian Model Dataset untuk Memprediksi KK Tugas Akhir
Pada pengujian ini model dataset yang berisi kelompok keilmuan, nilai mata
kuliah wajib mahasiswa, dan mata kuliah pilihan pendukung tugas akhir akan
diujikan dengan beberapa data uji yang berisi nilai mata kuliah wajib mahasiswa
serta riwayat mata kuliah pilihan yang pernah diambil mahasiswa. Pengujian ini
bertujuan untuk mengetahui bagaimana hasil klasifikasi kelompok keilmuan tugas
akhir mahasiswa terhadap hasil klasifikasi sistem.