BAB III METODELOGI PENELITIAN Inisialisasi Penelitian 3.1

15

BAB III

METODELOGI PENELITIAN

Inisialisasi Penelitian

3.1.1 Studi Literatur

Studi literatur merupakan acuan teori yang digunakan untuk mengerjakan sebuah

penelitian. Pada penelitian ini peneliti menggunakan metode improved k-nearest

neighbor yang ditemukan oleh Wei Yuan pada tahun 2004 [3].

3.1.2 Wawancara

Kegiatan wawancara dilakukan kepada sekertaris prodi teknik informatika institut

teknologi sumatera yaitu Bapak Amirul Iqbal, S.Kom,. M.Eng. mengenai

kurikulum dan kelompok keilmuan.

3.1.3 Pengumpulan Data

Pada tahapan ini peneliti akan mengumpulkan data yang digunakan dan

diolah untuk penelitian. Pengumpulan data akan dilakukan melalui sebuah

kuisioner. Target responden yaitu mahasiswa teknik informatika angkatan 2016

yang telah melakukan seminar proposal. Kriteria pemilihan responden yang telah

melakukan seminar proposal dikarenakan untuk mengetahui kelompok keilmuan

dari tugas akhir yang dikerjakan sudah pasti. Adapun data yang dikumpulkan

merupakan nilai-nilai mata kuliah wajib prodi teknik informatika.

Persiapan Data

3.2.1 Pembersihan Data

Pada tahapan ini akan dilakukan pemeriksaan mengenai kelengkapan data yang

dibutuhkan dan penghapusan data dupliklat.

3.2.2 Transformasi Data

Pada tahapan ini akan dilakukan penyesuain mata kuliah terkait perbedaan

mata kuliah wajib pada kurikulum 2016 yang disesuaikan dengan kurikulum 2020

dan konversi data penelitian menjadi bentuk data numerik. Hal ini diperlukan

supaya data dapat diolah pada tahapan selanjutnya. Pada tabel 3.1 merupakan

konversi data nilai yang akan digunakan dalam penelitian.

16

Tabel 3.1 Konversi Data Nilai

Nilai Konversi

A 4

AB 3,5

B 3

BC 2,5

C 2

D 1

E 0

Pada tabel 3.2 merupakan keterangan kode singkatan nama mata kuliah yang

digunakan dalam dataset penelitian ini.

Tabel 3.2 Data Mata Kuliah

Mata Kuliah Kode

Pengantar Teknologi Informasi B PTI

Dasar Pemrograman Daspro

Matriks dan Ruang Vektor MRV

Logika Informatika LogIf

Matematika Diskrit MD

Teori Bahasa Formal dan Otomata TBFO

Algoritma dan Struktur Data ASD

Organisasi dan Arsitektur Komputer OAK

Strategi Algoritma SA

Probabilitas dan Statistika PS

Basis Data BS

Pemrograman Berorientasi Objek PBO

Sistem Operasi SO

Dasar Rekayasa Perangkat Lunak DRPL

Inteligensi Buatan IB

Jaringan Komputer JK

Interaksi Manusia dan Komputer IMK

Sistem Informasi SI

Information Retrieval IR

Data Warehouse / Data Mining DM

Manajemen Basis Data MBD

Pengolahan Citra Digital PCD

Teknologi Basis Data TBD

17

Tabel 3.3 Data Mata Kuliah (Lanjutan)

Mata Kuliah Kode

Teknologi Game TG

Pengolahan Sinyal Digital PSD

Jaringan Komputer Lanjut JKL

Pengembangan Aplikasi Mobile PAM

Kriptografi KRPT

Pemrograman Web Web

Sistem Tertanam ST

Sistem / Teknologi Multimedia TM

Pemrograman Web Lanjut WebL

Pervasive Computing Pervasif

Keamanan Jaringan KEJAR

Manajemen Proyek Teknologi Informasi MPTI

Proyek Teknologi Informasi PPL

Sistem Informasi Lanjut SIL

Adapun penyesuain mata kuliah wajib 2016 yang disesuaikan dengan kurikulum

2020 dapat dilihat pada Tabel 3.4.

Tabel 3.4 Penyesuaian Mata Kuliah

Mata Kuliah Kurikulum 2020 Mata Kuliah Kurikulum 2016

Algoritma Pemrograman I Pengantar Teknologi Informasi B

Algoritma Pemrograman II Dasar Pemrograman

Matematika diskrit Logika Informatika

Matematika Diskrit

Penyesuain mata kuliah ini berdasarkan ekuivalensi antara kurikulum sebelumnya

dengan kurikulum 2020

Perancangan Sistem

Pada tahap ini dilakukan perancangan sistem yang akan diterapkan sebelum

diimplementasikan. Tahapan ini sebagai gambaran dari proses model klasifikasi

yang digunakan dalam penelitian. Perancangan sistem prediksi kelompok keilmuan

tugas akhir menggunakan metode KNN+ ditunjukkan pada Gambar 3.1.

18

Gambar 3.1 Perancangan Sistem

Pada perancangan sistem Gambar 3.1 terdiri dari 3 blok yaitu input, proses,

dan output. Input dari sistem ini berupa data nilai mata kuliah wajib teknik

informatika dan mata kuliah pilihan yang telah dikumpulkan dari kuisioner.

Kemudian pada tahap proses dilakukan pengolahan data dengan menggunakan

metode KNN+, dimana tahapan awal yaitu menghitung euclidean distance antara

data uji dengan semua data latih. Tahapan selanjutnya mengurutkan nilai euclidean

distance dari yang terkecil dan mengambil data latih yang memiliki jarak terdekat

sebanyak nilai k yang telah ditentukan.

Sebelum masuk ke tahap perhitungan nilai voting, akan terlebih dahulu

dicari koefisien korelasi data uji terhadap dataset untuk masing-masing kelompok

keilmuan dan nilai bobot setiap kelompok keilmuan yang dimiliki data uji. Nilai

bobot didapatkan dari perhitungan nilai mata kuliah yang tergolong pada suatu

kelompok keilmuan. Pada hasil perhitungan nilai voting dari masing-masing label,

nilai voting tertinggi/maksimal akan digunakan untuk menentukan label data uji[9].

Selanjutnya pada proses output yaitu sistem akan memberikan hasil prediksi

kelompok keilmuan tugas akhir pada mahasiswa.

3.3.1 Proses Klasifikasi Metode Improved k-Nearest Neighbor (KNN+)

Pada proses awal dari improved k-nearest neighbor tidak berbeda dengan

proses k-nearest neighbor yang biasa. Tahapan ini dimulai dengan perhitungan

jarak antara data latih dan data uji dengan menggunakan rumus euclidean distance.

Setelah didapatkan nilai euclidean distance, nilai tersebut diurutkan dari nilai

terkecil. Berikut ini diberikan sebuah contoh data yang akan menggambarkan

19

proses prediksi untuk memperjelas proses improved k-nearest neighbor. Pada tabel

3.5 dan tabel 3.6 merupakan contoh data latih dan data uji yang akan digunakan

dalam proses perhitungan. Pada Tabel 3.7 dan tabel 3.8 merupakan hasil konversi

data latih dan data uji ke bentuk data numerik untuk memudahkan proses

perhitungan.

20

Tabel 3.5 Contoh Data Latih

NO NIM Mata Kuliah Wajib IF

KK TA PTI Daspro MRV MD TBFO ASD OAK SA PS BD PBO SO DRPL IB JK IMK SI

1 2016-1 RPLSI D C B B B BC AB AB C B BC A B B A B A

2 2016-2 RPLSI AB AB B A AB A A A BC AB A A B BC A B A

3 2016-3 KSP C BC BC B A AB A A BC A AB AB C C AB BC AB

4 2016-4 AIDE C A B B B BC A B C BC BC B BC BC B AB A

5 2016-5 AIDE D D C C B BC B C C BC BC BC BC C B B AB

6 2016-6 RPLSI D D AB B A BC A A C B BC A BC B AB B A

7 2016-7 AIDE C B C BC BC BC A AB C AB A A BC C A C A

8 2016-8 AIDE BC A B AB A A A A AB A A A A B A AB A

9 2016-9 RPLSI D C BC C C C C D C C C BC AB C B BC BC

10 2016-10 KSP D D C C D BC C BC C C BC BC BC C BC BC B

11 2016-11 RPLSI D B B BC BC AB B BC B BC C B BC C A AB AB

12 2016-12 AIDE C B B AB C AB AB AB B AB B B BC B A A A

13 2016-13 KSP D BC B B C C C C D BC C B BC D B AB AB

14 2016-14 KSP C BC B AB B BC A B AB C BC BC C C A BC AB

Tabel 3.6 Contoh Data Uji

NO NIM KK TA PTI Daspro MRV MD TBFO ASD OAK SA PS BD PBO SO DRPL IB JK IMK SI

1 2016-20 ? C A B B BC AB A A C AB A A B C A BC AB

21

Tabel 3.7 Contoh data latih yang telah dikonversi



1 2016-1 RPLSI 1 2 3 3 3 2,5 3,5 3,5 2 3 2,5 4 3 3 4 3 4

2 2016-2 RPLSI 3,5 3,5 3 4 3,5 4 4 4 2,5 3,5 4 4 3 2,5 4 3 4

3 2016-3 KSP 2 2,5 2,5 3 4 3,5 4 4 2,5 4 3,5 3,5 2 2 3,5 2,5 3,5

4 2016-4 AIDE 2 4 3 3 3 2,5 4 3 2 2,5 2,5 3 2,5 2,5 3 3,5 4

5 2016-5 AIDE 1 1 2 2 3 2,5 3 2 2 2,5 2,5 2,5 2,5 2 3 3 3,5

6 2016-6 RPLSI 1 1 3,5 3 4 2,5 4 4 2 3 2,5 4 2,5 3 3,5 3 4

7 2016-7 AIDE 2 3 2 2,5 2,5 2,5 4 3,5 2 3,5 4 4 2,5 2 4 2 4

8 2016-8 AIDE 2,5 4 3 3,5 4 4 4 4 3,5 4 4 4 4 3 4 3,5 4

9 2016-9 RPLSI 1 2 2,5 2 2 2 2 1 2 2 2 2,5 3,5 2 3 2,5 2,5

10 2016-10 KSP 1 1 2 2 1 2,5 2 2,5 2 2 2,5 2,5 2,5 2 2,5 2,5 3

11 2016-11 RPLSI 1 3 3 2,5 2,5 3,5 3 2,5 3 2,5 2 3 2,5 2 4 3,5 3,5

12 2016-12 AIDE 2 3 3 3,5 2 3,5 3,5 3,5 3 3,5 3 3 2,5 3 4 4 4

13 2016-13 KSP 1 2,5 3 3 2 2 2 2 1 2,5 2 3 2,5 1 3 3,5 3,5

14 2016-14 KSP 2 2,5 3 3,5 3 2,5 4 3 3,5 2 2,5 2,5 2 2 4 2,5 3,5

Tabel 3.8 Contoh data uji yang telah dikonversi



1 2016-20 ? 2 4 3 3 2,5 3,5 4 4 2 3,5 4 4 3 2 4 2,5 3,5

22

3.3.1.1 Menghitung Euclidean Distance

Selisih jarak atau euclidean distance ini bertujuan untuk mengetahui

kedekatan nilai antara setiap data latih dan data uji. Proses perhitungan euclidean

distance dilakukan sebanyak jumlah data uji. Berikut ini merupakan salah satu

contoh mencari euclidean distance antara data uji pada Tabel 3.8 dengan data latih

pertama pada Tabel 3.7.

𝑑(1,1) =

√

(2 − 1)2 + (4 − 2)2 + (3 − 3)2 + (3 − 3)2 + (2,5 − 3)2 + (3,5 − 2,5)2 +(4 − 3,5)2 + (4 − 3,5)2 + (2 − 2)2 + (3,5 − 3)2 + (4 − 2,5)2 + (4 − 4)2 +

(3 − 3)2 + (2 − 3)2 + (4 − 4)2 + (2,5 − 3)2 + (3,5 − 4)2

𝑑(1,1) = 3,278719262151

Setelah dilakukan perhitungan euclidean distance dengan seluruh data uji,

hasilnya dapat dilihat pada Tabel 3.9.

Tabel 3.9 Hasil Perhitungan Euclidean Distance

NO NIM Nilai ED KK TA

1 2016-1 3,278719 RPLSI

2 2016-2 2,397916 RPLSI

3 2016-3 2,645751 KSP

4 2016-4 3,041381 AIDE

5 2016-5 5,024938 AIDE

6 2016-6 4,242641 RPLSI

7 2016-7 2,061553 AIDE

8 2016-8 2,95804 AIDE

9 2016-9 5,700877 RPLSI

10 2016-10 5,567764 KSP

11 2016-11 3,708099 RPLSI

12 2016-12 2,95804 AIDE

13 2016-13 4,898979 KSP

14 2016-14 3,840573 KSP

3.3.1.2 Mengurutkan Euclidean Distance

Setelah mengetahui jarak antar kedekatan data uji dan data latih, hal

selanjutnya yang dilakukan yaitu mengurutkan nilai euclidean distance dari yang

terkecil. Kedekatan jarak ini akan berpengaruh pada pengambilan data latih terdekat

sebanyak nilai k. Hasil urutan nilai euclidean distance dapat dilihat pada Tabel 3.10.

23

Tabel 3.10 Urutan nilai euclidean distance data uji terhadap data latih

NO NIM NILAI ED KK TA

1 2016-7 2,061553 AIDE

2 2016-2 2,397916 RPLSI

3 2016-3 2,645751 KASPER

4 2016-8 2,95804 AIDE

5 2016-12 2,95804 AIDE

6 2016-4 3,041381 AIDE

7 2016-1 3,278719 RPLSI

8 2016-11 3,708099 RPLSI

9 2016-14 3,840573 KASPER

10 2016-6 4,242641 AIDE

11 2016-13 4,898979 KASPER

12 2016-5 5,024938 AIDE

13 2016-10 5,567764 KASPER

14 2016-9 5,700877 RPLSI

3.3.1.3 Mengambil Data Latih Sesuai Nilai K

Nilai euclidean distance yang telah diurutkan dari jarak terdekat akan

berpengaruh pada pengambilan data latih sebanyak nilai k yang telah ditentutkan.

Pada contoh ini k yang digunakan adalah 5, maka pada Tabel 3.11 merupakan

kelima data latih yang memiliki jarak terdekat dengan data uji.

Tabel 3.11 Euclidean distance terdekat k=5

No NIM NILAI ED KK TA

1 2016-7 2,061553 1

2 2016-2 2,397916 3

3 2016-3 2,645751 2

4 2016-8 2,95804 1

5 2016-12 2,95804 1

Pada metode K-Nearest Neighbor yang biasa hasil prediksi label kelas

ditentukan melalui label kelas paling dominan pada data terdekat sebanyak nilai k.

Misalnya melalui tabel 3.11 dapat diketahui bahwa kelompok keilmuan 1 atau

Artificial Intelegence dan Data Engineering (AIDE) merupakan label dominan

pada kelima data terdekat. Berbeda dengan Improved K-Nearest Neighbor dimana

untuk menentukan label data uji akan dilakukan perhitungan nilai voting terhadap

atribut data.

24

3.3.1.4 Menentukan Nilai Bobot

Dalam menentukan nilai bobot untuk setiap kelompok keilmuan dari sebuah

data uji, pada penelitian ini peneliti menggunakan cara menghitung nilai IPK pada

setiap kelompok keilmuan. Perhitungan IPK suatu kelompok keilmuan dilakukan

dengan cara mengelompokkan mata kuliah yang sesuai dengan kode kelompok

keilmuan yang telah ditentukan oleh prodi. Berikut ini merupakan contoh

perhitungannya :

a. Nilai bobot untuk kelas/label kelompok keilmuan AIDE

𝑚1 =∑ 𝑆𝐾𝑆 𝑚𝑘 𝑥 𝑛𝑖𝑙𝑎𝑖 𝑚𝑘 𝑘𝑘 𝐾𝐵𝑅𝐷𝑡

𝑡𝑜𝑡𝑎𝑙 𝑆𝐾𝑆

𝑚1 = (3𝑥3) + (4𝑥3) + (3𝑥2,5) + (3𝑥4) + (3𝑥2) + (3𝑥3,5) + (3𝑥2)

22

𝑚1 = 63

22= 2,86

b. Nilai bobot untuk kelas kelompok keilmuan KSP

𝑚2 =∑ 𝑆𝐾𝑆 𝑚𝑘 𝑥 𝑛𝑖𝑙𝑎𝑖 𝑚𝑘 𝑘𝑘 𝐾𝑆𝑃𝑡


𝑚2 = (3𝑥2) + (3𝑥4) + (4𝑥3,5) + (3𝑥4) + (4𝑥4) + (3𝑥4) + (3𝑥4)

23

𝑚2 = 84

23= 3,65

c. Nilai bobot untuk kelas kelompok keilmuan RPLSI

𝑚3 =∑ 𝑆𝐾𝑆 𝑚𝑘 𝑥 𝑛𝑖𝑙𝑎𝑖 𝑚𝑘 𝑘𝑘 𝑅𝑃𝐿𝑆𝐼𝑡


𝑚3 = = (2𝑥3) + (2𝑥2,5) + (2𝑥3,5)

6

𝑚3 = 18

6= 3

25

3.3.1.5 Menghitung Koefisien Korelasi

Untuk menemukan nilai voting, terlebih dahulu menentukan nilai koefisien

korelasi (𝑘𝑡𝑖) dari data latih terhadap data uji [3]. Adapun rumus mencari koefisien

korelasi yaitu 𝑘𝑡𝑖 = ∑𝑖=1

𝑛 (𝑥𝑖−�̅�)(𝑦−�̅�)

√Σ𝑖=1𝑛 (𝑥𝑖−�̅�)2(𝑦−�̅�)2

. Proses perhitungan koefisien korelasi akan

dibagi menjad menjadi dua bagian, dimana yang pertama menemukan nilai dari

∑𝑖=1𝑛 (𝑥𝑖 − �̅�)(𝑦 − �̅�) dan yang kedua √Σ𝑖=1

𝑛 (𝑥𝑖 − �̅�)2(𝑦 − �̅�)2.

Pada bagian pertama proses awal yang dilakukan yaitu menentukan nilai

rata-rata dari setiap atribut data latih ditambah data yang diuji. Misalnya untuk

menemukan rata-rata nilai atribut dari PTI pada data yang diuji adalah sebagai

berikut

𝑥𝑃𝑇𝐼̅̅ ̅̅ ̅̅ ̅ =𝑑𝑎𝑡𝑎1 + 𝑑𝑎𝑡𝑎2 + ⋯ + 𝑑𝑎𝑡𝑎14 + 𝑑𝑎𝑡𝑎𝑢𝑗𝑖

𝑡𝑜𝑡𝑎𝑙𝑑𝑎𝑡𝑎

𝑥𝑃𝑇𝐼̅̅ ̅̅ ̅̅ ̅ = (1+3,5+2+2+1+1+2+2,5+1+1+1+2+1+2+2)

15= 1,66666666666667

Pada Tabel 3.12 merupakan hasil perhitungan nilai rata-rata dari setiap atribut.

Tabel 3.12 Nilai rata-rata pada setiap atribut

NO PTI Daspro MRV MD TBFO ASD OAK SA

1 1 2 3 3 3 2,5 3,5 3,5

2 3,5 3,5 3 4 3,5 4 4 4

3 2 2,5 2,5 3 4 3,5 4 4

4 2 4 3 3 3 2,5 4 3

5 1 1 2 2 3 2,5 3 2

6 1 1 3,5 3 4 2,5 4 4

7 2 3 2 2,5 2,5 2,5 4 3,5

8 2,5 4 3 3,5 4 4 4 4

9 1 2 2,5 2 2 2 2 1

10 1 1 2 2 1 2,5 2 2,5

11 1 3 3 2,5 2,5 3,5 3 2,5

12 2 3 3 3,5 2 3,5 3,5 3,5

13 1 2,5 3 3 2 2 2 2

14 2 2,5 3 3,5 3 2,5 4 3

15 2 4 3 3 2,5 3,5 4 4

X̅ 1,667 2,6 2,767 2,9 2,8 2,9 3,4 3,1

26

Tabel 3.13 Nilai rata-rata pada setiap atribut (lanjutan)

PS BD PBO SO DRPL IB JK IMK SI

2 3 2,5 4 3 3 4 3 4

2,5 3,5 4 4 3 2,5 4 3 4

2,5 4 3,5 3,5 2 2 3,5 2,5 3,5

2 2,5 2,5 3 2,5 2,5 3 3,5 4

2 2,5 2,5 2,5 2,5 2 3 3 3,5

2 3 2,5 4 2,5 3 3,5 3 4

2 3,5 4 4 2,5 2 4 2 4

3,5 4 4 4 4 3 4 3,5 4

2 2 2 2,5 3,5 2 3 2,5 2,5

2 2 2,5 2,5 2,5 2 2,5 2,5 3

3 2,5 2 3 2,5 2 4 3,5 3,5

3 3,5 3 3 2,5 3 4 4 4

1 2,5 2 3 2,5 1 3 3,5 3,5

3,5 2 2,5 2,5 2 2 4 2,5 3,5

2 3,5 4 4 3 2 4 2,5 3,5

2,333 2,933 2,9 3,3 2,7 2,267 3,567 2,967 3,633

Setelah menemukan nilai rata-rata pada setiap atribut, tahapan selanjutnya

menghitung selisih antara setiap nilai dari data suatu atribut dengan nilai rata-

ratanya. Misalnya pada atribut PTI untuk menemukan selisih pada data pertama

yaitu sebagai berikut

𝑃𝑇𝐼1 − 𝑥𝑃𝑇𝐼̅̅ ̅̅ ̅̅ ̅ = 1 − 1,667 = −0,667

Tabel 3.14 merupakan nilai selisih antara data setiap atribut dengan nilai rata-

ratanya.

Tabel 3.14 Hasil selisih data atribut dengan nilai rata-rata

NO PTI-x̅ Dp-x̅ MRV-

x̅ MD-x̅ TBFO-x̅ ASD-x̅ OAK-x̅ SA-x̅

1 -0,67 -0,6 0,233 0,1 0,2 -0,4 0,1 0,4

2 1,833 0,9 0,233 1,1 0,7 1,1 0,6 0,9

3 0,333 -0,1 -0,27 0,1 1,2 0,6 0,6 0,9

4 0,333 1,4 0,233 0,1 0,2 -0,4 0,6 -0,1

... ... ... ... ... ... ... ... ...

15 0,333 1,4 0,233 0,1 -0,3 0,6 0,6 0,9

27

Tabel 3.15 Hasil selisih nilai atribut dengan nilai rata-rata (lanjutan)

PS-x̅ BD-x̅ PBO-x̅ SO-x̅ DRPL-x̅ IB-x̅ JK-x̅ IMK-x̅ SI-x̅

-0,33 0,067 -0,4 0,7 0,3 0,733 0,433 0,033 0,367

0,167 0,567 1,1 0,7 0,3 0,233 0,433 0,033 0,367

0,167 1,067 0,6 0,2 -0,7 -0,27 -0,07 -0,47 -0,13

-0,33 -0,43 -0,4 -0,3 -0,2 0,233 -0,57 0,533 0,367

... ... ... ... ... ... ... ... ...

-0,33 0,567 1,1 0,7

0,3 -0,27 0,433 -0,47 -0,13

Tahapan selanjutnya setelah menemukan nilai selisih dari data setiap atribut

yaitu melakukan perkalian nilai selisih pada setiap atribut. Berikut ini merupakan

contoh perkalian pada data pertama dari Tabel 3.15. Kemudian hasil perkalian

seluruh data dapat dilihat pada Tabel 3.16.

(𝑃𝑇𝐼 − �̅�)𝑥(𝐴𝑃2 − �̅�)𝑥(𝑀𝑅𝑉 − �̅�)𝑥(… )𝑥(𝐽𝐾 − �̅�)𝑥(𝐼𝑀𝐾 − �̅�)𝑥(𝑆𝐼 − �̅�)= (−0,67)𝑥(−0,6)𝑥(0,23)𝑥(… )𝑥(0,43)𝑥(0,033)𝑥(0,367)= 2,16535E − 10

Tabel 3.16 Hasil perkalian dari atribut (𝑷𝑻𝑰 − �̅�)𝒙(… )𝒙(𝑺𝑰 − �̅�)

No (PTI-x̅)x(… )x(SI-x̅)

1 -2,16535E-10

2 4,74761E-06

3 -5,70891E-09

4 4,68502E-09

5 -1,60848E-07

6 -1,50765E-08

7 1,40302E-06

8 0,009012511

9 0,002910381

10 -0,000745112

11 -1,37829E-07

12 -9,78118E-08

13 2,74676E-06

14 3,9284E-08

15 -3,32051E-07

JMLH 0,011185972

Pada bagian kedua yaitu melakukan pemangkatan untuk hasil selisih data

atribut dengan nilai rata-rata (Tabel 3.14). Adapun contoh perhitungannya yaitu

28

sebagai berikut (𝑷𝑻𝑰𝟏 − �̅�)2 = (−0,67)2 = 0,4489. Pada Tabel 3.17 merupakan

hasil selisih data atribut dipangkatkan dua.

Tabel 3.17 Hasil selisih data atribut dengan rata-rata dipangkatkan dua

NO (PTI-x̅)2 (Dp-x̅)2 (MRV-x̅)2 (MD-x̅)2 (TBFO-x̅)2 (ASD-x̅)2 (OAK-x̅)2 (SA-x̅)2 (PS-x̅)2

1 0,445 0,360 0,054 0,010 0,040 0,160 0,010 0,160 0,111

2 3,349 0,810 0,054 1,210 0,490 1,210 0,360 0,810 0,028

3 0,109 0,010 0,071 0,010 1,440 0,360 0,360 0,810 0,028

4 0,111 1,960 0,054 0,010 0,040 0,160 0,360 0,010 0,111

... ... ... ... ... ... ... ... ... ...

11 0,444 0,160 0,054 0,160 0,090 0,360 0,160 0,360 0,444

12 0,111 0,160 0,054 0,360 0,640 0,360 0,010 0,160 0,444

13 0,444 0,010 0,054 0,010 0,640 0,810 1,960 1,210 1,778

14 0,111 0,010 0,054 0,360 0,040 0,160 0,360 0,010 1,361

15 0,111 1,960 0,054 0,010 0,090 0,360 0,360 0,810 0,111

Tabel 3.18 Hasil selisih data atribut dengan rata-rata dipangkatkan dua (lanjutan)

(BD-x̅)2 (PBO-x̅)2 (SO-x̅)2 (DRPL-x̅)2 (IB-x̅)2 (JK-x̅)2 (IMK-x̅)2 (SI-x̅)2

0,004 0,160 0,490 0,090 0,538 0,188 0,001 0,134

0,321 1,210 0,490 0,090 0,054 0,188 0,001 0,134

1,138 0,360 0,040 0,490 0,071 0,004 0,218 0,018

0,188 0,160 0,090 0,040 0,054 0,321 0,284 0,134

... ... ... ... ... ... ... ...

0,188 0,810 0,090 0,040 0,071 0,188 0,284 0,018

0,321 0,010 0,090 0,040 0,538 0,188 1,068 0,134

0,188 0,810 0,090 0,040 1,604 0,321 0,284 0,018

0,871 0,160 0,640 0,490 0,071 0,188 0,218 0,018

0,321 1,210 0,490 0,090 0,071 0,188 0,218 0,018

Setelah hasil pemangkatan ditemukan, selanjutnya yaitu mengkalikan data

hasil pemangkatan antar setiap atribut. Adapun contoh proses yang dimaksud

adalah sebagai berikut

(𝑷𝑻𝑰 − �̅�)𝟐𝒙(… )𝒙(𝑺𝑰 − �̅�)𝟐 = 0,445 x … x 0,134 = 4,69341E − 20

Pada Tabel 3.19 merupakan hasil perkalian dari selisih atribut yang telah

dipangkatkan.

Tabel 3.19 Hasil perkalian dari (𝑷𝑻𝑰 − �̅�)𝟐𝒙(… )𝒙(𝑺𝑰 − �̅�)𝟐

No (PTI-x̅)2x(… )x(SI-x̅)2

1 4,69341E-20

2 2,24579E-11

29

Tabel 3.20 Hasil perkalian dari (𝑷𝑻𝑰 − �̅�)𝟐𝒙(… )𝒙(𝑺𝑰 − �̅�)𝟐 (lanjutan)

No (𝑷𝑻𝑰 − 𝒙)𝟐𝒙(… )𝒙(𝑺𝑰 − 𝒙)̅𝟐

3 3,19431E-17

4 2,19494E-17

5 2,5872E-14

6 2,27301E-16

7 1,96847E-12

8 8,12253E-05

9 8,47032E-06

10 5,55192E-07

11 1,8997E-14

12 9,56714E-15

13 7,54469E-12

14 1,54323E-15

15 1,10258E-13

Jumlah 9,02509E-05

Setelah mendapatkan hasil pada bagian pertama (Tabel 3.16) dan bagian kedua

(Tabel 3.20), nilai koefisien korelasi dapat dihitung dengan sebagai berikut :

𝑘𝑡1 = ∑𝑖=1

15 (𝑷𝑻𝑰 − �̅�)𝒙(… )𝒙(𝑺𝑰 − �̅�)

√Σ𝑖=115 (𝑷𝑻𝑰 − �̅�)𝟐𝒙(… )𝒙(𝑺𝑰 − �̅�)𝟐

𝑘𝑡1 = −3,0948E − 37

√9,57776E − 74

𝑘𝑡1 = −1

Berdasarkan contoh hasil perhitungan koefisien korelasi (𝑘𝑡𝑖) pada data uji

t dengan data latih yang memiliki label AIDE (𝑘𝑡1) , maka nilai 𝑘𝑡1 yang digunakan

untuk perhitungan nilai voting terhadap data yang diujikan adalah -1.

3.3.1.6 Menghitung Nilai Voting

Nilai voting (𝑉𝑡→𝑖) dihitung dengan cara sebagai berikut

(𝑉𝑡→𝑖) = ∑𝑐𝑙𝑎𝑠𝑠(𝑗)=𝑖 𝑚𝑖 𝑥 𝑘𝑡𝑖

𝑑𝑡𝑗2

Pada data pertama berdasarkan Tabel 3.11, untuk menemukan nilai (𝑉𝑡→1) atau

nilai voting nilai voting KK AIDE yaitu sebagai berikut:

𝑚1= 2,86

𝑘𝑡1= -1

30

𝑑𝑡12 = 2,0615532

𝑑𝑡42 = 2,958042

𝑑𝑡52 = 2,958042

(𝑉𝑡→1) =2,86𝑥−1

2,0615532+

2,86𝑥−1

2,958042+

2,86𝑥−1

2,958042= -1,328342246

Untuk menemukan nilai (𝑉𝑡→2) atau nilai voting KK KSP diketahui

𝑚2 = 3,65

𝑘𝑡2= -1

𝑑𝑡𝑗2 = 2,6457512

(𝑉𝑡→2) =3,65𝑥−1

2,6457512 =-0,52173913

Untuk menemukan nilai (𝑉𝑡→3) atau nilai voting KK RPLSI diketahui

𝑚3 = 3

𝑘𝑡3= 1

𝑑𝑡𝑗2 = 2,3979162

(𝑉𝑡→3) =3𝑥1

2,3979162 = 0,52173913

3.3.1.7 Menentukan Hasil Prediksi Data Uji

Hasil prediksi dari data uji, ditentukan nilai maksimum dari perhitungan

nilai voting. Hal ini karena nilai voting merupakan refleksi hubungan antara data

uji dengan label data latih. Berikut ini merupakan contoh untuk menentukan hasil

prediksi :

(𝑉𝑡→1) = −1,328342246

(𝑉𝑡→2) = −0,52173913

(𝑉𝑡→3) = 0,52173913

𝐶𝑙𝑎𝑠𝑠(𝑡) = max{−1,328342246 , −0,52173913, 0,52173913}= 0,52173913

Berdasarkan contoh tersebut diketahui bahwa nilai maksimum dari nilai voting

yaitu 0,52173913 yang merupakan hasil dari (𝑉𝑡→3). Jadi hasil prediksi label dari

data uji tersebut adalah 3 atau Rekayasa Perangkat Lunak dan Sistem Informasi

(RPLSI).

31

3.3.2 Implementasi Metode Improved k-Nearest Neighbor (KNN+)

Pada tahap implementasi yaitu dimana sistem akan dibangun dari tahapan

perancangan. Implementasi program dalam penelitian ini menggunakan bahasa

pemrograman PHP dan MySQLi, dimana proses manualisasi data menggunakan

microsoft excel.

Perancangan Pengujian

Rancangan pengujian pada penelitian ini menggunakan metode leave one out

cross validation (LOOCV) yang terdiri dari pengujian perbedaan nilai K pada

dataset yang digunakan, pengujian seleksi atribut, dan membandingkan hasil

pengujian seleksi atribut antara metode KNN+ dan KNN. Tujuan dari pengujian ini

untuk mengevaluasi kemampuan metode KNN+ dalam melakukan prediksi

kelompok keilmuan.

3.4.1 Pengujian Perbedaan Nilai K

Kinerja metode Improved K-Nearest Neighbor (KNN+) dipengaruhi oleh

nilai K atau nilai ketetanggaan. Oleh sebab itu, pada pengujian ini akan dilakukan

pengujian terhadap nilai K dengan rentan 1 sampai 20.

3.4.2 Pengujian Seleksi Atribut

Pengujian ini bertujuan untuk memperbaiki atau meningkatkan kemampuan

sistem dengan cara menghapus atribut-atribut yang tidak relevan dalam proses

klasifikasi. Adapun teknik seleksi atribut yang digunakan dalam penelitian ini yaitu

information gain, dimana proses perhitungannya dilakukan dengan perangkat lunak

Weka.

3.4.3 Pengujian Model Dataset untuk Memprediksi KK Tugas Akhir

Pada pengujian ini model dataset yang berisi kelompok keilmuan, nilai mata

kuliah wajib mahasiswa, dan mata kuliah pilihan pendukung tugas akhir akan

diujikan dengan beberapa data uji yang berisi nilai mata kuliah wajib mahasiswa

serta riwayat mata kuliah pilihan yang pernah diambil mahasiswa. Pengujian ini

bertujuan untuk mengetahui bagaimana hasil klasifikasi kelompok keilmuan tugas

akhir mahasiswa terhadap hasil klasifikasi sistem.

Documents

BAB III METODELOGI PENELITIAN Inisialisasi Penelitian 3.1