Classifying inhibitor kinase likeness by SVM, ANN,k-NN, & DT

7/26/2019 Classifying inhibitor kinase likeness by SVM, ANN,k-NN, & DT

1/6

Resume of Journal:

Classifying Kinase Inhibitor-Likeness by Using Machine-Learning Methos

Hans Briem* and Judith Gunther

Mustakim Masnur

Universitas Muhammadiyah Surakarta

!bstrak

Dengan menggunakan in-house kumpulan data struktur molekul kecil,

dikodekan oleh parameter Ghose-Crippen, beberapa teknik pembelajaran

mesin yang diterapkan untuk membedakan antara inhibitor kinase dan

molekul lain dengan tidak ada aktivitas yang dilaporkan pada setiap

protein kinase. eempat pendekatan mesin ditempuh-dukungan-vektor

!S"M#, $rti%cial neural net !$&, #, k nearest neighbor classi%cation 'ith G$-

optimi(ed )eature selection !G$ * k&, dan partisi rekursi) !+# dengan

terbukti mampu memberikan perbedaan 'ajar . &amun demikian,

perbedaan substansial dalam kinerja antara metode yang diamati. Untuk

semua teknik diuji, penggunaan suara konsensus dari model yang

berbeda berasal meningkatkan kualitas prediksi dalam hal akurasi, presisi,

recall, dan nilai /. S"M, diikuti oleh kombinasi G$ * k&&, mengungguli

teknik lain ketika membandingkan rata-rata model individu. Dengan

menggunakan suara terbanyak masing-masing, prediksi jaringan sara)

menghasilkan nilai / tertinggi, diikuti oleh S"Ms.

Metoe

"ata sets an escri#tors

umpulan data yang digunakan untuk pelatihan dan pengujian sistem

terdiri dari kedua senya'a kinase-akti) dan -inactive dari perpustakaanSchering. Senya'a diberi label 0akti)0 jika hal itu menunjukkan 1C234

3mm dalam setidaknya satu dari delapan tes di rumah kinase !tiga

kinase Ser * 5hr, lima kinase 5yr#. ambang kegiatan ini dipilih karena

merupakan standar internal untuk memulai kegiatan tindak lanjut setelah

melalui penyaringan tinggi

Seluruh kolam senya'a pelatihan mengandung 262 molekul

diklasi%kasikan sebagai 0akti)0 dan 789 sebagai 0inactives0. Selain itu,

set uji independen dari 239 senya'a !:39 akti) dan 33 inactives# telah

menyisihkan untuk tujuan validasi. Senya'a secara acak ditugaskanuntuk baik set pelatihan atau tes set.


2/6

Sebuah pengelompokan berbasis perancah dari seluruh set data yang

digunakan rogram Classharmer ;ioreason ini


3/6

Machine-learning methos

Sebuah penjelasan rinci tentang algoritma klasi%kasi yang digunakandalam penelitian ini akan melampaui lingkup artikel ini. Aleh karena itu

kami akan menjelaskan hanya sebentar setiap metode dan parameter

yang digunakan. Untuk rincian lebih lanjut tentang matematika yang

mendasari, kita mengacu pada kutipan yang diberikan di setiap subbagian

berikut.

&u##ort-%ector machine '&(M)

S"Ms menyediakan novel dia'asi teknik mesin-belajar a'alnya diusulkan

oleh "apnik.


4/6

S"Ms. ;eberapa aplikasi yang berhubungan dengan kimia baru-baru ini

termasuk prediksi titik isoelektrik asam amino, dapat diperoleh untuk kedua model berbasis S"M dan model


5/6

berbasis k&& G$ *I ini menunjukkan bah'a metode ini juga berlaku untuk

pemilihan senya'a dalam praktek.

Menggunakan suara terbanyak dari model yang berasal meningkatkan

kualitas prediksi untuk semua empat metode, tetapi kebanyakan dgn jelas

untuk jaringan sara). ;ahkan, $&& suara mayoritas mengungguli semua

prediksi lain dalam hal ingat !3,>># dan / !3.>6#. Suara mayoritas dari

model S"M menghasilkan presisi tertinggi !3,>6# dan sebaik akurasi !3.>>#

sebagai ensemble $&&. Meskipun set data yang berbeda dan deskriptor

molekul digunakan batas komparabilitas hasil, angka-angka ini berada di

kisaran yang sama dengan akurasi prediksi 78F yang Manallack et al.


6/6

Mengenai pilihan deskriptor molekul, kami percaya bah'a keseimbangan

antara tingkat rinci abstraksi yang disediakan oleh himpunan )ragmen

Ghose-Crippen umum dan membuat mereka cocok untuk klasi%kasi

molekul kecil sehubungan dengan potensi mereka untuk menghambat

target tertentu kelas keluarga.

Documents

Classifying inhibitor kinase likeness by SVM, ANN,k-NN, & DT