Classifying inhibitor kinase likeness by SVM, ANN,k-NN, & DT

Embed Size (px)

Citation preview

  • 7/26/2019 Classifying inhibitor kinase likeness by SVM, ANN,k-NN, & DT

    1/6

    Resume of Journal:

    Classifying Kinase Inhibitor-Likeness by Using Machine-Learning Methos

    Hans Briem* and Judith Gunther

    Mustakim Masnur

    Universitas Muhammadiyah Surakarta

    !bstrak

    Dengan menggunakan in-house kumpulan data struktur molekul kecil,

    dikodekan oleh parameter Ghose-Crippen, beberapa teknik pembelajaran

    mesin yang diterapkan untuk membedakan antara inhibitor kinase dan

    molekul lain dengan tidak ada aktivitas yang dilaporkan pada setiap

    protein kinase. eempat pendekatan mesin ditempuh-dukungan-vektor

    !S"M#, $rti%cial neural net !$&, #, k nearest neighbor classi%cation 'ith G$-

    optimi(ed )eature selection !G$ * k&, dan partisi rekursi) !+# dengan

    terbukti mampu memberikan perbedaan 'ajar . &amun demikian,

    perbedaan substansial dalam kinerja antara metode yang diamati. Untuk

    semua teknik diuji, penggunaan suara konsensus dari model yang

    berbeda berasal meningkatkan kualitas prediksi dalam hal akurasi, presisi,

    recall, dan nilai /. S"M, diikuti oleh kombinasi G$ * k&&, mengungguli

    teknik lain ketika membandingkan rata-rata model individu. Dengan

    menggunakan suara terbanyak masing-masing, prediksi jaringan sara)

    menghasilkan nilai / tertinggi, diikuti oleh S"Ms.

    Metoe

    "ata sets an escri#tors

    umpulan data yang digunakan untuk pelatihan dan pengujian sistem

    terdiri dari kedua senya'a kinase-akti) dan -inactive dari perpustakaanSchering. Senya'a diberi label 0akti)0 jika hal itu menunjukkan 1C234

    3mm dalam setidaknya satu dari delapan tes di rumah kinase !tiga

    kinase Ser * 5hr, lima kinase 5yr#. ambang kegiatan ini dipilih karena

    merupakan standar internal untuk memulai kegiatan tindak lanjut setelah

    melalui penyaringan tinggi

    Seluruh kolam senya'a pelatihan mengandung 262 molekul

    diklasi%kasikan sebagai 0akti)0 dan 789 sebagai 0inactives0. Selain itu,

    set uji independen dari 239 senya'a !:39 akti) dan 33 inactives# telah

    menyisihkan untuk tujuan validasi. Senya'a secara acak ditugaskanuntuk baik set pelatihan atau tes set.

  • 7/26/2019 Classifying inhibitor kinase likeness by SVM, ANN,k-NN, & DT

    2/6

    Sebuah pengelompokan berbasis perancah dari seluruh set data yang

    digunakan rogram Classharmer ;ioreason ini

  • 7/26/2019 Classifying inhibitor kinase likeness by SVM, ANN,k-NN, & DT

    3/6

    Machine-learning methos

    Sebuah penjelasan rinci tentang algoritma klasi%kasi yang digunakandalam penelitian ini akan melampaui lingkup artikel ini. Aleh karena itu

    kami akan menjelaskan hanya sebentar setiap metode dan parameter

    yang digunakan. Untuk rincian lebih lanjut tentang matematika yang

    mendasari, kita mengacu pada kutipan yang diberikan di setiap subbagian

    berikut.

    &u##ort-%ector machine '&(M)

    S"Ms menyediakan novel dia'asi teknik mesin-belajar a'alnya diusulkan

    oleh "apnik.

  • 7/26/2019 Classifying inhibitor kinase likeness by SVM, ANN,k-NN, & DT

    4/6

    S"Ms. ;eberapa aplikasi yang berhubungan dengan kimia baru-baru ini

    termasuk prediksi titik isoelektrik asam amino, dapat diperoleh untuk kedua model berbasis S"M dan model

  • 7/26/2019 Classifying inhibitor kinase likeness by SVM, ANN,k-NN, & DT

    5/6

    berbasis k&& G$ *I ini menunjukkan bah'a metode ini juga berlaku untuk

    pemilihan senya'a dalam praktek.

    Menggunakan suara terbanyak dari model yang berasal meningkatkan

    kualitas prediksi untuk semua empat metode, tetapi kebanyakan dgn jelas

    untuk jaringan sara). ;ahkan, $&& suara mayoritas mengungguli semua

    prediksi lain dalam hal ingat !3,>># dan / !3.>6#. Suara mayoritas dari

    model S"M menghasilkan presisi tertinggi !3,>6# dan sebaik akurasi !3.>>#

    sebagai ensemble $&&. Meskipun set data yang berbeda dan deskriptor

    molekul digunakan batas komparabilitas hasil, angka-angka ini berada di

    kisaran yang sama dengan akurasi prediksi 78F yang Manallack et al.

  • 7/26/2019 Classifying inhibitor kinase likeness by SVM, ANN,k-NN, & DT

    6/6

    Mengenai pilihan deskriptor molekul, kami percaya bah'a keseimbangan

    antara tingkat rinci abstraksi yang disediakan oleh himpunan )ragmen

    Ghose-Crippen umum dan membuat mereka cocok untuk klasi%kasi

    molekul kecil sehubungan dengan potensi mereka untuk menghambat

    target tertentu kelas keluarga.