21
Menemukan interaksi obat-obat: teks-pertambangan dan penalaran pendekatan berdasarkan sifat metabolisme obat Motivasi: Mengidentifikasi interaksi obat-obat (DDIS) adalah proses penting pemberian obat dan pengembangan obat.Alat pendukung klinis sering menyediakan daftar komprehensif DDiS, tetapi mereka biasanya kekurangan bukti ilmiah yang mendukung dan perbedaan alat dapat menggembalikan hasil yang tidak konsisten. Pada artikel ini, kami mengusulkan sebuah novel Pendekatan yang mengintegrasikan text mining dan penalaran otomatis untuk menurunkan DDiS. Melalui ekstraksi berbagai fakta metabolisme obat, tidak hanya DDiS yang secara eksplisit disebutkan dalam teks dapat diekstraksi tetapi juga potensi interaksi yang dapat disimpulkan dengan penalaran. Hasil: Pendekatan kami mampu menemukan beberapa DDiS yang tidak ada di DrugBank. Kami mengevaluasi ini secara manual,berdasarkan bukti-bukti interaksi pendukungnya, dan analisis kami menunjukkan bahwa 81,3% dari interaksi tersebut tidak benar. Hal ini menunjukkan bahwa pendekatan kami dapat mengungkap DDiS dengan bukti-bukti ilmiah yang menjelaskan mekanisme interaksi. 1 PENDAHULUAN Salah satu tantangan dalam pemberian obat dan pengembangan obat adalah kebutuhan untuk mengidentifikasi dan menghindari interaksi obat-obat yang potensial (DDIS). Ketika beberapa obat sedang diberikan, ada kemungkinan reaksi obat dapat merugikan salah satu obat dengan meningkatkan atau mengurangi efek obat lain. Selama pengembangan obat, sangat penting untuk mengidentifikasi interaksi obat dengan senyawa obat baru yang sedang diselidiki. Mengungkap mekanisme di balik interaksi obat dapat memberikan bukti-bukti ilmiah yang diperlukan untuk penyelidikan lebih lanjut dari kemampuan senyawa obat. Kemampuan untuk menemukan DDiS dan bukti-bukti ilmiah yang efisien dan ekonomis dapat berdampak pada pendekatan saat ini dalam pemberian obat dan pengembangan obat. Sebuah sumber umum untuk menemukan DDiS adalah melalui penggunaan database komersial seperti Thomson Micromedex DrugDex System (Micromedex) atau database online obat yang tersedia secara bebas

Menemukan interaksi obat

  • Upload
    umm

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Menemukan interaksi obat-obat: teks-pertambangan dan penalaran pendekatan berdasarkan sifat metabolisme obat

Motivasi: Mengidentifikasi interaksi obat-obat (DDIS) adalah prosespenting pemberian obat dan pengembangan obat.Alat pendukung klinissering menyediakan daftar komprehensif DDiS, tetapi mereka biasanyakekurangan bukti ilmiah yang mendukung dan perbedaan alat dapatmenggembalikan hasil yang tidak konsisten. Pada artikel ini, kamimengusulkan sebuah novel Pendekatan yang mengintegrasikan text miningdan penalaran otomatis untuk menurunkan DDiS. Melalui ekstraksiberbagai fakta metabolisme obat, tidak hanya DDiS yang secaraeksplisit disebutkan dalam teks dapat diekstraksi tetapi juga potensiinteraksi yang dapat disimpulkan dengan penalaran.

Hasil: Pendekatan kami mampu menemukan beberapa DDiS yang tidak ada diDrugBank. Kami mengevaluasi ini secara manual,berdasarkan bukti-buktiinteraksi pendukungnya, dan analisis kami menunjukkan bahwa 81,3% dariinteraksi tersebut tidak benar. Hal ini menunjukkan bahwa pendekatankami dapat mengungkap DDiS dengan bukti-bukti ilmiah yang menjelaskanmekanisme interaksi.

1 PENDAHULUAN

Salah satu tantangan dalam pemberian obat dan pengembangan obat adalahkebutuhan untuk mengidentifikasi dan menghindari interaksi obat-obatyang potensial (DDIS). Ketika beberapa obat sedang diberikan, adakemungkinan reaksi obat dapat merugikan salah satu obat denganmeningkatkan atau mengurangi efek obat lain. Selama pengembangan obat,sangat penting untuk mengidentifikasi interaksi obat dengan senyawaobat baru yang sedang diselidiki. Mengungkap mekanisme di balikinteraksi obat dapat memberikan bukti-bukti ilmiah yang diperlukanuntuk penyelidikan lebih lanjut dari kemampuan senyawa obat. Kemampuanuntuk menemukan DDiS dan bukti-bukti ilmiah yang efisien dan ekonomisdapat berdampak pada pendekatan saat ini dalam pemberian obat danpengembangan obat.

Sebuah sumber umum untuk menemukan DDiS adalah melalui penggunaandatabase komersial seperti Thomson Micromedex DrugDex System(Micromedex) atau database online obat yang tersedia secara bebas

seperti DrugBank (Wishartet al., 2006). Sementara database tersebutmenyediakan daftar ekstensif DDiS, itu adalah bukti-bukti ilmiah khasyang tidak diberikan sebagai bagian dari informasi untuk DDiS. Hal inimenjadi masalah ketika sebuah penelitian terbaru menunjukkan bahwa ada~ 25% dari perbedaan pendapat antara dua obat kompendium (Wonget al.,2008). Kurangnya bukti ilmiah mempersulit proses verifikasi perbedaan.Sebuah sumber yang ideal tidak hanya harus memberikan daftar lengkapDDiS dengan cara hemat biaya tetapi juga mekanisme di balik interaksi.Text mining dari Medline abstrak merupakan pilihan yang logis untukmengidentifikasi DDIS, sebanyak informasi ilmiah sering tersedia dalamartikel biomedis. Selain itu, teks mining memiliki potensi untukmenemukan sejumlah besar DDiS dari teks dalam cara yang hemat biaya.

Pada artikel ini, kami mengusulkan sebuah pendekatan baru untukmenemukan DDiS melalui integrasi 'domain pengetahuan biologi' dengan'fakta-fakta biologis' dari Medline abstrak dan sumber dikuratori.Pekerjaan kami adalah salah satu dari sedikit yang memanfaatkanpengetahuan domain biologis dalam aplikasi mereka, seperti generasijaringan metabolik berdasarkan kendala stoikiometri (Mavrovouniotisetal., 1990), generasi hipotesis dalam jalur sinyal (Tranet al., 2005)dan sintesis jalur farmakokinetik (Tariet al., 2010). Dalam karya ini,domain pengetahuan biologi itu meliputi mekanisme bagaimana obat Amempengaruhi efek obat B melalui induksi atau inhibisi enzim yangbertanggung jawab untuk metabolisme B. Dengan pengetahuan domain,komponen lainnya adalah untuk menemukan biologi fakta untuk mendukungDDiS tertentu. Contoh fakta-fakta biologis dari Medline abstrakmencakup identifikasi yang enzim yang diinduksi atau dihambat olehobat serta enzim yang bertanggung jawab untuk metabolisme obat. Sumberdikuratori seperti UniProt (http://www.uniprot.org) dan Gene Ontologi(GO) penjelasan (http://www.geneontology.org) yang digunakan untukmengidentifikasi keluarga protein seperti enzim dan faktortranskripsi. Mengintegrasikan pengetahuan domain biologis denganfakta-fakta biologis memungkinkan kita untuk menurunkan DDiS. Langkahini dicapai melalui penggunaan representasi logika domain pengetahuan

dan penalaran otomatis. Penting untuk dicatat bahwa pendekatan kamiberbeda dari pendekatan ekstraksi yang khas, yang berfokus padaekstraksi interaksi yang dinyatakan secara eksplisit dalam teks. Dalampendekatan kami, berbagai sifat dapat diekstraksi dari publikasi yangberbeda sehingga sistem yang memanfaatkan sifat diekstrak untukmendapatkan DDiS potensial. Hal ini memungkinkan kita untuk menemukanDDiS potensi yang masih harus dijelaskan dalam sumber daya yangkomprehensif tentang DDiS seperti DrugBank

Sisa dari artikel ini diuraikan sebagai berikut. Kami menjelaskansifat dasar DDiS yang kita encode dalam sistem kami dalam Bagian 2.Dalam Bagian 3, proses memperoleh fakta-fakta yang diperlukan daninteraksi dari basis pengetahuan yang ada dan Medline abstrakdijelaskan. Selain itu, komponen penalaran diilustrasikan padabagaimana sifat-sifat metabolisme obat dikodekan dalam rangka untukmemperoleh DDiS. Pada Bagian 4, kita menggambarkan skenario yangmungkin menerapkan pendekatan kami terhadap pemberian obat dan desainobat. Kami menunjukkan kelayakan pendekatan kami dengan menggambarkankebenaran DDiS yang diperoleh pendekatan kami dalam Bagian 5. Kamimenyimpulkan dalam Bagian 6

2 DDiS

DDiS umum melibatkan bagaimana obat dimetabolisme oleh tubuh.Interaksi berbasis Metabolisme terutama terjadi di hati karenasebagian besar obat dimetabolisme oleh enzim yang berada dalam hati.Sebuah obat diharapkan akan dieliminasi oleh tubuh dalam jumlah waktutertentu setelah diambil. Dalam kasus ketika proses eliminasi obatmemakan waktu lebih lama dari yang diharapkan, toksisitas dapatdiakumulasikan atau efek farmakologis obat dapat dilebih-lebihkan.Induksi atau menghambat enzim yang dapat mempengaruhi obat langsungatau tidak langsung melalui regulasi transkripsi. Jika enzim yangbertanggung jawab untuk metabolisme obat A dapat dihambat ataudiinduksi oleh obat lain, maka bioavailabilitas obat A akan lebihtinggi atau lebih rendah dari yang diharapkan, rendering itu beracunatau kurang efektif.

Penghambatan enzim adalah bentuk umum dari DDiS (Boobis, 2009).Seperti jenis 'penghambatan langsung' terjadi ketika obat A menghambat

enzim E, yang bertanggung jawab untuk metabolism obat B. Interaksiobat tersebut menyebabkan penurunan tingkat aktivitas enzim, dan inipada gilirannya dapat meningkatkan bioavailabilitas untuk obat B .Atau, hal ini dapat mengurangi pembentukan metabolit dari menghambatenzim dan menyebabkan kegagalan terapi dari obat yang terkena dampak.Sebuah contoh dari penghambatan langsung tersebut adalah interaksiantara quinidine dan CYP2D6 substrat seperti kodein, seperti quinidinebertanggung jawab untuk menghambat CYP2D6. Di sisi lain, CYP2D6substrat seperti kodein dimetabolisme oleh CYP2D6. Penghambatan CYP2D6oleh quinidine meningkatkan ketersediaan obat dimetabolisme olehCYP2D6. Peningkatan tersebut berpotensi dapat menyebabkan efek sampingdari obat yang terkena dampak.

Bentuk lain dari interaksi obat adalah melalui induksi enzim( Boobis , 2009) . Salah satu bentuk induksi dikenal sebagai induksilangsung ketika obat A menginduksi enzim E , yang bertanggung jawabuntuk metabolisme obat B. Contoh induksi langsung tersebut antarawarfarin dan fenobarbital . Interaksi obat tersebut terjadi karenafakta bahwa warfarin dimetabolisme oleh CYP2C9 , sementara CYP2C9dikenakan induksi dengan fenobarbital . Hal ini menyebabkanpeningkatan aktivitas enzim CYP2C9 , yang meningkatkan lajumetabolisme warfarin oleh CYP2C9 . Kenaikan metabolisme menurunkanbioavailabilitas warfarin . Sementara induksi mungkin langsung, itubukan bentuk paling umum dari interaksi obat karena induksi . Bentukyang lebih umum adalah melalui faktor transkripsi yang mengatur enzimmetabolisme obat . Sebuah bentuk alternatif adalah induksi tidaklangsung melalui faktor transkripsi . Interaksi tersebut terjadiketika obat A mengaktifkan faktor transkripsi ' TF ' , yang mengaturdan menginduksi enzim E , dan enzim E bertanggung jawab untukmetabolisme B. faktor transkripsi seperti obat disebut sebagairegulator untuk enzim metabolisme xenobiotik - . Contoh regulatortersebut aril hidrokarbon reseptor AHR , pregnane X reseptor PXR dankonstitutif androstane reseptor CAR . Gambar 1 menggambarkan bagaimanainduksi atau penghambatan faktor transkripsi dan enzim berkontribusiterhadap interaksi obat.

Selain interaksi berbasis metabolisme, interaksi obat juga dapatterjadi karena induksi atau inhibisi transporter. Transporter terutama

bertanggung jawab untuk penyerapan selular atau penghabisan selulerobat. Transporter memainkan peran penting dalam disposisi obat sebagaiobat hanya dapat dimetabolisme setelah mereka diangkut ke sel-selhati. Namun, obat berbasis transporter

Gambar. 1.The efek obat A pada obat B melalui (A) induksi langsung /inhibisi enzim, (B) langsung induksi / penghambatan faktor transkripsiyang mengatur enzim metabolisme obat.

interaksi tidak juga dipelajari sebagai interaksi berbasis metabolisme(Boobis, 2009). Pada artikel ini, kami menekankan pada ekstraksiinteraksi obat berbasis metabolisme.

3 METODE

Pendekatan kami dalam mengidentifikasi DDIS dapat digambarkan dalamdua tahap: (i) fase ekstraksi bahasa alami, (ii) tahap penalaran. Kitamulai dengan melakukan satu kali offline dengan mengurai dari dokumendan menyimpan representasi terstruktur dari teks tidak yangterstruktur dalam bentuk struktur sintaksis ke dalam database yangdisebut 'parse pohon database'. Informasi yang terstruktur tersebutmeliputi struktur gramatikal kalimat yang dikenal sebagai 'pohonparse' dan entitas biologis yang terlibat dalam kalimat. Informasiyang disimpan dari kalimat yang digunakan untuk ekstraksi dengan caraquery database dalam bentuk 'parse tree bahasa query' (PTQL). PTQL (Tuet al., 2008) adalah bahasa query fleksibel yang dirancang untukmengekstraksi berbagai jenis hubungan. Meskipun hubungan diekstraksimemberikan pengetahuan yang diperlukan untuk mengidentifikasi DDIS,hubungan diekstrak saja tidak cukup untuk menurunkan DDiS. Dengan

'mewakili pengetahuan umum tentang metabolisme obat dan interaksi'dalam bentuk aturan logika, hubungan diekstraksi kemudian diterapkanpada aturan logika untuk mengungkapkan DDiS dalam 'fase penalaran'.Sebuah gambaran dari pendekatan kami diilustrasikan pada Gambar 2. Disini kita menggambarkan komponen utama dari pendekatan kami dalamrincian.

3.1 Parse basis data pohon dan PTQL

Sebuah pohon parse terdiri dari pohon konstituen dan sebuah hubungan .Sebuah pohon konstituen adalah pohon sintaksis kalimat dengan nodediwakili oleh part - of - speech tags dan daun sesuai dengan kata-katadalam kalimat . dependensi sintaksis merupakan hubungan ang diwakili (atau link ) antara pasangan kata dalam kalimat . Pohon-pohon parsediproduksi oleh Grammar parser Link ( Sleator dan Temperley , 1993 ) ,sedangkan BANNER ( Leaman dan Gonzalez , 2008 ) digunakan untukmengenali gen / protein dan nama MetaMap ( Aronson , 1996 ) untuk namaobat . Untuk disebut disambiguate gen , AGAS ( Hakenberget al . ,2008) diterapkan untuk mengidentifikasi simbol resmi gen untukmenyebutkan setiap gen yang diidentifikasi oleh BANNER . Informasisintaksis dan semantik kalimat disimpan dalam database pohon parse danekstraksi dilakukan dengan menggunakan query database . Denganmenyimpan informasi sintaksis dan semantik , ini menghindari kebutuhanpengolahan koleksi dokumen setiap kali ekstraksi dilakukan . Hal inijuga memungkinkan ekstraksi on-the-fly yang cocok untuk mengekstraksiberbagai jenis interaksi yang diperlukan dalam tujuan mengidentifikasiinteraksi obat .

database pohon parse kami dikelola oleh MySQL yang mengandung ~ 17juta Medline abstrak. Karena sifat hirarki dari sintaksis dan

Sebuah gambaran dari pendekatan kami dalam mengeluarkan interaksiobat. (A) Dalam 'fase ekstraksi', query diterapkan ke database pohonparse untuk ekstraksi berbagai interaksi. (B) Dengan memanfaatkaninteraksi diekstrak, 'fase penalaran' berlaku interaksi dengan aturanlogika untuk mendapatkan interaksi obat-obat.

informasi kalimat semantik, menulis query SQL untuk dapat diekstraksimenjadi rumit dengan menggunakan banyak tabel join. Pendekatan kamiadalah untuk mengembangkan bahasa query disebut PTQL yang memungkinkanhubungan ekstraksi generik. Sebuah query PTQL terdiri dari empatkomponen: (i) pola pohon, (ii) kondisi link, (iii) kondisi kedekatan,dan (iv) ekspresi kembali. Komponen dalam permintaan PTQL dipisahkandengan simbol ':'. Kami menggambarkan permintaan PTQL dengan contoh-contoh di bagian akhir. Pada tahap ekstraksi, ' PTQL query evaluator 'mengambil PTQL query dan mengubahnya menjadi query SQL. Yangditerjemahkan SQL query dan dievaluasi terhadap database pohon parsesehingga informasi yang dikembalikan adalah yang dimaksud interaksidari abstrak

3.2 Natural language extraction

Strategi kami ekstraksi dapat dikategorikan sebagai ekstraksieksplisit dan implisit DDiS dari teks. 'Ekstraksi eksplisit' mengacupada ekstraksi dari DDI yang dijelaskan dalam kalimat, sedangkan'ekstraksi implisit' memerlukan ekstraksi berbagai properti dari

metabolisme obat yang dapat menyebabkan DDI. Properti ini meliputiidentifikasi keluarga protein dan interaksi yang terlibat dalammetabolisme obat. Informasi tersebut disimpan dalam tabel database

3.2.1 Ekstraksi interaksi obat eksplisit

Deskripsi DDiS kadang-kadang dapat ditemukan di Medline abstrak. Mampumengekstrak deskripsi eksplisit seperti interaksi antara obat adalahsangat penting. Contoh kalimat dari Medline abstrak yang menggambarkaninteraksi obat dalam kalimat per kalimat.

• S1: 'Ciprofloxacin' sangat menghambat 'clozapine' metabolisme (PMID:19067475).

• S2: induksi Enansioselektif dari 'siklofosfamid' metabolisme dengan'fenitoin' (PMID: 10423284).

Kami menggunakan dua pertanyaan ekstraksi yang memanfaatkan kata kunci'menginduksi', 'menginduksi', 'induksi' untuk mengekstrak bagaimanasatu obat mengurangi efek obat lain. Demikian pula, kita menggunakankata kunci 'menghambat', 'menghambat', 'penghambatan' untuk menemukanpeningkatan efek dari satu obat dengan obat lain. Di sini kitamenggambarkan di bawah salah satu query sebagai PTQL query.

//S{//?[Tag=‘Drug’](d1) =>

//?[Value IN {‘induce’, ‘induces’, ‘inhibit’,

Tabel 1.Triplets mewakili berbagai sifat yang relevan dengan ekstraksiinteraksi obat implisit dan deskripsi

<p, metabolizes, d> Obat d dimetabolisme oleh protein p<d, inhibits, p> Obat d menghambat aktivitas protein p<d, induces, p> Obat d menginduksi aktivitas protein p<p1,regulates, p2> Protein p1 mengatur aktivitas p2 protein

‘inhibits’}](v) => //?[Tag=‘Drug’](d2) =>//?[Value= ‘metabolism’](w)} :: [d1 v d2 w]5 :d1.value, v.value, d2.value

Pola pohon query di atas menetapkan bahwa obat (dilambangkan asd1) danharus diikuti oleh (dilambangkan sebagai operator =>) salah satu katakunci 'menginduksi', 'menginduksi', 'menghambat', 'menghambat', yangkemudian dilanjutkan dengan obat lain (dilambangkan sebagai d2) dengan'metabolisme' kata kunci. Kondisi kedekatan [d1 d2 v w] 5 menunjukkanbahwa kata-kata harus muncul dalam lima kata oleh satu sama lain dalamkalimat yang cocok. Kembalinya ekspresi d1.value, v.value, d2.valuemenentukan kembalinya nilai-nilai untuk <d1,v,d2> triplet. Triplet<d1,induce/induces,d2> menyiratkan bahwa obat d1 mengurangi efek obatd2 (yaitu <d1,decreases,d2>), sedangkan <d1,inhibit/inhibits,d2> untukmenambah efek d2byd1 (yaitu <d1,increases,d2>). Dengan query PTQL, S1kalimat sesuai dengan kriteria query dan triplet <ciprofloxacin,increases, clozapine> adalah terbentuk

3.2.2 Ekstraksi interaksi obat implisitAda kasus ketika temuan eksperimental interaksi obat belumdipublikasikan tetapi mereka dapat disimpulkan berdasarkan berbagaiproperti dari metabolisme obat. Hal ini penting untuk melihat bahwasifat tersebut dapat berasal dari berbagai publikasi. Pendekatan kamiadalah untuk mengekstrak sifat yang relevan dan memanfaatkan interaksidiekstrak untuk menyimpulkan interaksi obat melalui penalaranotomatis.Tabel 1 menggambarkan berbagai jenis interaksi yang diperlukan untukmenyimpulkan interaksi obat. Query PTQL berbeda digunakan untukekstraksi. Sebagai contoh, pertanyaan berikut PTQL digunakan untukmengekstrak <protein,metabolizes, drug> triplet:

//S{/?[Tag=’DRUG’](kw2) => //VP{//?[Value IN{’metabolised’,’metabolized’}](kw1) =>//?[Tag=’GENE’](kw0)}} :::kw0.value, kw1.value, kw2.value

Pola pohon query di atas menetapkan bahwa obat (dilambangkan sebagaiKW2) diikuti oleh frase verba (dilambangkan sebagai VP), sehinggafrase verba termasuk salah satu kata kunci 'dimetabolisme' atau'dimetabolisme' dan diikuti oleh gen (dilambangkan sebagai kw0).Ungkapan kembali memastikan bahwa triplets <protein, metabolizes,drug> dikembalikan dari kalimat yang cocok. Tabel 2 menggambarkansampel triplets dan bukti-bukti pendukungnya untuk ekstraksi berbagaimacam interaksi

3.3 Representasi pengetahuan dan penalaranSebagai interaksi sendiri tidak mengungkapkan jenis pemesanan,tujuannya adalah untuk mewakili perilaku dasar dan sifatfarmakokinetik sehingga representasi dapat digunakan untuk menetapkanpemesan dari interaksi melalui penalaran. Pelaksanaan komponenpenalaran membutuhkan bahasa yang ideal dalam menentukan apa jenispenalaran yang akan dilakukan bukan bagaimana penalaran dilakukan. Halini analog dengan bahasa pemrograman deklaratif seperti SQL, di manapengguna menentukan apa yang dimaksudkan untuk ditemukan daripadabagaimana mekanisme pencarian dari sistem database harus dilakukanuntuk menjawab pertanyaan. AnsProlog (Gelfond dan Lifschitz, 1988,1991) adalah bahasa deklaratif yang berguna untuk penalaran, sertamampu untuk penalaran dengan informasi yang tidak lengkap. Hal inipenting.

Tabel 2.Sample interaksi diekstraksi untuk setiap jenis hubungan danbukti dukungan mereka.8689812 Lovastatin dimetabolisme oleh CYP3A4. <cyp3a4, Metabolizes,lovastatin>8477556 Penghambatan oleh fluoxetine sitokrom P450 2D6 aktivitas.<fluoxetine, inhibits, cyp2d6>10678302 Fenitoin menginduksi CYP2C dan CYP3A4 isoform, tapi tidakCYP2E1. <phenytoin, induces, cyp2c>, <phenytoin, induces, cyp3a4>11502872 Gen CYP2B6 secara langsung diatur oleh PXR <pxr, regulates,cyp2b6>

Tabel 3.Logic fakta berubah dari interaksi diekstrak pada Tabel 1setelah membersihkan dataFakta logika dan deskripsi dimetabolisme (d, p): berubah dari <p, metabolizes, d> untuk mewakilibahwa obat d dimetabolisme oleh enzim pmenghambat (d, p): berubah dari <d, inhibits, p> untuk mewakili bahwaobat d menghambat aktivitas enzim pmenginduksi (d, p): berubah dari <d, induces, p> untuk mewakili bahwaobat d menginduksi aktivitas enzim pmengatur (p1, p2): berubah dari <p1,regulates, p2> untuk menyatakanbahwa faktor transkripsi p1 mengatur aktivitas enzim p2

melihat bahwa AnsProlog adalah bahasa deklaratif yang berbeda dariProlog. Sementara Prolog adalah bahasa pemrograman dengan akar dalamlogika, itu termasuk banyak fitur non-logis yang tidak deklaratif,sehingga tidak cocok untuk representasi pengetahuan. Di sini kitamemberikan pengantar singkat dengan sintaks AnsProlog.AnAnsProlog ruleis dalam bentuk:

dimana lis adalah literal dan tidak merupakan negasi sebagaikegagalan. Arti intuitif aturan di atas adalah bahwa jika diketahuibahwa literal l0, ..., lm harus benar dan jika lm 1, ..., ln bisaberasumsi palsu, kemudian l harus benar. Sebuah literal didefinisikansebagai sebuah atom atau atom didahului oleh ¬ simbol yang menunjukkannegasi klasik. Jika tidak ada literal di kepala aturan, maka aturanini disebut sebagai kendala. Sebuah program set jawaban terdiri dariseperangkat aturan AnsProlog, dan interpretasi dari program setjawaban disebut jawaban set. Pembaca dapat merujuk Baral (2003) untukrincian lebih lanjut tentang sintaks dan semantik AnsProlog

3.3.1 Pembentukan fakta logikaUntuk memanfaatkan interaksi diekstraksi untuk tujuan penalaran,masing-masing harus terlebih dahulu diterjemahkan ke dalam bentuklogika mereka. Interaksi diekstrak dalam bentuk triplet<actor1,relation, actor2> seperti pada Tabel 3 direpresentasikansebagai extr (actor1, relasi, actor2). Misalnya, triplet <protein,

metabolizes,drug> direpresentasikan sebagai extr (Protein,memetabolisme, Obat), di mana Enzim dan Obat adalah variabel untukenzim domain dan obat. Misalnya, triplet <cyp3a4, metabolizes,lovastatin> diwakili oleh factsextr logika (CYP3A4, memetabolisme,lovastatin), protein (CYP3A4) dan obat (lovastatin)3.3.2 Data CleaningPada tahap ekstraksi , interaksi obat - protein seperti < protein ,memetabolisme , obat > dan protein - protein interaksi seperti <protein , mengatur , protein > diambil dari database pohon parsing .Namun, perlu untuk memasukkan langkah ekstra untuk memastikan bahwainteraksi ini diekstrak sesuai dengan sifat-sifat metabolisme obatsebelum mereka dapat diterapkan untuk menurunkan DDiS . Misalnya ,protein yang terlibat dalam triplet < protein , memetabolisme , obat >harus enzim agar obat yang akan dimetabolisme . Oleh karena itu,hubungan diekstrak harus disempurnakan menjadi < enzim , memetabolisme, obat > untuk triplet < protein , memetabolisme , obat > . Demikianjuga , triplet <protein, regulates, protein > harus disempurnakanmenjadi < faktor transkripsi , mengatur , enzim > . Perbaikan tersebutuntuk interaksi diekstraksi membutuhkan proses yang disebut 'pembersihan data ' . Ini termasuk mengidentifikasi keluarga proteinuntuk protein yang terlibat dalam interaksi diekstrak dan penggalianinteraksi negatif . Informasi tersebut digunakan untuk memperbaikiinteraksi dengan cara aturan AnsProlog . Kami pertama menggambarkanrincian mengidentifikasi keluarga protein menggunakan UniProt , GO danEntrez ringkasan Gene .

olds (dalam urutan tertentu diutamakan):• p milik CYP tersebut, UGT atau keluarga gen sult, yaitu simbol genresmi dimulai dengan CYP, UGT atau sult;• p adalah dijelaskan di bawah UniProt sebagai memiliki kata kunci'hidrolase', 'ligase', 'liase' atau 'transferase';• p adalah dijelaskan di bawah GO istilah 'proses metabolisme' (GO:0.008.152);• Gene ringkasan Entrez (disediakan oleh RefSeq) dari p berisi'metabolisme obat' frase kunci atau ekspresi reguler 'enzim *' atau'catalyz *'.

Sebuah protein p dianggap sebagai 'faktor transkripsi' jika (dalamurutan tertentu diutamakan):• p adalah dijelaskan di bawah UniProt sebagai memiliki kata kunci'transkripsi', 'transkripsi-regulator' atau 'aktivator';• PI dijelaskan di bawah GO istilah 'aktivitas faktor transkripsi'(GO: 0.003.700);• Entrez Gene ringkasan p berisi kata kunci 'faktor transkripsi'.

Enzim dan faktor transkripsi yang direpresentasikan dalam bentuk enzim(Protein) dan transcription_factor (Protein), di mana Protein adalahvariabel untuk domain 'protein'. Misalnya, enzim CYP3A4 diwakiliasenzyme (CYP3A4) dan protein (CYP3A4).Dalam ekstraksi interaksi, ada saat-saat bahwa interaksi negatif yangdiekstrak. Pertimbangkan kalimat contoh berikut:S3. ... Oxybutynin ini sebagian besar dimetabolisme oleh CYP3A4 danCYP3A5 tetapi tidak oleh CYP2D6 (PMID: 9584328).Dengan mempertimbangkan kata-kata negasi seperti 'tidak' dalam queryekstraksi, interaksi negatif <CYP2D6, not_metabolizes, oxybutynin>diekstrak.Dengan identifikasi keluarga protein dan ekstraksi interaksi negatif,kita melakukan pembersihan data pada interaksi diekstraksi denganmenggunakan aturan logika AnsProlog untuk memperbaiki interaksi. Kamimenggunakan aturan AnsProlog berikut untuk menggambarkan gagasanpembersihan data.

metabolized(D, P) :- extr(P, metabolizes, D),drug (D), enzyme(P),not extr(P, not_metabolizes, D).

Aturan logika AnsProlog atas memurnikan <protein, metabolizes, obat>hubungan dalam bentuk extr (P, memetabolisme, D) ke<enzyme,metabolizes,drug> dalam bentuk dimetabolisme (D, P), asalkan Dobat dan P dikenal enzim, yang direpresentasikan sebagai obat (D) danenzim (P). Kondisi lain untuk perbaikan tersebut adalah bahwa ia tidakdiketahui memiliki interaksi negatif untuk interaksi tertentu diantara interaksi diekstrak. Kondisi ini diberlakukan dengan tidak extr(P, not_metabolizes, D). Data serupa membersihkan aturan logika

ditulis untuk mencapai fakta logika dari interaksi yang sesuai merekadiekstraksi, seperti digambarkan dalam Tabel 3. mencapai fakta logikadari interaksi yang sesuai mereka diekstraksi, seperti digambarkandalam Tabel 3.Menggunakan S3 kalimat sebagai contoh, aturan logika ternyatadiekstraksi interaksi extr (CYP3A4, memetabolisme, oxybutynin) danextr (CYP3A5, memetabolisme, oxybutynin) ke dalam fakta logikadimetabolisme (oxybutynin, CYP3A4), dimetabolisme (oxybutynin,CYP3A5), yang disediakan fakta bahwa logika enzim (CYP3A4) dan enzim(CYP3A5) disimpan dalam database hasil diekstraksi. Di sisi lain, extr(CYP2D6, memetabolisme, oxybutynin) tidak dapat diubah menjadidimetabolisme (oxybutynin, CYP2D6) jika extr (CYP2D6, tidakmemetabolisme, oxybutynin) adalah salah satu interaksi

3.3.3 Mewakili pengetahuan tentang metabolisme obatKami menyandikan aturan yang mewakili berbagai sifat metabolisme obatdan bagaimana sifat menyebabkan DDiS. Aturan 1 mengkodekan efek dariaktivitas protein melalui induksi dengan obat. Di sisi lain, Aturan 2menggambarkan efek dari aktivitas protein yang diatur oleh faktortranskripsi, yang pada gilirannya disebabkan oleh obat. Aturan 1 dan 2menjelaskan langkah-langkah yang diperlukan terlibat dalam DDiSlangsung dan tidak langsung. Penurunan efek dari obat dengan obat lainditentukan oleh Aturan 3. Aturan serupa ditulis untuk perubahan dalamaktivitas protein akibat inhibisi oleh obat

• Rule 1: Changes in the activity of protein Pdue to induction by adrugDraffects(Dr, level(P, high)) :-induces(Dr, P), drug(Dr), protein(P).• Rule 2: Changes in the activity of protein Pdue to induction of theregulating transcription factorTFby drugDraffects(Dr, level(P, high)) :-affects(Dr, level(TF, high)),protein(P),regulates(TF, P), drug(Dr),transcription_factor(TF).• Rule 3: Drug interactions through induction of enzymesresult(Dr1, decreases, Dr2) :-affects(Dr1, level(P, high)), enzyme(P),metabolized(Dr2, P), drug(Dr1), drug(Dr2).

3.3.4 PenalaranMemberit satu set obat D sangat penting, tujuannya adalah untukmenemukan interaksi antara D. ini melibatkan ekstraksi berbagai faktaseperti yang tercantum dalam Tabel 1. Fakta-fakta direpresentasikandalam bentuk fakta logika seperti yang dijelaskan dalam Bagian 3.3.1.Tahap penalaran melibatkan penggunaan pembersihan data seperti yangdijelaskan dalam Bagian 3.3.2 bersama-sama dengan aturan yangmenjelaskan sifat-sifat yang terlibat dalam metabolisme obat sepertiyang dijelaskan dalam Bagian 3.3.3. Sebuah AnsProlog solver disebutClingo (Gebser et al., 2009) kemudian digunakan untuk menghitungjawaban set yang menyimpulkan DDiS antara D

4 SKENARIOKami menggambarkan sistem kami dengan skenario untuk pemberian obatdan pengembangan obat.4.1 Pemberian obatKami menggambarkan bagaimana sistem kami dapat digunakan untukmengawasi pemberian obat. Misalkan seorang pasien akan diresepkandengan dua obat fenitoin dan gefitinib, seorang dokter atau apotekerbutuh untuk mengetahui apakah kedua obat dapat memicu setiapinteraksi.Di antara interaksi diekstrak, si kembar tiga <phenytoin, induces,cyp3a4> dan <cyp3a4, metabolizes, gefitinib> didukung oleh bukti-buktiberikut.

• Phenytoin menginduksi CYP2C dan bentuk iso CYP3A4, tapi tidak CYP2E1( PMID : 10678302 ) .• Gefitinib secara ekstensif dimetabolisme di hati oleh enzim sitokromP450 3A4 ( PMID : 14977817 ) .Dengan factenzyme ( CYP3A4 ) , aturan pembersihan data dipicu danmenghasilkan fakta-fakta logika berikut :• dimetabolisme ( gefitinib , CYP3A4 )• menginduksi ( fenitoin , CYP3A4 )Logika factinduces ( fenitoin , CYP3A4 ) memicu salah satu aturanlogika tentang efek tingkat ekspresi enzim . Ini hasil dalam kenyataanlogika berikut .• mempengaruhi ( fenitoin , tingkat ( CYP3A4 , tinggi ) )Fakta logika pada gilirannya memicu salah satu aturan interaksi obat ,dan sistem menunjukkan bahwa fenitoin obat mengurangi efek gefitinibdengan fakta logika berikut .• Hasil ( fenitoin , menurun , gefitinib )Yang dihasilkan Fakta logika meminta dokter atau apoteker medis yangphenytoin dan gefitinib dapat memiliki potensi interaksi obat . Sangatmenarik untuk dicatat bahwa interaksi fenitoin - gefitinib ini jugadijelaskan di DrugBank , tapi pendekatan kami memberikan bukti-buktiilmiah untuk menjelaskan mekanisme di balik interaksi .

4.2 Pengembangan Obat

Mengidentifikasi potensi interaksi obat dengan senyawa kimia baru ditangan sangat penting dalam proses pengembangan obat.Misalkan kita tahu bahwa senyawa kimia baru sedang kami selidiki dandikenal sebagai inhibitor untuk enzim. Dengan informasi ini, kitaingin mengidentifikasi apa obat yang dikenal dapat dipengaruhi olehsenyawa baru. Misalkan senyawa baru kami (dilambangkan sebagainew_drug) adalah inhibitor CYP3A4, kami mewakili informasi tersebutdalam bentuk fakta logika sebagai input ke sistem kami.

• menghambat ( new_drug , CYP3A4 )Fakta ini memicu salah satu aturan logika tentang efek dari aktivitasenzim . Dalam hal ini , tingkat ekspresi CYP3A4 menjadi rendah karenapengaruh inhibitor CYP3A4 . Ini hasil dalam kenyataan logika berikut .• mempengaruhi ( new_drug , tingkat ( CYP3A4 , rendah) )Di antara interaksi diekstrak , terfenadine ditemukan menjadi salahsatu obat yang dimetabolisme secara luas oleh CYP3A4 . Hal inimenyebabkan logika fakta extr ( terfenadine , dimetabolisme , CYP3A4 ). Bersama dengan factenzyme ( CYP3A4 ) dan tidak ada fakta logika laindalam database interaksi diekstraksi menunjukkan terfernadine yangtidak dimetabolisme oleh CYP3A4 , ini memicu salah satu pembersihandata aturan dan fakta logika berikut terbentuk .• dimetabolisme ( terfernadine , CYP3A4 )Fakta-fakta baru terbentuk mempengaruhi ( new_drug , tingkat( CYP3A4 , rendah) ) andmetabolized ( terfernadine , CYP3A4 ) inturnmemicu salah satu aturan interaksi obat , dan sistem menunjukkan bahwabaru CYP3A4 inhibitor dapat meningkatkan efek terfenadine dengan faktalogika berikut .

Tabel 4.Correctness dari DDiS untuk ekstraksi DDiS eksplisit, implisitDDiS sebagai akibat dari penghambatan langsung / induksi daninhibisi / induksi enzim tidak langsung

• Hasil (new_drug, meningkat, terfenadine)Skenario ini menunjukkan bahwa sistem kami tidak hanya dapatmengingatkan para peneliti untuk DDiS, tetapi juga mekanisme di balikinteraksi sehingga uji klinis dapat disesuaikan

5 HASILKami menggunakan DrugBank untuk menilai kinerja pendekatan kami dalammencari DDiS. Kami memilih 265 obat dan menemukan interaksi antaraobat ini. Hal ini menghasilkan standar emas dari 494 DDiS dengandeskripsi menyatakan bahwa satu obat meningkatkan atau mengurangi efekobat lain. Kami menyebutnya set ini interaksi obat sebagai 'DrugBankstandar emas'

Kami pertama evaluasi kinerja ekstraksi DDiS eksplisit. Hasilnyadiringkas dalam Tabel 4. Sebuah eksplisit interaksi obat diekstraksidari satu kalimat kedalam abstrak Medline. Query ekstraksi kami untuk interaksi obat eksplisit adalah khususuntuk 265 obat yang kita pilih sebagai standar emas DrugBank, danhasil query ekstraksi ada 170 interaksi obat. Kami menemukan bahwa 132dari interaksi obat, diekstraksi (yaitu ketepatan 77,7%) , dan 20 darimereka (yaitu tumpang tindih 11,8%) yang dijelaskan dalam standar emasDrugBank. Hasil menunjukkan bahwa ada sejumlah berpotensi besarinteraksi obat yang diterbitkan yang tidak ditangkap oleh DrugBank. Di sisi lain, tumpang tindih kecil antara interaksi obat diekstraksidan interaksi dalam standar emas DrugBank juga menunjukkan bahwa adaruang untuk perbaikan dalam mengekstraksi interaksi obat.

Dengan ekstraksi implisit DDiS, kami berharap untuk mencapai jumlahinteraksi yang lebih tinggi untuk disimpulkan dan tumpang tindihdengan standar emas DrugBank . Ekstraksi DDiS implisit dibagi menjadidua bagian : ( i ) inhibisi langsung atau induksi enzim , (ii )penghambatan langsung atau induksi enzim . Ekstraksi DDiS implisit ( i) dan ( ii ) dari 17 juta Medline abstrak hasil di 4154 dan 979interaksi . Di antara interaksi diekstraksi dalam ( i ) , 108interaksi bertepatan dengan interaksi dalam standar emas DrugBank .Untuk orang-orang yang tidak ditemukan dalam standar emas DrugBank ,kami mengevaluasi interaksi berdasarkan bukti-bukti pendukungnyasecara manual . Secara khusus , kami mengevaluasi 315 interaksi yangdidukung oleh setidaknya dua bukti untuk <drug, induces/inhibits,hubungan protein> dan empat bukti untuk <protein, metabolizes, drug>hubungan .Kami menyadari bahwa 256 atau 81,3 % dari interaksi yang diekstraksidengan bukti-bukti yang benar untuk mendukung DDiS . Di antara 256interaksi yang benar, CYP3A4 terlibat dalam 171 dari mereka, yangmasuk akal sebagai CYP3A4 yang diketahui terlibat dalam metabolismemayoritas obat. Sebagian besar DDiS palsu disimpulkan adalah karenaekstraksi salah <drug, induces, protein> dan <drug, inhibits, protein>hubungan. Di sisi lain, kami memilih untuk interaksi (ii) yangdidukung oleh setidaknya dua bukti untuk setiap hubungan yangmendasarinya. Kami menyadari bahwa 30 interaksi yang didukung olehbukti-bukti yang benar, dan 21 dari interaksi melibatkan perubahanefek CYP3A4 substrat melalui induksi CAR (NR1I3) dan pengaturan CYP3A4oleh CAR

Sebagai pendekatan kami dalam mencari DDiS sangat bergantung padaekstraksi interaksi yang relevan , kita pertama dievaluasi kebenaraninteraksi diekstrak dari 13K Medline abstrak . Kami pertama kalimenciptakan standar emas untuk setiap interaksi ditentukan dalam Tabel1 . Sebagai contoh , dalam kasus menciptakan standar emas untukhubungan <protein,metabolizes,drug> , kami ekstrak kalimat denganrekan - kejadian obat dan gen menyebutkan bersama-sama dengan salahsatu kata kunci ' dimetabolisme ' , ' memetabolisme ' , 'dimetabolisme ',' memetabolisme ' , ' substrat ' dalam kalimatindividu. Kami kemudian memeriksa mana dari kalimat memang menunjukkan<protein, metabolizes, drug> hubungan . Hal ini mengakibatkan 372bukti kalimat yang kita gunakan sebagai standar emas untukmengevaluasi <protein, metabolizes, drug> hubungan . Penting untukdicatat bahwa dalam penciptaan standar emas , kita menghilangkankemungkinan hubungan lintas - kalimat . Selain itu, kami bergantungpada recognizer bernama entitas untuk mengidentifikasi kalimat denganrekan - kejadian obat dan menyebutkan gen

Kinerja ekstraksi untuk setiap interaksi individu diilustrasikan padaTabel 5. Dalam kasus <protein, regulates, protein> hubungan, strategikami adalah untuk mengekstrak co-kejadian enzim CYP dan salah satufaktor transkripsi yang dikenal untuk mengatur enzim xenobiotik (yaituAHR, NR1I2, NR1I3). Ini terbatas permintaan co-kejadian memungkinkankita untuk mencari hubungan berkualitas tinggi untuk <transcriptionfactors, regulates, enzymes>. Permintaan negasi untuk ekstraksihubungan negatif untuk berbagai interaksi yang tercantum dalam Tabel1. Kata kunci seperti 'tidak', 'tidak' termasuk dalam pertanyaan ini.Kami hanya mengevaluasi ketepatan ekstraksi interaksi negatif denganmenganalisis setiap hubungan diekstraksi dan bukti pendukungnya tanpamenciptakan standar emas.

6 PEMBAHASAN Kami menggambarkan pendekatan baru dalam menggabungkan text mining danteknik penalaran otomatis untuk menemukan DDiS dari Medline abstrak.Kami menunjukkan bahwa pendekatan ekstraksi kami memiliki kemampuanyang berbeda melakukan ekstraksi generik. Berbeda EDGAR (Rindflesch et

al., 2000) dan Pharmspresso (Garten dan Altman, 2009) yang mampumengekstraksi berbagai hubungan obat-gen, pendekatan kami menggunakanberbagai interaksi obat-gen dan protein-protein diekstrak untukmenyimpulkan DDiS yang tidak secara eksplisit dinyatakan dalam teksmelalui penalaran otomatis. Dengan mewakili fenomena biologis DDiSdalam representasi logis, pekerjaan kami bergantung pada penalaranotomatis untuk menyimpulkan DDiS daripada pendekatan jaringanheuristic yang digunakan dalam Gartenet al. (2010) dan Masataka (2008)untuk menyimpulkan hubungan obat-gen dan DDiS. Hasil kami menunjukkanbahwa pendekatan kami dapat mengidentifikasi DDIS menjanjikan dandapat diperlakukan sebagai pelengkap database yang ada sepertiDrugBank tetapi dengan penambahan bukti ilmiah untuk mendukunginteraksi kita disimpulkan. Kebenaran DDiS diekstraksi menunjukkan bahwa pendekatan kami adalahsiap untuk diterapkan dalam skenario dunia nyata....Pada artikel ini, kami fokus pada DDiS berbasis enzim. Kami akanmemperluas pendekatan kami untuk menyertakan DDiS berbasistransporter. Faktor biologis lainnya dapat mempengaruhi kemungkinanDDiS. Ini termasuk tingkat enzim metabolisme pada obat-obatan, sepertiapakah suatu obat kuat atau lemah dimetabolisme oleh enzim. Selainitu, informasi genetik juga harus dipertimbangkan dalammengidentifikasi DDIS.Meningkatkan ekstraksi kami untuk berbagai interaksi sepertimemperluas pilihan kata kunci, kemungkinan dapat meningkatkanpersentase tumpang tindih dengan interaksi dijelaskan di DrugBank