10
1.1 Mô hình Ontology SPN-KOS Mô hình SPN-KOS (Software-Programming-Network Keyphrase Ontology System) gồm các thành phần sau ( E , C , R ) E tập hợp các yếu tố (phần tử) mà nó chính là keyphrase. C tập hợp các lớp về lĩnh vực tin học. R tập hợp các mối quan hệ trên các phần tử. Keyphrase và lý do dùng Keyphrase cho mô hình SPN- KOS: Một keyphrase là một từ hoặc nhiều từ (ví dụ: computer science) trong đó keyword là một từ (ví dụ: computer) trong luận văn đều xem là Keyphrase Ví dụ : “Trí tuệ nhân tạo”, ”ngôn ngữ lập trình”, ”trình biên dịch”, ”quản trị mạng”. Cho khả năng mô tả mức cao về nội dung tài liệu để dễ dàng cho người đọc biết tài liệu có liên quan với nội dung họ cần tìm hiểu hay không ? Cho một tóm tắt cô đọng về tài liệu. 1

Mô Hình Ontology SPN

Embed Size (px)

DESCRIPTION

mo hinh

Citation preview

M hnh Ontology SPN-KOS

1.1 M hnh Ontology SPN-KOS

M hnh SPN-KOS (Software-Programming-Network Keyphrase Ontology System) gm cc thnh phn sau (E, C, R)

E tp hp cc yu t (phn t) m n chnh l keyphrase.

C tp hp cc lp v lnh vc tin hc.

R tp hp cc mi quan h trn cc phn t.

Keyphrase v l do dng Keyphrase cho m hnh SPN-KOS:

Mt keyphrase l mt t hoc nhiu t (v d: computer science) trong keyword l mt t (v d: computer) trong lun vn u xem l Keyphrase

V d :

Tr tu nhn to, ngn ng lp trnh, trnh bin dch, qun tr mng.

Cho kh nng m t mc cao v ni dung ti liu d dng cho ngi c bit ti liu c lin quan vi ni dung h cn tm hiu hay khng ?

Cho mt tm tt c ng v ti liu.

M hnh SPN-KOS dng m hnh ha lnh vc PHN MM, LP TRNH, MNG MY TNH trong C l mt tp hp cc lp hoc gi l b su tp cc khi nim dng m hnh ha lnh vc PHN MM, LP TRNH, MNG MY TNH v theo thng k th cng t d liu trong cc sch cng ngh thng tin Ting Vit, ti trang web www.dmoz.org, dir.yahoo.com, webopedia (hin ti trang web c 16 lp cha, chng ti ch quan tm n 3 lp l: PHN MM, MNG MY TNH, LP TRNH) ta c cc ngnh MNG MY TNH, LP TRNH, PHN MM l

PHN MM

LP TRNH

MNG MY TNH

ng thi trong mi 3 lp ny cng c bn trong n l danh sch cc lp khc l v tt c cc lp hin ti ch xt mi quan h is-a.

Trong SPN-KOS cn c mt tp E gm cc yu t hoc phn t (mi phn t l mt keyphrase) cng vi cc mi quan h ng ngha gia cc Keyphrase, mi quan h ng ngha gia cc Keyphrase th cn phi da vo nh ngha bng ngn ng t nhin cung cp ti [48] [50] v ta phi to mt cch th cng cc mi quan h ng ngha ny, hin ti trong SPN-KOS cp n cc mi quan h ng ngha l cng lp, ng ngha (synonym), gn ngha (near-synonym), vit tt (acronym), broader, narrower, extension, related. Gia E v C cng c mi lin h vi nhau chnh l mi tp con trong E c th cha trong tp con ca C cho tp con m hnh ha v phm vi con trong C.

V d: mt danh sch cc keyphrase thuc tp con LP TRNH ni ln rng tp con ny v phm vi lp trnh v LP TRNH thuc phm vi ln hn l tin hc.

Ghi ch: vic phn lp da theo tng phn loi ca [48], cn [50] dng cho vic tra cu cc nh ngha v cc keyphrase.

1.2 Gii thch v din gii v Ontology SPN-KOSGi E l tp hp cha ton b cc keyphrase m t v phm vi PHN MM, LP TRNH, MNG MY TNH, cc keyphrase ny c rt trch th cng trong cc ti liu v CNTT Ting Vit, da theo trang web www.dmoz.org, dir.yahoo.com, theo t in my tnh ti www.webopedia.com . Ta phn tch E thnh cc phn nh sau:

Cc lp, trong mi mt lp l tp con ca E v tp cc lp cha trong P (E) Mi lp cha mt tp hp cc keyphrase.

Trong E tn ti mi quan h gia cc keyphrase.

2 Din gii cho s phn lp

Lp l nhng nhm, b hoc tp hp cc i tng. Mt lp c th gp nhiu lp hoc c gp vo lp khc. Mt lp gp vo lp khc c gi l lp con ca lp gp. iu quan trng ca quan h xp gp l tnh k tha.Theo nh ti trang web m hnh ha cho lnh vc tin hc ta chia ra nhiu lp (tp hp) trong cc lp (tp hp) chnh nh sau.

P (E) c cc tp con l : C1 = PHN MM, C2 = LP TRNH, C3 = MNG MY TNH. Ta xy dng cy phn cp cho SPN-KOS

Hnh 3.1: Tng quan v SPN-KOS v cc lp ca n

Nh vy c bn s c 3 lp (tp hp) cha trong P (E). K hiu ton hc nh sau:

(i=1, 2, 3 : Ci ( E, v P (E) ( {C1, C2, C3}

Trong qu trnh xy dng cc lp c th xy dng thm cc lp khc da vo d liu c th t trang web WEBOPEDIA, cho nn tng s cc lp dng m hnh ha cho 3 ngnh trn l 66 lp v c 76 mi quan h gia cc lp vi nhau, mi lp trong 66 lp to nn ngha trong phm vi c th v lnh vc phn mm, lp trnh, mng my tnh,. Da vo d liu cho ta c th m hnh ha thnh s vi cc lp c mi quan h is-a vi nhau. Da theo 3 lp c bn ban u ta xy dng c tip 44 lp nh vo d liu phn loi cha con. Trang web ny phn ra thnh cc PARENT CATEGORIES v SUB CATEGORIES. ng thi ti mi phn loi ca trang web c cha thm mc TERMS cho bit cc term cho lp , v ta quy nh PARENT CATEGORIES tng ng lp cha, cn SUB CATEGORIES tng ng lp con, v mi TERMS l mt Keyphrase

Hnh trn l cch thc phn loi ca trang web, trong loi Applications c cho bit loi cha (PARENT CATEGORIES) l Software, cho bit loi con (SUBCATEGORIES) l Application Failures v Documentation, v trang web cng cho bit cc TERMS lin quan n Applications.

Ghi ch: Hnh bn ch lit k mt s term m thi, tt c cc term c th c th xem chi tit ti trang web

Sau ta li tip tc xy dng c 19 lp mi v n l subcategories ca 44 lp va xy dng.

Quy c v k hiu: ta gi A l lp con ca B th khi k hiu l A B, ngc li A l lp cha ca B th khi k hiu l A B.

V d v cch xy dng lp LP TRNH v cc lp lin quan nh sau

Lp ny c 20 lp con : (LP TRNH GAME, LP TRNH HNG I TNG, BIN DCH-NG GI V LIN KT, ELECTRONIC TECHNOLOGY, BIU THC, CC NGN NG LP TRNH, CC TON T V CC PHP TON, CU TRC D LIU, NH A CH, GIAO DIN LP TRNH NG DNG, NGH NGHIP, PHT TRIN WEB, PHNG PHP LP TRNH HNG KHA CNH, TH TC-HM-ON CHNG TRNH, CC NGN NG LP TRNH OSRC, HTML, XML, TRNH DUYT, CC LP C S) => nh vy s c 20 lp con s c to, nu lp no trng vi lp c th khng to. Cho nn ta xt tip cc lp con ca lp LP TRNH nh sau: trong 20 lp con ca LP TRNH, th c mt s lp ng thi va l lp con ca LP TRNH v cng l lp con ca lp khc.XML LP TRNH, PHT TRIN WEB => XML va l con ca LP TRNH v l con ca PHT TRIN WEBTRNH DUYT HTML , PHN MM=> TRNH DUYT va l con ca HTML v PHN MM.

=> Nh th trong qu trnh xt duyt 3 lp c bn ta to c thm 20 lp Tip tc xt cc lp con ca 44 lp v to tip 19 lp cng theo tng tng t nh sauCHUN MNG ETHERNET => lp CHUN MNG c lp con l ETHERNET nhng lp con ny c to trong s 19 lp nn khng to na.

C S D LIU (C S D LIU OSRC, CC CU TRUY VN ) => lp C S D LIU c lp con l OSRC C S D LIU OSRC, CC CU TRUY VN trong lp OSRC DATABASES c to nn khng to, cn lp CC CU TRUY VN cha c mt trong s 41 lp cho nn to lp ny.

HAPTICS GIAO DIN NGI DNG => lp HAPTICS c lp con l GIAO DIN NGI DNG v lp ny khng c trong 169 nn to thm lp ny.

GIAO THC INTERNET GIAO THC MNG => lp GIAO THC MNG c lp con l GIAO THC INTERNET v lp ny cha c to trong s 19 lp cho nn ta cn to thm.

Ghi ch: mi lp c hnh thnh c cha tp cc keyphrase m hnh cho mt phm vi c th. So vi tp cha ca n.

Nh th ta c

Tp s gm 66 lp l tng s lp theo thng k trn, mi lp s cha mt s keyphrase trong E, k hiu Ci = { i1, i2, in } , v theo thng k ta c c 76 mi quan h is-a gia 66 lp.V ta c vi n = 66 lp, v theo thng k chn lc ti trang www.webopedia.com

Sau cng chng ti xy dng c cy phn cp sau:

Hnh 3.2: Phn cp cc lp con ca SPN-SKOS

MNG MY TNH

LP TRNH

PHN MM

SPN-KOS

PAGE 8

_1366132737.unknown

_1307097220.unknown