19
Multimedijalne baze podataka Slađana Kičema,45/2000 3 1. UVOD Da bi se mogle iskoristiti pogodnosti računara za čuvanje podataka, neophodno je obezbediti programske alate za prenos podataka, upravljanja podacima i komunikacije sa korisnikom. U tu svrhu nastala je organizacija podataka, nazvana baza podataka, koja, zajedno sa programskim alatima koji je podržavaju, treba da obezbedi: nezavisnost struktura podataka od programa koji ih obrađuju, i programa od struktura podataka (izmena podataka ne utiče na programe); optimalnost ponavljanja podataka; da obrada podataka nije vezana za programski jezik opšte namene, već za viši “upitni” jezik; korišćenje baze podataka od strane većeg broja korisnika. Pojam baza podataka pojavio se krajem šezdesetih godina i označavao je skup međusobno povezanih podataka koji se čuvaju zajedno, i među kojima ima samo onoliko ponavljanja koliko je neophodno za njihovo optimalno korišćenje pri višekorisničkom radu. Podaci se pamte tako da budu nezavisni od programa koji ih koriste, i strukturiraju se tako da je omogućen dalji rast baze. Posle svake aktivnosti, koja predstavlja logičku cjelinu poslova, stanje baze mora biti konzistentno (valjano),a to znači da podaci u bazi i odnosi među njima moraju zadovoljavati unaprijed zadate uslove koji odslikavaju dio realnosti modelirane podacima u bazi. Za efikasan rad sa podacima i održavanje konzistentnog stanja baze koristi se specifični programski proizvod – sistem za upravljanje bazama podataka (DBMS, Data Base Management System). Baze podataka zajedno sa DBMS čine sistem baza podataka. U širem smislu, u sistem baza podataka spada i odgovarajući hardver, svi programski alati koji se nadgrađuju na DBMS i olakšavaju rad sa bazama, kao i raznorodni korisnici baza podataka (od krajnjih korisnika, preko aplikativnih programera do administratora baza podataka). Osnovna komponenta sistema za upravljanje relacionim bazama podataka koju korisnik vidi jeste relacioni upitni jezik (neki od oblik SQL jezika). “Prave” multimedijalne baze podataka su bitno drugačije od standardnih baza podataka sa multimedijalnim mogućnostima jer ispunjavaju jedinstvene zahtjeve. Ovi zahtjevi su tipični za interaktivne multimedije koji, nažalost, s obzirom na njihovu važnost nisu dovoljno predstavljeni. Iako termin “multimedija” privlači mnogo pažne, to je ustvari samo podklasa velike kategorije neuređenih (unstructured) podataka koji se nazivaju apstraktni podaci (abstract data type), kao npr. otisci prstiju, X-zrake, elektrokardiogrami, slike magnetne rezonance (magnetic resonance imaging - MRI) itd.. Aplikacije koje rade sa ovim podacima zahtjevaju velika skladišta podataka isto kao i ona za multimedije. Zbog toga, multimedijalne baze podataka obično mogu da podrže većinu apstraktnih podataka, tako da se termini multimedija i apstraktni podaci često međusobno podudaraju. Problem memorisanja ovakvih brojnih sadržaja riješen je razvojem “moćnih” memorijskih modula.

Multimedijalne baze podataka - ETFBLBaze podataka zajedno sa DBMS čine sistem baza podataka. U širem smislu, u sistem baza podataka spada i odgovarajući hardver, svi programski

  • Upload
    others

  • View
    9

  • Download
    0

Embed Size (px)

Citation preview

  • Multimedijalne baze podataka

    Slađana Kičema,45/2000

    3

    1. UVOD Da bi se mogle iskoristiti pogodnosti računara za čuvanje podataka, neophodno je

    obezbediti programske alate za prenos podataka, upravljanja podacima i komunikacije sa korisnikom. U tu svrhu nastala je organizacija podataka, nazvana baza podataka, koja, zajedno sa programskim alatima koji je podržavaju, treba da obezbedi:

    nezavisnost struktura podataka od programa koji ih obrađuju, i programa od struktura podataka (izmena podataka ne utiče na programe);

    optimalnost ponavljanja podataka; da obrada podataka nije vezana za programski jezik opšte namene, već za viši

    “upitni” jezik; korišćenje baze podataka od strane većeg broja korisnika.

    Pojam baza podataka pojavio se krajem šezdesetih godina i označavao je skup međusobno povezanih podataka koji se čuvaju zajedno, i među kojima ima samo onoliko ponavljanja koliko je neophodno za njihovo optimalno korišćenje pri višekorisničkom radu. Podaci se pamte tako da budu nezavisni od programa koji ih koriste, i strukturiraju se tako da je omogućen dalji rast baze. Posle svake aktivnosti, koja predstavlja logičku cjelinu poslova, stanje baze mora biti konzistentno (valjano),a to znači da podaci u bazi i odnosi među njima moraju zadovoljavati unaprijed zadate uslove koji odslikavaju dio realnosti modelirane podacima u bazi. Za efikasan rad sa podacima i održavanje konzistentnog stanja baze koristi se specifični programski proizvod – sistem za upravljanje bazama podataka (DBMS, Data Base Management System). Baze podataka zajedno sa DBMS čine sistem baza podataka. U širem smislu, u sistem baza podataka spada i odgovarajući hardver, svi programski alati koji se nadgrađuju na DBMS i olakšavaju rad sa bazama, kao i raznorodni korisnici baza podataka (od krajnjih korisnika, preko aplikativnih programera do administratora baza podataka). Osnovna komponenta sistema za upravljanje relacionim bazama podataka koju korisnik vidi jeste relacioni upitni jezik (neki od oblik SQL jezika). “Prave” multimedijalne baze podataka su bitno drugačije od standardnih baza podataka sa multimedijalnim mogućnostima jer ispunjavaju jedinstvene zahtjeve. Ovi zahtjevi su tipični za interaktivne multimedije koji, nažalost, s obzirom na njihovu važnost nisu dovoljno predstavljeni. Iako termin “multimedija” privlači mnogo pažne, to je ustvari samo podklasa velike kategorije neuređenih (unstructured) podataka koji se nazivaju apstraktni podaci (abstract data type), kao npr. otisci prstiju, X-zrake, elektrokardiogrami, slike magnetne rezonance (magnetic resonance imaging - MRI) itd.. Aplikacije koje rade sa ovim podacima zahtjevaju velika skladišta podataka isto kao i ona za multimedije. Zbog toga, multimedijalne baze podataka obično mogu da podrže većinu apstraktnih podataka, tako da se termini multimedija i apstraktni podaci često međusobno podudaraju. Problem memorisanja ovakvih brojnih sadržaja riješen je razvojem “moćnih” memorijskih modula.

  • Multimedijalne baze podataka

    Slađana Kičema,45/2000

    4

    2. Razvoj sistema za upravljanje multimedijalnim bazama podataka – MMDBMS (Multimedia Database Management System)

    Multimedijalne tehnologije su sve privlačnije i sve zanimljivije svakoga dana. Video-on-demand je trenutno veoma aktuelan i dostupan javnosti. Kreatori ovih sadržaja kao što su izdavači, broadcasting kompanije i audio/video produkcijske kuće moraju biti u mogućnosti da arhiviraju i označe svoje proizvode za lakšu kasniju upotrebu. Ovo je težak zadatak, koji postaje još složeniji ukoliko materijal uključuje više različitih tipova medija i obuhvata duži vremenski period. Za šta god da se razvija neka multimedijalna baza podataka, mogućnost da se manipuliše multimedijalnim podacima mora biti ugrađena, a ne tretirana kao neki dodatak. Upiti traže da podaci budu označeni, što znači da podaci moraju biti strukturisani (uređeni) na neki način. Najveći problem je taj da se slike, video, grafika itd., bitno razlikuju od teksta i numeričkih podataka, pa zato i zahtjevaju nove tehnike organizacije, označavanja i procesa pretraživanja. Video, grafički i audio podaci ne mogu da budu efikasno upravljani koristeći stare tehnike pretraživanja koje se baziraju na ključnim riječima. Razvoj MMDBS možemo pratiti u tri talasa.

    2.1. Prvi talas Prvi MMDBMS su se pretežno oslanjali na operativni sistem prilikom čuvanja

    i pretraživanja podataka. Koristili su se prvenstveno kao skladišta podataka. Početkom 90-ih krenula je izrada prvih komercijalnih MMDBMS-a (MediaDB, MediaWay, JASMINE, ITASCA i dr.). Bili su u mogućnosti da rade sa različitim tipovima podataka i pružali su mehanizme za upite, pronalaženja, unošenje, i dodavanje podataka. Većina ovih proizvoda je nestalo sa tržišta, a samo mali broj njih je uspijelo da se prilagodi hardverskom i softverskom razvoju (npr. MediaWay).

    2.2. Drugi talas

    U ovoj fazi komercijalni sistemi su trebali da omoguće čuvanje kompleksnih

    tipova objekata za različite vrste medija. Objektno-orijentisan stil je omogućio sredstva za definisanje novih tipova podataka i operatora za nove vrste medija, kao što su video, image i audio. MMDBMS su sada postale proširljive, Object-Relational DBMS (ORDBMS). Krenule su sa upotrebom 1996-1998 godine sa pojavom Informix-a. Sadašnje verzije su poboljšane u odnosu na početke prvenstveno u performansama i integraciji u glavni sistem. Dalja poboljšanja su se ogledala u poboljšanju mehanizama za pretraživnje video i audio podataka, kao i u naprednim prezentacijama i sredstvima za pretraživanje. U ovoj fazi najnaprednija rješenja na tržištu su Oracle 10g, IBM DB2, i IBM Informix. Oni su predložili sličan pristup u nadogradnji baznih sistema. Npr. IBM DB2 Universal Databases Extenders proširuju ORDBMS na upravljanje grafičkim, video, audio i prostornim objektima. Svim ovi tipovi podataka se mogu modelovati, može im se pristupiti i promjeniti ih u standardnom radnom prostoru (framework). Omogućen

  • Multimedijalne baze podataka

    Slađana Kičema,45/2000

    5

    je i unos i iznos multimedijalnih objekata i njihovih atributa u i iz baze podataka, pristup i kontrola netradicionalnih podataka sa istim nivoem zaštite kao i kod tradicionalnih. DB2 Image Extender definiše poseban tip podataka DB2IMAGE sa pridruženim funkcijama za čuvanje i manipulaciju image fajlovima. Stvarni sadržaj image fajla koji DB2IMAGE opisuje može biti sačuvan kao veliki binarni objekat –BLOB (Binary Large Object) ili izvan baze podataka u fajl sisitemu. Npr. sledeći SQL izraz pokazuje kako je slika pohranjena u kolonu pod nazivom image u tabeli example :

    INSERT INTO example (image) VALUES( DB2IMAGE ( CURRENT SERVER, ‘pisa.jpg’, /* source_file */ ‘JPG’, /* source_format */ 1, /* 1=BLOB, 2=file pointer */ ‘my Image File’ /* comment */ ) )

    DB2 Image Extender pruža mogućnosti pretraživanja na bazi sličnosti (similarity search) na bazi QBIC (Query Based on Image Content) tehnologije, za slike sačuvane u DB2IMAGE tipu. QBIC tehnologija omogućava pretraživanje slika na bazi njihovog sadržaja (najčešća boja, raspodjela boja, tekstura). Npr. sljedeći SQL izraz pokazuje QBIC upit koji poredi svaku sliku sa slikama u koloni na osnovu toga koliko je najčešća boja bliska crvenoj. SELECT CONTENTS(image) QBScoreFROMStr(‘averageColor=’,image)AS SCORE

    FROM signs ORDER BY SCORE

    Oracle Intermedia baza podataka pruža mogućnost pohranjivanja slika i pretraživanje na bazi sadržaja (content based retrieval - CBR) kroz ORDImage tip podataka. CBR funkcionalnosti su koncentrisane na karakterisitke niskog nivoa, bez mogućnosti semantičkog pretraživanja. Osim komercijalnih, kao posljedica raznih projekata nastale su eksperimentalne multimedijalne baze podataka:

    MIRROR (Multimedia Information Retrieval Reducing information OveRload)

    Sl.2.1. ACOI/MIRROR sistem

  • Multimedijalne baze podataka

    Slađana Kičema,45/2000

    6

    DISMA (Distributed Multimedia DBMS)

    Sl.2.2. DISMA sistem

    2.3. Treći talas Treći talas uključuje trenutno aktuelne projekte. Oni se prvenstveno bave potrebama aplikacija za većim semantičkim sadržajem. Većina njih se oslanja na MPEG-7 i MPEG-21 standarde. Nešto više o MPEG-7 i MPEG-21 standardu će biti rečeno kasnije, uz napomenu da se MPEG-7 odnosi na opis multimedijalnog sadržaja, a MPEG-21 na standardizaciju multimedijalnog radnog prostora. Sistemi za pretragu multimedijalnih baza zasnovani na semantici predstavljaju tekstualno orijentisane, te vrlo efikasan automatizovan način pretrage. Velika primjena ovakvih sistema je u filmskoj industriji i industriji zabave. Ključni frejmovi se manuelno označavaju skupom ključnih riječi. Upit je tekstualan i u pretrazi se traže frejmovi čije ključne riječi najbolje odgovaraju upitnom skupu riječi. Sličan princip pretrage ugrađen je i u MPEG-7 video standard. Nedostaci ovakvih sistema su dugotrajno manuelno označavanje ključnih frejmova, neophodnost egzaktnog poklapanja upitnog skupa riiječi i skupa ključnih riječi zahtjevanog frejma te jezičke barijere. Reprezentativan projekat iz ove grupe je MARS (Multimedia Analysis and Retrieval System) i njihov MPEG-7 MultimediaData Cartrige. Obuhvaća integrisane načine za prikupljanje multimedijalnih informacija i sistem za upravljanje bazom podataka koji podržava multimedijalne informacije kao objekte prve klase pogodne za čuvanje i pronalazak na bazi njihovog semantičkog sadržaja. Predlaže set alata za MMDBMS Back-End. Uključuje koncepcije za modelovanje multimedijalnih podataka, označavanje sadržaja i upravljanje bazom podataka.

    Sl.2.3. MARS projekt

  • Multimedijalne baze podataka

    Slađana Kičema,45/2000

    7

    MPEG-7 MDC (Multimedia Data Cartridge) je sistemska ekstenzija Oracle 9i DBMS koja omogućava multimedijalni upitni jezik, pristup medijima, izvršavanje i optimizaciju upita i označavanje resursa oslanjajući se na šeme nastale iz MPEG-7 standarda. MDC se zasniva na tri koncepta:

    model multimedijalnih podataka, framework za označavanje multimedijalnog sadržaja, unutrašnje i spoljašnje biblioteke.

    MDC se oslanja na strukturalne i semantičke dijelove MPEG-7 standarda (opisi visokog nivoa – high-level descriptions). S druge strane objektni tipovi podataka za MPEG-7 deskriptore niskog nivoa (low-level descriptors), kao što su boja, oblik, tekstura su omogućeni i povezani sa opisima visokog nivoa. Ovaj način omogućava pronalazak multimedijalnog sadržaja ne samo po karakteristikama niskog nivoa, već i po semantici u kombinaciji sa karakterisitkama niskog nivoa. Radni prostor za označavanje multimedijalnog sadržaja (Multimedia Indexing Framework - MIF) omogućava dodavanje novih tipova indeksa bez mjenjanja definicije interfejsa. MIF je podjeljen u tri modula.

    Sl.2.4. MDC Integracija MIF-a u MDC se ostvaruje preko mehanizma dodavanja indeksa, prisutnog kod Oracle 9i. Za svaki novi indeks, novi Oracle indextype se definiše, ali se interfejs sa MIF-om ne mjenja.

    Sl.2.7. Protok komponenti i informacija kod tipičnih multimedijalnih sistema i baza

    podataka

  • Multimedijalne baze podataka

    Slađana Kičema,45/2000

    8

    3. Integracija MPEG-7 standarda u MMDBMS MPEG (Moving Pictures Experts Group) je 2002. godine uvela novi standard

    za korištenje metapodataka (metadatas). Metapodaci su deskriptivni podaci o multimedijalnom sadržaju. MPEG-7 je standard za opis (description) karakteristika visokog i niskog nivoa multimedijalnog sadržaja. Primjer: Korištenjem mobilnog telefona može se snimiti 10 sekundi pjesme o kojoj

    želimo više informacija. Koristeći sistem na bazi audio prepoznavanja definisan MPEG-7audio deskriptorima, mehanizme za pretraživanje i multimedijalne baze podataka može se putem SMSa dobiti željeni odgovor.

    Sl.3.1. Pretraživanje pjesme na osnovu dijela audio zapisa

    Ovakav opis se pridružuje samom sadržaju multimedijalne baze, da bi se lakše i brže pronašao onaj sadržaj koji je od interesa korisniku. MPEG-7 je formalno nazvan Multimedia Content Description Interface, što znači da to nije standard koji se direktno bavi kodovanjem video ili audio podataka, kao MPEG-1, MPEG-2, MPEG-4. On koristi XML da pohrani metapodatke (metadata), i može biti povezan sa vremenskim kodom (timecode), da označi određeni događaj, ili na primjer da sinhroniše liriku sa pjesmom. Namjena mu je da standardizuju:

    set deskripcionih šema i deskriptora, Descriptors, jezik za specifikacije ovih šema, Description Definition Language (DDL), šeme za kodovanje opisa.

    Kombinacija MPEG-4 i MPEG-7 standarda čine MPEG-47. MPEG-7 ciljevi su:

    Omogućavanje brzih i efikasnih metoda za pretraživanje, filtriranje i identifikaciju sadržaja,

    Definisanje glavnih podataka o sadržaju (karakteristike niskog nivoa, struktura, model,...),

    Indeksiranje širokog opsega aplikacija, Mogućnost rada sa audiovizuelnim informacijama kao što su: audio, glas,

    video, slike, grafici, 3D modeli,... Informacije o tome kako su objekti kombinovani na sceni, Nezavisnost između opisa i same informacije.

  • Multimedijalne baze podataka

    Slađana Kičema,45/2000

    9

    U MPEG-7 arhitekturi opis podataka mora biti odvojen od samih podataka, ali mora postojati veza između njih. MPEG-7 koristi sledeće alate:

    Deskriptor (Descriptor) – Predstavlja karakteristike sintaksno i semantički. Jedan podatak može imati više deskriptora.

    Multimedijalne deskripcione šeme (Multimedia Description Schemes) – Određuju strukturu i semantiku veza između svojih komponenti. Ove komponente mogu biti deskriptori (D) ili deskripcione šeme (DS).

    Opisni jezik (Description Definition Language-DDL) – Bazira se XML jeziku da bi definisao veze između deskriptora. Omogućava kreaciju i modifikaciju eskripcionih šema, kao i kreaciju novih deskriptora.

    Sistemske alate (System Tools) – Vrše binarizaciju, sinhronizaciju, transport i pohranjivanje deskriptora.

    MPEG-7 aplikacije:

    digitalna biblioteka: image/video katalozi,.. multimedijalni informatori, npr. yellow pages, emitujući mediji, multimediji za editovanje, sigurnosne službe, e-business, obrazovne aplikacije, biomedicinske aplikacije,...

    MPEG-7 informacije o sadržaju mogu da sadrže:

    Informacije koje opisuju proces kreacije sadržaja (režiser, naziv filma, kratak sadržaj).

    Informacije o upotrebi sadržaja (zaštitni markeri, istorija upotrebe, vrijeme emitovanja).

    Informacije o skladištenju (format, način kodovanja). Strukturalne informacije o vremenskim, prostornim i vremensko-

    prostornim komponentama sadržaja (presjek između scena). Infomracije o karakteristikama niskog nivoa (boje, tekstura, opis melodije). Konceptulane informacije o stvarima koje su zabilježene u sadržaju (objekti

    i događaji, interkcija između objekata). Informacije o najefikasnijem pronalasku sadržaja (kratki sadržaji,

    varijacije, prostorna i frekvencijska ograničenja). Informacije o grupama objekata. Informacije o interakciji korisnika sa sadržajem (zabilješke korisnika,

    istorija pretraživanja).

  • Multimedijalne baze podataka

    Slađana Kičema,45/2000

    10

    Sl.3.2. Primjer moguće aplikacije uz korištenje MPEG-7

    MPEG-7 ima namjenu da pruži komplementarne funkcionalnosti u odnosu na prethodne MPEG standardne, odnosno da pruži informacije o sadržaju a ne sam sadržaj («the bits about the bits»). Nudi širok spektar audovizuelnih alata za opisivanje-DL (Deskriptor Tools) za kreiranje opisa kojima se formiraju osnove za brz i efikasan pristup multimedijalnom sadržaju od strane raznih aplikacija. Audovizuelni sadržaji sa kojima MPEG-7 deskripcije mogu biti povezane su nepokretne slike, grafika, 3D modeli, audio, govor, video, i multimedijale prezentacije sastavljene od svih ovih elemenata. Specijalan slučaj čine karakteristike lica (facial characteristics). MPEG-7 opisi ne zavise od toga kako su informacije kodovane i sačuvane. Moguće je napraviti MPEG-7 opis analognog filma ili slike odštampane na papiru, na isti način kao i digitalnog sadržaja.

    Sl.3.3. Nezavisnost između opisa i sadržaja Sl.3.4.Relacije između različitih alata i

    procesa MPEG-7 dokumenata

    Sistemi za pretraživanje i odgovarajući upitni jezik moraju da uzmu u obzir sve moguće varijacije informacija s ciljem da se optimizuje brzina i tačnost pretraživanja. Razlikuju se dva načina pretraživanja:

    na bazi sadržaja (content aware), na bazi opisa (content unaware).

    Konvencionalni mehanizmi za pretraživanje podataka ne omogućuju uključenje u specijalizovane arhitekture u kojima se vrši integracija velikog broja heterogenih

  • Multimedijalne baze podataka

    Slađana Kičema,45/2000

    11

    izvora informacija u jedan sistem. U tu svrhu razvijeni su mnogi sistemi za pronalazak multimedijalnih podataka, koji se fokusiraju na multimedijalne baze podataka, komentarisanje metapodataka, specijalne metode za analizu multimedija i WEB bazirane pretraživače.

    Neki od sistema koji koriste MPEG-7 standard:

    MPEG-7 alat za označavanje- VideoAnnEx (IBM 2002)

    Automatski prepoznaje, razdvaja i briše rezove između scena. Nekoliko ključnih okvira iz svakog snimka se uzima za predstavljanje sadržaja cijelog snimka. Svaki snimak se može opisati dodatno korištenjem metapodataka prema MPEG-7 standardu. Označeni video opis se čuva u vidu MPEG-7 XML fajla.

    Richon Movie Tool

    Koristi se za opis video sadržaja. Već tokom unosa podataka (videa) generišu se MPEG-7 opisi, koji se naknadno mogu editovati. Veze između video strukture i MPEG-7 opisa su vizualne.

    Informedia digital video library project

    Cilj Informedia projekta (Carnegie Mellon University School of Computer Science,2002) je da se dobije mašina koja razumije video i filmske medije uključujući sve aspekte pretraživanja, izvlačenja, rezimiranja i vizualizacije. Informedia koristi mehanizme za prepoznavanje glasa, pretraživanje na bazi sadržaja slike, prirodno razumjevanje jezika da prepiše i segmentira video podatke. Rezimiranje i vizualizacija se odvija kroz web bazirani interfejs.

    3.1. Semantički bazirano pretraživanje korištenjem metapodataka

    Cijeli sistem za pretraživanje zahtjeva prethodnu obradu podataka sa izvlačenjem metapodataka i komponenti za pohranjivanje, a koji čine implicite informacije eksplicitno pohranjene u prostoru za informacije. Pohranjeni podaci će biti ponovo upotrebljeni sa posebnom pažnjom na sposobnosti njihovog pretraživanja i brzog pronalaska. Potreban je i odgovarajući radni prostor koji će korisniku omogućiti da unese upit, poredi upit sa sadržajem baze podataka i prezentuje rezultat korisniku.

    Prije nego što je korisnik u mogućnosti da koristi radni okvir za pretraživanje neophodno je bazu podataka «napuniti» odgovarajućim MPEG-7 metapodacima. Da bi se omogućilo pretraživanje na bazi semantike semantički nivo metapodataka mora biti povećan. Sve ovo ima za cilj poboljšanje kvaliteta pretraživanja.

    Podaci iz sadržaja mogu biti izvučeni automatski ili ručno. Algoritmi za automatsko izvlačenje podataka rade dobro kod karakteristika niskog nivoa kao što su boja ili veličina fajla. Za više semantičke karakteristike algoritmi za prepoznavanje oblika ili objekata imaju veliku stopu grešaka da bi rezultati bili korisni. Zbog toga je potrebna ručna korekcija ili izvlačenje.

  • Multimedijalne baze podataka

    Slađana Kičema,45/2000

    12

    Rezultujući metapodaci sadrže različite nivoe apstrahovanih metapodataka (boje, lica, imena objekata), informacije o porijeklu medija (veličina, dužina), logičku strukturu objekata u njihove veze, pravila i znanje kako interpretirati metapodatke, integraciju ljudskog znanja. Da bi se omogućila komunikacija između komentara i radnog prostora za pretraživanje sve vrste metapodataka su smještene u MPEG-7 opise.

    Modularni pristup i korištenje MPEG-7 dozvoljava razdvajanje sistemskih komponenti i razmjenu informacija sa drugim sistemima. Da bi se omogućio dobar metod za pretraživanje neophodan je kvalitetan opis multimedjialnog sadržaja. Već postojeći metapodaci se ugrađuju u MPEG-7 dokumente bez ljudske interakcije.

    Tri vrste meta podataka su sadržane u MPEG-7 dokumentu:

    opšti metapodaci (npr. komentari teksta, trajanje snimka,...) – mogu biti traženi preko konvencionalnih upita.

    metapodaci niskog nivoa (npr. histogram,...) – potrebni su za specifična poređenja i algoritme za pretraživanja.

    semantički opisi (npr. agenti, događaji veze,...) – pohranjeni su u kataloge semantičkih metaobjekata.

    Odavde slijedi da multimedijalna baza podataka mora da radi sa pravim multimedijalnim podacima, MPEG-7 dokumentima i nekim specifičnim podacima niskog nivoa koji se dobijaju iz MPEG-7 dokumenata. Pretraživanje i pronalazak multimedijalnih podataka je u potpunosti odvojen od samih multimedijalnih baza podataka, u skladu sa principima modularnosti.

    Opisivanje multimedijalnog sadržaja je dugotrajan proces, pa je automatsko izvlačenje informacija o sadržaju veoma poželjno. Moduli za analizu sadržaja mogu biti integrisani kao plug-in-ovi, ili se može vršiti ručno komentarisanje sadržaja.

    3.2. ZAKLJUČAK (MPEG-7)

    Integracija MPEG-7 standarda u MMDBMS zavisi od odgovarajućeg modela podataka za pohranjivanje multimedjalnih metapodataka i njihovog uticaja na metode pristupa (access methods), upitni jezik (query language) i optimizacije upita (query optimization). Ukoliko je model podataka isuviše grub, skladištenje i pretraživanje podataka je ograničeno. Ako je model detaljan pružiće se mogućnost za korišćenje semantičko bogatih upita. Model podataka je samo prvi korak ka multimedijalnoj bazi podataka koja se bazira na MPEG-7 standardu. Moraju se uzeti u obzir i mogućnosti

    NIVO 1

    NIVO 2

    NIVO 3

    Primitivne karakteristike

    Derivirane karakteristike

    Apstrahovani atributi

  • Multimedijalne baze podataka

    Slađana Kičema,45/2000

    13

    dodavanja, brisanja i dopunjavanja MPEG-7 dokumenata. Ove funkcionalnost mogu biti integrisane u sistem baze podataka ili ponuđene u vidu eksternih alata.

    MPEG-7 multimedijalna baza podataka mora da vodi računa o radu sa multimedijalnim upitnim jezicima, da podržava metode pristupa i načine za optimizaciju upita za multimedijalne upite. Tradicionalne baze podataka su efikasne u pohranjivanju i operisanju sa alfanumeričkim podacima. U multimedijlanim bazama podataka govorimo o «sličnim» podacima.

    MPEG-7 standardi omogućuju ekstenzivan set atributa za opisivanje multimedijalnog sadržaja. Igra važnu ulogu u standardizaciji obogaćivanja multimedija semantičkim i apstrakcijama višeg nivoa, s ciljem da se poboljšaju rezultati pretraživanja. Pa ipak, kompleksnost opisnih šema često čini da je teško odlučiti koje semantičke opise koristiti ili dodati. Ovo dovodi do problema kod razmjene semantičkih podataka između različitih aplikacija. Međutim standardizacijom opisnog jezika omogućeno je lakši prenos i filtriranje sa dostupnim XML tehnologijama. Web bazirani alati su dostupni na različitim platformama i mogu biti prošireni korištenjem standardnih API-s (Application Programming Interface), klijent/server tehnologija i XML baziranih komunikacija.

    4. MPEG-21 standard

    MPEG-21 standard ima za cilj da definiše normativna akta za otvoreni radni

    prostor (open framework) za prenos i korištenje multimedijalnih sadržaja od strane svih učesnika u lancu prenosa i upotrebe. Ovakav otvoren radni prostor će omogućiti svima,od kreatora multimedijalnog sadržaja, distributera, do pružaoca usluga, jednake mogućnosti u MPEG-21 otvorenom tržištu. Ovo će biti od koristi i samim korisnicima koji će moći pristupiti širokom spektru multimedijalnih sadržaja uz mogućnost promjene istog. MPEG-21 se bazira na dva osnovna koncepta:

    definiciji osnovne jedinice za distribuciju i prenos, digitalni predmet (Digital

    Item), načinima na koje korisnici mogu raditi sa digitalnim predmetima.

    Digitalni predmeti se mogu posmatrati kao «šta» u multimedijalnom radnom prostoru (npr. video kolekcija, muzički album,..), a korisnici kao «ko» u istom prostoru. Cilj MPEG-21 standarda se može definisati kao definisanje tehnologije potrebne da podrži korisnike da razmjenjuju, pristupaju, koriste, mjenjaju i na druge načine manipulišu digitalnim predmetima na efikasan, transparentan i kooperativan način. Tokom MPEG-21 procesa standardizacije, predlozi za standarde na bazi dostupnih resursa su bili i još uvijek su podsticani od strane MPEG organizacije. Nakon dugotrajnog procesa dobijeno je da MPEG-21 treba da identifikuje i definiše mehanizme i elemente potrebne za podršku lancu za prenos multimedijalnog sadržaja, kao što je prethodno opisano, kao i veze između operacija koje se nad njim mogu izvršiti. Kao djelovi MPEG-21, ovi mehanizmi i elementi su predstavljeni definisanjem sintakse i semantike njihovih karakteristika, kao što su interfejs sa elementima.

  • Multimedijalne baze podataka

    Slađana Kičema,45/2000

    14

    Korisnik je bilo koji entitet iz MPEG-21 okruženja koji vrši interakciju u tom okruženju ili koristi digitalni predmet. Korisnici se identifikuju na osnovu njihove veze sa drugim korisnicima u raznim oblicima interakcije. Iz čisto tehničke perspektive, MPEG-21 standard ne pravi razliku između korisnika i kreatora sadržaja. Međutim, korisnik može imati tačno određena prava i odgovornosti u svojoj interakciji sa drugim korisnicima unutar MPEG-21 standarda. Neke od mogućih interakcija su kreiranje sadržaja, omogućavanje sadržaja, arhiviranje sadržaja, obogaćivanje i dostavljanje sadržaja, Jasno je da postoji mnoštvo različitih vrsta sadržaja, i isto toliko načina da se on opiše, kao i njegova upotreba. Tu se javlja potreba za postavljanjem moćnog i fleksibilnog modela za digitalne predmete koji može da obuhvati različite formate koje sadržaj može da poprimi, kao i formate koji mogu da se pojave u budućnosti. Digital Item Declaration ( 2.dio ISO/IEC 21000 standarda) pruža ovakav vid fleksibilnosti za predstavljanje digitalnih podataka. PRIMJER: Uzimamo da je jedna “web page” kao digitalni predmet. Tipična web stranica se obično sastoji od HTML dokumenta sa ugrađenim linkovima na .JPG, .GIF i druge fajlove. U ovom jednostavnom primjeru digitalni predmet čini sam HTML dokument uz sve ostale resurse na koje se oslanja. Sada modifikujemo primjer tako da pretpostavljamo da web stranica sadrži neku tipičnu logiku (npr. JavaScript itd.) za izbor jezika (između unaprijed određenog seta jezika) na kojem će stranica biti prikazana i omogući ovaj vid prikaza, ili prikaže default stranicu ukoliko jezik nije dostupan. U ovakvom modifikovanom primjeru sada se javlja kao ključni događaj prisustvo logike za jezik koja otežava definisanje digitalnog predmeta i šta ga čini. Postoje dvije mogućnosti: da se stranica za svaki jezik posmatra kao poseban digitalni predmet, ili da se stranica posmatra kao jedinstven digitalni predmet sa odgovarajućom jezičkom logikom. Druga mogućnost ne daje jasno određenje resursa koji prate ovakav digitalni predmet. Ovom problemu je posvećena pažnja u Deklaraciji digitalnog predmeta (Digital Item Declaration-DID). DID je dokument koji specificira izgled, strukturu i organizaciju digitalnog predmeta. Drugi dio MPEG-21 standarda sadrži DID specifikacije. MPEG-21 ima ustanovljen plan rada za buduću standardizaciju. Već je započeto sa standardizacijom u devet oblasti multimedijalnog radnog prostora (npr. tehnički izvještaj (Tehnical Report) je prvi dio MPEG-21 standarda). MPEG-21: 1.dio (Tehnical Report):

    Tehnički izvještaj opisuje multimedijalni radni prostor i elemente arhitekture zajedno sa funkcionalnim zahtjevima za njihovu specifikaciju (septembar,2001.) Poznat je pod nazivom “Vision, Technologies and Strategy”, što se odnosi na:

    • definisanje vizije za multimedijalni radni prostor da se omogući transparentna i agumented upotreba multimedijalnih resursa preko širokog domena mreža I uređaja da bi se realizovale potrebe korisnika;

    • postizanje integracjie komponenti i standarda da bi se olakšala harmonizacija tehnologija za kreiranje, upravljanje, transport, manipulaciju distribuciju I korištenje digitalnih predmeta;

  • Multimedijalne baze podataka

    Slađana Kičema,45/2000

    15

    • definisanje strategije za ostvarivanje multimedijalnog radnog prostora razvojem specifikacija i standarda baziranih na dobro definisanim funkcionalnim zahtjevima definisanim u saradnji sa drugim tijelima.

    2.dio (Digital Item Declaration-DID): Svrha DID specifikacije je da opiše skup apstraktnih termina i metoda za definisanje digitalnih podataka (Digital Item). U ovakvom modelu digitalni predmet predstavlja digitalnu verziju “rada”. Ovaj model ne definiše jezik, nego pruža niz termina i metoda za definisanje šeme ili za mapiranje između već postojećih šema, za svrhe poređenja. DID tehnologija je definisana u tri normativne sekcije:

    • Model, • Prezentacija, • Šema.

    Glavni elementi DID modela su: container, predmet (item), komponenta (component), (anchor), deskriptor (descriptor), uslov (condition), izbor (choice), selekcija (selection), annonation, assertion, izvor (resource), fragment (fragment), iskaz (statement), predikcija (predicate).

    Sl.4.1. Veze između glavnih djelova DID modela- primjer koda

    3.dio (Digital Item Identification-DII) Cilj DII specifikacije je:

    • da se jedinstveno identifikuje digitalni predmet i prateći resursi, • da se jedinstveno identifikuje IP povezan sa digitalnim predmetom, • da se jedinstveno identifikuju deskripcione šeme, • da se koriste identifikatori da bi se povezali digitalni predmeti sa

    odgovarajućim informacijama kao što su deskripcioni podaci, • kako da se identifikuju različiti tipovi digitalnih predmeta.

    Identifikatori iz ove specifikacije se povezuju sa digitalnim predmetom preko posebnog mjesta u statement elementu DID-a.

  • Multimedijalne baze podataka

    Slađana Kičema,45/2000

    16

    4.dio (Intellectual Property Management and Protection -IPMP) U ovom dijelu definiše se kompatibilni radni prostori za upravljanje i zaštitu intelektualnog vlasništva (Intellectual Property Management and Protection). Definisani su standardizovani načini za pronalaženje IPMP alata sa udaljenih lokacija, razmjena poruka između IPMP alata, kao i između ovih alata i terminala. 5.dio (Rights Expression Language-REL) Rights Expression Language je određen kao machine-readable jezik koji može da odredi prava i dozvole koristeći termine definisane u Rights Data Dictionary.

    Sl.4.2. REL model podataka 6.dio (Rights Data Dictionary-RDD) RDD se definiše kao set preciznih, konzistentni, uređenih, integrisanih i jedinstveno identifikovanih termina za podršku MPEG-21 Rights Expression Language. Uzimaju se u obzir okolnosti da isti termin može imati drugo značenje u drugom izvoru. RDD specifikacija omogućava preslikavanje ili transformaciju metapodataka iz okvira jednog izvora podataka u okvir drugog izvora, automatski ili poluautomatski, uz minimalne gubitke semantičkog integriteta. 7.dio (Digital Item Adaptation) Da bi se ostvarila međusobna saradnja i transparentni pristup unaprijeđenom multimedijalnom sadržaju, potrebni su mehanizmi za adaptaciju digitalnih predmeta. Na ovaj način se dobija adaptirani digitalni predmet.

    Sl.4.3. Koncept adaptacije digitalnog predmeta

  • Multimedijalne baze podataka

    Slađana Kičema,45/2000

    17

    8.dio (Reference Software) Razvoj ovog vida softvera će biti bazirano na zahtjevima koji će proizilaziti iz arhitektura definisanih za procesiranje digitalnih predmeta. 9.dio (File Format) Digitalni predmet može biti kompleksna kolekcija podataka, koja može sadržati statičke i dinamičke medije, kao i informacije o digitalnom predmetu. Iz ovih razloga MPEG-21 fajl format će naslijediti neke od koncepata MP4 formata, da bi se omogućila njegova višestruka korisnost.

    4.1. UMA Media base – Upravljanje metapodacima koristeći Oracle Database System Ovaj primjer će se fokusirati na to kako se metapodaci multimedijalnih resursa mogu organizovati kroz kolekciju različitih tehnologija formirajući UMA (Universal Multimedia Access) bazu multimedijalnih podataka. Na slici je prikazana uloga multimedijalnih baza u MPEG-21 okruženju. Prikazanu su dva korisnika, od kojih jedan predaje multimedijalni sadržaj, a drugi je korisnik tog sadržaja. Oni razmjenjuju informacije upakovane u vidu digitalnih predmeta (digital items), koristeći MPEG-21 Digital Item Adaption kao načina za ostvarivanje UMA.

    Sl.4.4. Multimedijalna baza integrisana u MPEG-21 sistem

    Multimedijalna baza podataka ne pruža samo podršku za različite tipove multimedijalnih resursa, nego i mogućnosti da se oni kreiraju, sačuvaju, pretražuju i kontrolišu. Zahtjevi i funkcionalnosti multimedijalnih baza su, u principu, isti kao i kod tradicionalnih sistem za upravljanje bazama podataka. Namjene multimedijalnih baza podataka se mogu opisati sledećim atributima:

    integracija, nezavisnost podataka od upravljanja, potpuna kontrola, sigurnost, privatnost, integritet, podrška u vidu upitnog jezika, kontrola verzije.

  • Multimedijalne baze podataka

    Slađana Kičema,45/2000

    18

    Specifičnost resursa multimedijalnih podataka nameće uvijek nove zahtjeve. Sistemi za upravljanje multimedijalnim bazama podataka moraju tretirati multimedijalne podatke kao osnovni tip podataka. Multimedijalna baza podataka u navedenom slučaju koristi sledeće alate:

    XML, Oracle9i DBMS, JDBC, QuickTime for Java.

    Ključna komponenta u ovoj bazi je Oracle9i DBMS, koji vrši povezivanje izvorišta multimedijalnih podataka i odgovarajućih metapodataka. Baza čuva dva glavna tipa podataka. Prvi tip čine MPEG-21 digitalni predmeti koji su pohranjeni u OracleXML tabeli. Drugi tip su metapodaci povezani sa izvorima multimedijalnih podataka. Da bi se dobilo uređena baza ovakvih tipova podataka koriste se Oracle9i interMedia i OracleXML. Oracle interMedia Oracle interMedia je standardni dio Oracle9i DBMS. On omogućava platformi da podrži medijalni sadržaj sa interneta, kao što su, tekst, dokumenti, slike, audio, video uz sve prateće podatke. Oracle9i je objektno orijentisana baza podataka, što znači da su neki tipovi medija već definisani, zajedno sa odgovarajućim metodima i atributima. Objekti su sličnima Java ili C++ objektima, uz korištenje Binary Large Objects – BLOBS i File-based Large Objects – BFILE za formiranje kompleksnijih medijskih tipova, ORDAudio, ORDImage i ORDVideo. OracleXML Database XML se često koristi za razmjenu podataka između različitih sistema sa različitim karakteristikama. Digitalni predmet je osnovna jedinica prenosa unutar MPEG-21 standarda, i pisan je u XML-u. Da bi se demonstrirala funkcionalnost baze posmatra se aplikacija na sledećoj slici. Aplikacija ilustruje kako MPEG-21 radno okruženje zajedno sa bazom može da se iskoristi za pronalazak i preslušavanje muzičkih videa. Sposobnosti Oracle interMedia su testirane kroz automatsku ekstrakciju i pohranjivanje metapodataka izvorišta multimedija.

  • Multimedijalne baze podataka

    Slađana Kičema,45/2000

    19

    Sl.4.5. Protok informacija u applikaciji

    Izlazni digitalni predmeti su sačuvani korištenjem Oracle XML baze podataka. Odluke o slanju medijskih resursa se donose na bazi korisničkog okruženja za memorisanje i ibora od strane korisnika. Na slici je objašnjen tok informacija.

    1. Korisnik započinje sesiju birajući uslugu u GUI (Guide User Interface). 2. Server pronalazi i šalje Digital Item DIA_Request_Capabilities. 3. Korisnički terminal prima Digital Item. Raščlanjuje je i generiše odgovor

    sadržeći korisničko okruženje bazirano na korisničkom unosu. 4. Server raščlanjuje i pohranjuje korisničko okruženje. 5. Server šalje Digital Item DID_Menu. 6. Terminal raščlanjuje Digital Item DID_Menu, i generiše servis meni. 7. Korisnik bira album i pjesmu. Terminal generiše Digital Item

    DID_Menu_Response. 8. Server raščlanjuje i pohranjuje izabrani album i pjesmu. Pronalazi URL do

    konačnog izvorišta. Generiše Digital Item MEDIACDI. 9. Terminal raščlanjuje Digital Item, izvlači URL izvora. Prikazuje izvor

    medija korisniku, uz dostavu podataka. Oracle9i DBMS formira osnove za multimedijalne baze podataka.

    5. OTVORENA PITANJA

    Još od prvog sistema multimedijalne baze podataka ORION 1987. godine, oblasti primjene multimedijalnih baza podataka su doživjele ogroman rast. Sa stanovišta multimedijalnih baza podataka dva važna pitanja se moraju uzeti u obzir:

  • Multimedijalne baze podataka

    Slađana Kičema,45/2000

    20

    Pitanje modelovanja multimedijalnih podataka: Dobar model treba da rješi sledeće probleme,

    o problem mehanizma za skladištnje podataka u bazu, o treba da omogući reprezentaciju za logičku medijsku strukturu, o semantička značenja trebaju biti modelovana i povezana sa

    karakteristikama niskog nivoa i strukturom medija, o Metapodaci moraju biti određeni i pohranjeni u bazi, o Model se mora oslanjati na međunarodne standarde (MPEG-7), da bi

    omogućio kompatibilnost među podacima.

    Pitanje označavanja, upita i prezentacije multimedija. Ključna funkcionalnost u multimedijalnim bazama podataka je način na koji se

    pristupa multimedijalnim informacijama i kako se one razmjenjuju efikasno. Najvažnija stvar je kako pronaći i preslušavati kontinualne i nekontinualne medije sa kratkim real-tajm ograničenjma. Ključ kod procesa pronalaska multimedijalnog sadržaja je sličnost između dva objekta. Ovdje se vrši pretraživanje na bazi sadržaja. Efikasnost pretraživanja po sličnosti mora biti podržana korištenjem specijalnih višedimenzionalnih struktura za indeksiranje i metoda za redukciju dimenzija.

    Multimedijalni upitni jezik mora da bude u mogućnosti da prepozna komleksne prostorne i vremenske veze. Upitni jezik mora da radi sa ključnim riječima, indeksima na bazi ključnih riječi i semantičkom sadržaju multimedijalnih objekata. Način efikasne komunikacije se oslanja na standarde za komunikaciju metapodataka i pridruženih medijalnih podataka. Važan doprinos je razvoj sistemskih dijelova MPEG-7 i fajl formata MPEG-21 standardom. Svi ovi problemi se odnose i na pronalazak objekata nastalih kao kombinacija različitih medijskih sadržaja, npr. kada čitamo tekst iz novina istovremeno želimo da vidimo i video zapis. To znači da moramo da radimo sa nekoliko elementarnih multimedijalnih podataka, prezentacijama medijalnih podataka, istovremeno. MPEG-21 ide u ovom smijeru uvođenjem predstavljanja digitalnih predmeta (Digital Item), što će bitno uticati na multimedijalne baze podataka u budućnosti. U ovom smislu važno je da multimedijalne baze podataka koriste višestruke reprezentacije podataka za različite korisnike i profile, za Intellectual Property Managemant i za svrhe adaptacije.

    Sl.4.6. Arhitektura multimedijalnih baza podataka

  • Multimedijalne baze podataka

    Slađana Kičema,45/2000

    21

    Literatura

    Harald Kosch, Institute of Information Technology, University Klagenfurt, Austria: “MPEG7 and Multimedia Database Systems ” Mario Döller, Department of Distributed Information Systems, University Passau, Germany: “MPEG-7 Meets Multimedia Database Systems” Harald Kosch, Mario Döller,Institute of Information Technology, University Klagenfurt, Austria: “Multimedia Database Systems: Where are we now?” John R. Smith, IBM T. J. Watson Research Center: “What’s New with MPEG? ” R.J. Solberg1, P. Drege1, A. Perkis, J. Zhang: “UMA Media base – Metadata Management using Oracle Database System ”

    Mathias Lux, Jutta Becker: “XML and MPEG-7 for Interactive Annotation and Retrieval using Semantic Meta-data ” http://www.chiariglione.org/mpeg/standards/mpeg-7/mpeg-7.htm#E9E1 http://www.chiariglione.org/mpeg/standards/mpeg-21/mpeg-21.htm#_Toc23297968 http://www.dbpd.com/vault/search.shtml http://en.wikipedia.org/wiki/MPEG-7#Introduction http://en.wikipedia.org/wiki/MPEG-21 http://www.chiariglione.org/mpeg/ http://vision.ece.ucsb.edu/multimedia/cortina.html