Upload
lukki-arjuna
View
167
Download
10
Embed Size (px)
DESCRIPTION
segmentasi citra digital
Citation preview
Pengolahan Citra Digital
“Segmentasi Citra”
Oleh :Lukki Arjuna10951005568
Fakultas Sains dan TeknologiJurusan Teknik InformatikaUniversitas Islam Negeri Sultan Syarif Kasim Riau
1. Gambaran Umum
Segmentasi citra digital adalah pembagian daerah citra digital menjadi bagian-bagian
daerah yang lebih kecil berdasarkan letak pixel dan intensitasnya yang masih berdekatan.
Pendekatan yang digunakan antara lain berdasarkan jumlah daerah pembagian yang
diinginkan, dan ada juga berdasarkan kriteria untuk suatu tujuan tertentu.
Algoritma segmentasi citra umumnya didasarkan pada salah satu dari diskontinuitas
atau similaritas. Pada diskontinuitas, citra dipartisi berdasarkan perbedaan intensitas yang
mencolok, misalnya edge (tepian) dari citra. Sedangkan pada similaritas, citra dibagi menjadi
beberapa region berdasarkan kesamaan yang dimiliki dalam hal kriteria-kriteria yang telah
ditentukan sebelumnya.
Segmentasi banyak digunakan dalam bidang komputer vision untuk memisahkan
objek dari latar belakangnya dan memisahkan objek yang satu dengan objek yang lain. Satu
daerah dipandang sebagai satu objek atau bagian dari suatu objek. Jika tujuan yang
diinginkan adalah pengenalan objek, maka objek-objek yang terpisah tersebut akan lebih
mudah dikenali oleh komputer. Tetapi jika tujuan yang diinginkan adalah menentukan
koordinat dimensi tiga pixel-pixel, maka koordinat dari pixel-pixel yang satu daerah tersebut
dipandang sebagai titik-titik yang berdekatan atau sebagai suatu permukaan objek yang
kontinu.
Ketunggalan dan keglobalan segmentasi merupakan hal yang sangat penting dalam
komputer vision. Ketunggalan adalah segmentasi citra digital tidak akan berubah walaupun
nilai awal proses segmentasi berubah. Sedangkan keglobalan adalah proses segmentasi
dilakukan dengan melibatkan semua pixel-pixel citra digital. Mean Shift merupakan metode
yang sekaligus memenuhi sifat ketunggalan dan keglobalan.
2. Metode Segmentasi Citra
2.1. Deteksi Diskontinuitas
Ada tiga macam diskontinuitas tingkat keabuan pada citra digital; yaitu : point (titik),
line (garis), edge (tepi).Cara yang paling banyak digunakan untuk mendeteksi diskontinuitas
pada citra digital adalah dengan menjalankan mask (filter) melewati seluruh citra Mask
umumnya berupa matriks m x n, terdiri dari koefisien-koefisien yang jika dijumlahkan akan
bernilai nol, yang menyatakan bahwa response mask akan bernilai nol di area yang tingkat
keabuannya konstan.
Response dari mask pada sembarang titik pada citra :
dimana zi adalah tingkat keabuan dari piksel citra, dan diasosiasikan dengan koefisien mask
wi. Response mask didefinisikan pada lokasi titik pusat mask.
Deteksi Titik (Point detection)
Suatu titik terdeteksi berada di pusat mask jika |R| ≥ T, dimana T adalah threshold
nonnegative. Idenya adalah bahwa titik yang terisolasi (suatu titik dengan tingkat keabuan
yang sangat berbeda dari latar belakangnya dan berada di area yang homogen atau hampir
homogen) akan sangat berbeda dengan latar belakangnya
Deteksi Garis (Line Detection)
Jika mask sebelah kiri dipindahkan pada seluruh citra, maka responnya akan lebih
kuat pada garis dengan ketebalan satu piksel dan berorientasi horisontal. Koefisien mask jika
dijumlahkan adalah nol. Hal ini menunjukkan bahwa respon mask adalah nol pada area
dengan tingkat keabuan konstan.
Misalkan R1, R2, R3, dan R4, menyatakan respons dari mask. Anggaplah bahwa
setiap mask dijalankan sendiri-sendiri pada suatu citra. Jika, pada satu titik citra, |Ri|>|Rj|,
untuk semua j¹i, titik tersebut dikatakan lebih berasosiasi dengan garis dengan arah mask i.
Jika kita ingin mendeteksi garis dengan arah yang sudah ditentukan, kita bisa menggunakan
mask yang sesuai dengan arah tersebut dan melakukan thresholding terhadap outputnya.
2.2. Deteksi Tepi (Edge Detection)
Tepi (edge) adalah himpunan piksel terhubung yang terletak pada boundary di antara
dua region. Tepi ideal seperti diilustrasikan pada gambar 10.5.a adalah himpunan piksel
terhubung (dalam arah vertikal), masing-masing terletak pada transisi step orthogonal dari
tingkat keabuan.
Pada prakteknya, ketidaksempurnaan optik, sampling, dan proses pengambilan data
citra, akan menghasilkan tepi-tepi yang kabur, dengan derajat kekaburan ditentukan oleh
faktor-faktor seperti kualitas peralatan yang digunakan untuk mengambil data citra, rata-rata
sampling, dan kondisi pencahayaan. Akibatnya, tepi lebih banyak dimodelkan seperti “ramp”
(lihat gambar fig 10.5.b). Ketebalan tepi ditentukan oleh panjang ramp. Panjang ramp
ditentukan oleh kemiringan (slope), dan slope ditentukan oleh derajat kekaburan. Tepian
yang kabur cenderung lebih tebal, dan tepian yang tajam cenderung lebih tipis.
Magnitude dari turunan pertama bisa digunakan untuk mendeteksi keberadaan edge
pada suatu titik dalam citra (misalnya, menentukan apakah suatu titik berada pada ramp atau
tidak). Tanda dari turunan kedua bisa digunakan untuk menentukan apakah suatu piksel edge
terletak pada sisi gelap atau sisi terang dari edge. Property zero-crossing (garis lurus imajiner
yang menghubungkan nilai ekstrim positif dan negatif dari turunan kedua akan melintasi nol
di pertengahan edge) cukup berguna untuk menentukan pusat dari edge yang tebal.
Agar dapat diklasifikasikan sebagai titik tepi, transisi tingkat keabuan pada titik tersebut
harus cukup kuat dibandingkan background di sekitarnya. Untuk menentukan apakah suatu
nilai “cukup signifikan” atau tidak, bisa digunakan threshold.
Jadi, suatu titik di dalam citra merupakan bagian dari edge, jika turunan pertama 2-D
nya lebih besar dari threshold. Himpunan titik-titik yang terhubung menurut kriteria
keterhubungan tertentu didefinisikan sebagai edge. Istilah segmen edge digunakan jika
ukuran edge relatif pendek dibanding ukuran citra. Permasalahan dalam segmentasi adalah
bagaimana cara merangkai segmen-segmen edge ini menjadi edge yang lebih panjang. Edge
juga bisa ditentukan menggunakan property zero crossings dari turunan kedua.
Operator Gradien
Gradien dari citra f(x,y) pada lokasi (x,y) didefinisikan sebagai vektor :
Magnitude vektor adalah :
Arah gradien pada (x,y) adalah :
dimana α(x,y) menyatakan sudut vector Ñf di (x, y) terhadap
sumbu x-axis.
Pendekatan lain untuk memperkirakan magnitude vektor adalah :
Laplacian
Laplacian dari fungsi 2-D f(x, y) adalah turunan kedua yang didefinisikan sebagai :
Laplacian umumnya tidak digunakan dalam bentuk aslinya untuk deteksi tepi, karena:
sangat sensitive terhadap noise
magnitude dari Laplacian menghasilkan menghasilkan tepi ganda
tidak dapat mendeteksi arah tepian.
Peranan Laplacian untuk segmentasi adalah :
mendeteksi lokasi edge(tepi) menggunakan properti zero crossing.
Untuk menentukan apakah suatu oiksel berada di daerah gelap atau daerah terang dari
edge (tepi)
Untuk menemukan edge dengan zero-crossing, Laplacian dikombinasikan dengan
fungsi Gaussian berikut:
dimana r2 = x2 + y2, dan s adalah standard deviasinya.
Sehingga Laplacian dari h adalah:
yang disebut sebagai Laplacian of Gaussian(LoG). Tujuan dari fungsi Gaussian pada
LoG adalah untuk memperhalus citra, dan tujuan dari operator Laplacian tersebut
adalah untuk memberikan suatu citra dengan zero-crossing yang digunakan untuk
menentukan lokasi dari edge (tepi). Zero crossing berada di antara nilai positif dan
negative dari Laplacian, sehingga satu cara untuk memperkirakan zero crossing
adalah men-threshold citra LoG dengan menetapkan semua nilai positif menjadi,
misal, putih, dan semua nilai negative menjadi hitam. Kelebihan zero crossing adalah
kemampuannya untuk mereduksi noise dan potensinya untuk citra yang tidak rata.
Edge Linking and Boundary Detection
Local Processing
Dua hal terpenting yang digunakan untuk menentukan persamaan edge pixel pada
analisis ini adalah: kekuatan dari respon gradient operator yang digunakan untuk
memproduksi edge pixel (diperoleh dari nilai ); dan arah dari vektor gradien.
Suatu edge pixel dengan koordinat (x0,y0) dalam predefined neighborhood (x,y),
sama dalam hal magnitude pixel pada (x,y) jika dimana E
merupakan nonnegative threshold. Suatu edge pixel pada (x0,y0) dalam predefined
neighborhood dari (x,y) mempunyai kesamaan angle dengan pixel pada (x,y) jika
dimana A merupakan nonnegative angle threshold. Satu titik
pada predefined neighborhood dari (x,y) dihubungkan dengan pixel pada (x,y) jika
kriteria magnitude dan arah terpenuhi. Proses ini diulang pada setiap lokasi dalam
gambar.
Global Processing via the Hough Transform
Dalam hal ini, titik-titik dihubungkan oleh ketetapan awal apakah titik-titik itu berada
pada kurva dari bentuk yang ditetapkan. Selain itu juga memperhatikan relasi global
antara pixel. Hough Transform merupakan pendekatan alternatif untuk menemukan
himpunan dari beberapa titik dalam suatu image yang terletak pada garis lurus. Satu
jalan yang dapat digunakan untuk masalah representasi suatu garis menggunakan
persamaan y = ax + b adalah dengan menggunakan representasi normal dari suatu
garis: x cosθ + y sinθ = ρ. Hough Transform dapat diaplikasikan kepada fungsi dari
bentuk g(v,c) = 0, dimana v merupakan koordinat vektor dan c adalah koefisien
vektor.
Pendekatan Hough Transform:
1. Hitung gradien dari suatu image dan lakukan pembatasan untuk mendapatkan
binary image.
2. Spesifikasikan subdivisi dalam ρθ-plane.
3. Periksa jumlah accumulator cells untuk pixel dengan konsentrasi tinggi.
4. Periksa relasi antara pixel-pixel dalam cell yang terpilih.
Global Processing via Graph-Theoretic Techniques
Merupakan pendekatan yag paling rumit dan butuh waktu pemrosesan yang lebih
lama dibandingkan metode-metode sebelumnya. Graph G = (N,U)àdimana U
merupakan pasangan elemen yang tidak berurutan dari N. Arc merupakan setiap
pasang (ni,nj) dari U. Jika suatu arc diarahkan dari node ni ke node nj, maka nj
disebut successor dari node parent ni. Expansi dari suatu node adalah proses
mengidentifikasi successor dari suatu node. Start atau root node yaitu level yang
terdiri dari single node, sedangkan goal node adalah node pada level paling akhir.
Suatu cost c(ni,nj) dapat dihubungkan dengan setiap arc(ni,nj). Urutan dari node n1,
n2,...,nk, dengan setiap node ni menjadi successor dari node ni-1, disebut path dari n1
ke nk. Cost dari path keseluruhan adalah:
Setiap elemen edge yang didefinisikan oleh pixel p dan q mempunyai cost sebagai
berikut: , dimana H = nilai gray-level tertinggi dalam
suatu image, f(p) = nilai gray-level dari p, f(q) = nilai gray-level dari q. Dengan
kesepakatan bahwa titik p berada pada sisi right-hand dari arah perjalanan elemen-
elemen edge. Jika r(n) merupakan perkiraan biaya dari minimum-cost path dari node
awal s ke node akhir, dimana path dibatasi melalui n, maka r(n) = g(n) + h(n)
dimana g(n) à lowest-cost path dari s ke n, dan h(n) didapatkan dengan menggunakan
informasi heuristic yang tersedia.
Langkah-langkah algoritma yang menggunakan r(n) sebagai dasar dari pencarian
grafik:
1. Tandai node awal “open” dan tetapkan g(s) = 0
2. Jika tidak ada node yang bertanda OPEN keluar dengan kegagalan; jika tidak
lanjutkan
3. Tandai dengan ”closed” n node ”open” yang hasil penghitungan r(n)dari
persamaan r(n) = g(n) + h(n) bernilai paling kecil
4. Jika n adalah node akhir, keluar dengan solusi path yang didapatkan dengan
tracing back melalui pointer; jika tidak lanjutkan
5. Tambahkan node n, menghasilkan semua successor (jika tidak ada successor,
kembali ke langkah kedua)
6. Jika successor ni tidak ditandai, maka r(ni) = g(n) + c(n,ni), tandai dengan
”open” dan kembalikan pointer ke n.
7. Jika successor ni ditandai ”closed” atau ”open”, update nilainya dengan
. Tandai ”open”successor bertanda
”closed” tersebut yang memilki nilai g’ lebih rendah dan arahkan pointer ke n
dari semua node yang memiliki nilai g’ lebih rendah. Lanjutkan ke langkah
kedua.
2.3. Thresholding
Merupakan posisi pusat pada aplikasi segmentasi image karena karakterisitik yang intuitif
dan kesederhanaan implementasi.
Foundation
Menjelaskan dua tipe thresholding: single threshold dan multiple threshold. Pada
single threshold, pixel object dan background mempunyai gray level yang
dikelompokan menjadi dua mode yang dominan. Satu cara untuk memisahkan object
dari background adalah dengan memilih background batas T. Maka, titik (x,y) dimana
disebut object point; selain itu berarti titik tersebut merupakan
background point. Di lain pihak, pada multiple threshold, pixel object dan background
mempunyai gray level yang dikelompokkan menjadi tiga mode yang dominan,
menggolongkan satu titik (x,y) sebagai object class jika , lalu ke
object class yang lain jika , dan merupakan background jika .
Fungsi T pada thresholding: , dimana adalah gray
level titik (x,y) dan p(x,y) menunjukkan beberapa local property pada titik ini.
Batasan image g(x,y):
pixel yang diberi label 1 mengacu pada object sedangkan yang berlabel 0 merupakan
background.
Tiga tipe threshold:
1. Global, jika T tergantung hanya pada f(x,y).
2. Local, jika T tergantung pada f(x,y) maupun p(x,y).
3. Dynamic atau adaptive, jika T tergantung pada koordinat spasial x dan y.
The Role of Illumination
Pada chapter 2 diperkenalkan sebuah model sederhana dari sebuah image f(x,y) yang
dibentuk sebagai hasil dari sebuah komponen yang direfleksikan oleh r(x,y) dan
sebuah komponen cahaya i(x,y). Tujuan dari bab ini adalah menggunakan model ini
untuk mendiskusikan secara jelas efek dari cahaya pada thresholding, terutama pada
global thresholding.
Fungsi computer generated reflectance ditunjukkan pada gambar 10.27(a). Histogram
pada fungsi ini ditunjukkan pada gambar 10.27(b), bimodal dan dapat dipartisi dengan
mudah dengan menempatkan single global threshold T pada lembah histogram.
Perkalian fungsi reflectance pada gambar 10.27(a) oleh fungsi illumination
ditunjukkan pada gambar 10.27(c) yang menghasilkan image yang ditunjukkan pada
gambar 10.27(d). Gambar 10.27(e) menunjukkan histogram dari image ini.
Alasan mengapa histogram pada gambar 10.27(e) diubah, dapat dijelaskan sebagai
berikut :
Dari persamaan (4.5-1) F(x,y) = i(x,y)r(x,y) (10.3-3) Mengambil logaritma natural
dari persamaan ini menghasilkan sebuah penjumlahan :
Z(x,y) = ln f(x,y) = ln i(x,y) + ln r(x,y) = i’(x,y) + r’(x,y)
Dari teori probabilitas, jika i’(x,y) dan r’(x,y) adalah variable yang independent,
histogram dari z(x,y) diberikan oleh convolution dari histogram i’(x,y) dan r’(x,y)/
Jika i(x,y) konstan, I’(x,y) juga akan konstan, dan histogramnya akan menjadi simple
spike (seperti sebuah impulse).
Ketika mengakses sumber illumnitaion yang tersedia, sebuah solusi yang digunakan
untuk mengkompensasi ketidakseragaman adalah memproyeksikan pola illumination
ke dalam sebuah konstanta, permukaan putih yang memantulkan cahaya.
Ini menghasilkan sebuah image g(x,y) = ki(x,y) dimana k adalah sebuah konstanta
yang tergantung pada permukaan dan i(x,y) adalah pola illumination.
f(x,y) = i(x,y)r(x,y) mendapatkan fungsi illumination yan sama, f(x,y) dibagi g(x,y)
menghasilkan fungsi normal h(x,y) = f(x,y)/g(x,y) = r(x,y)/k.
Jika r(x,y) dapat disegmen menggunakan single threshold T, kemudian h(x,y) dapat
disegmen menggunakan single threshold dari nilai T/k.
Basic Global Thresholding
Teknik yang paing sederhana dari semua thresholding adalah mempartisi image
histogram menggunakan single global threshold T.
Segmentasi diselesaikan dengan men-scan image pixel per pixel dan melabelkan tiap
pixel sebagai obyek atau background, tergantung pada gray level dari pixel tersebut
lebih besar / kecil daripada nilai T.
Misal obyek lebih gelap dari background, maka pixel dengan gray level <= T
dilabelkan hitam(0), dan pixel dengan gray level > T dilabelkan putih(255).
Algoritma berikut dapat digunakan untuk mendapatkan T secara otomatis :
1. Pilih sebuah perkiraan inisial untuk T
2. Segmen image menggunakan T. Ini akan menghasilkan 2 grup pixel :
G1 yang terdiri dari semua pixel dengan nilai gray level > T dan G2 terdiri dari pixel
dengan nilai <=T
3. Hitung nilai gray level rata – rata dan untuk piksel – piksel pada area G1
dan G2.
4. Hitung nilai threshold baru :
5. Ulangi langkah 2 – 4 sampai perbedaan T pada iterasi yang berturut – turut
lebih kecil daripada parameter yang ditetapkan sebelumnya
Basic Adaptive Thresholding
Semua subimage yang tidak mengandung batasan antara obyek dan background
mempunyai varian yang lebih kecil dari 75. Semua image mengandung batasan yang
mempunyai varian yang lebih dari 100. Tiap subimage dengan varian yang lebih besar
dari 100 disegmen dengan sebuah threshold yang dihitung untuk subimage tersebut
menggunakan algoritma yang didiskusikan pada bab sebelumnya.
Optimal Global and Adaptive Thresholding
Seandainya sebuah image hanya mengandung dua area gray-level yang utama. Nilai
z menunjukkan nilai gray-level. Nilai – nilai ini adalah kuantitas random, dan
histogramnya kemungkinan adalah perkiraan dari probability density function (PDF),
p(z). Fungsi density secara keseluruhan adalah penjumlahan atau pencampuran dari
dua density, satu untuk terang, dan yang lain untuk area gelap pada gambar.
Gambar 10.32 menunjukkan dua PDF. Diasumsikan bahwa dua PDF yang lebih besar
terhubung dengan background level, sedangkan yang lebih kecil menjelaskan gray
level obyek dalam image. Campuran PDF yang menggambarkan variasi gray level
secara keseluruhan pada image adalah :
p(z) = P1p1(z) + P2p2(z)
P1 dan P2 adalah probabilitas dari dua kelas piksel. P1 adalah probabilitas piksel
random dengan nilai z. P2 adalah probabilitas yang mana piksel adalah background
piksel. Asumsikan bahwa piksel yang diberikan termasuk onyek atau background,
sehingga P1 + P2 = 1 Sebuah image disegmentasikan oleh klasifikasi sebagai
background semua piksel dengan gray – level yang lebih besar dari threshold T.
Semua piksel yang lain disebut piksel obyek.
Probabilitas dari sebuah variable random yang mempunyai nilai pada interval [a,b]
adalah integral dari PDF dari a ke b, yang mana area kurva PDF di antara dua batasan
ini.
Probabilitas klasifikasi sebuah titik background sebagai titik obyek
adalah
Ini adalah area di bawah kurva dari p2(z) ke sebelah kiri dari threshold. Probabilitas
dari klasifikasi sebuah titik obyek sebagai background adalah
Yang mana area di bawah kurva dari p1(z) ke kanan T. Kemudian probabilitas
keseluruhan error adalah
E(T) = P2E1(T) + P1E2(T)
Untuk mencari nilai threshold untuk error ini minimal membutuhkan perbedaan E(T)
dengan respect T (menggunakan Leibniz’s rule) dan hasilnya sama dengan 0.
Hasilnya :
P1p1(T) = P2p2(T)
Satu dari density utama yang digunakan pada cara ini adalah Gaussian density, yang
mana digolongkan oleh dua parameter: mean dan varian. Dalam kasus ini,
dimana dan adalah mean dan varian dari Gaussian density dari satu kelas dari
piksel – piksel dan dan adalah mean dan varians dari kelas lain.
Menggunakan persamaan pada solusi umum dari persamaan (10.3-10) menghasilkan
solusi berikut untuk threshold T :
AT2 + BT + C = 0
dimana
Karena persamaan kuadrat mempunyai dua solusi yang memungkinkan, nilai dua
threshold dibutuhkan untuk mendapatkan solusi optimal.
Jika varian – varian sama, , cukup untuk sebuah single threshold :
Use of Boundary Characteristic for Histogram Improvement and Local
Thresholding
Puncak histogram yang tinggi, sempit, simetrik, dan terpisah oleh lembah yang dalam,
menambah kemungkinan untuk mendapatkan threshold yang bagus.
Sebuah pendekatan untuk menambah bentuk histogram dengan hanya
mempertimbangkan pixel yang berada atau dekat pada batasan antara objek dan
background. Perbaikan yang sangat jelas yaitu ketergantungan histogram terhadap
ukuran objek dan background lebih sedikit. Contohnya histogram dari sebuah gambar
yang terdiri dari objek-onjek yang kecil pada sebuah background yang besar akan
didominasi oleh puncak yang besar karena konsentrasi yang tinggi dari sebuah tipe
pixel.
Probabilitas dari letak pixel pada sebuah objek akan mendekati probabilitas letak
pixel tersebut pada background, jadi memperbaiki simetri pada lembah histogram.
Penggunaan pixel yang dapat memenuhi ukuran yang berdasarkan gradient and
Laplacian operators memiliki kecenderungan ke lembah yang lebih dalam diantara
puncak histogram.
Penggunaan Laplacian dapat memberi informasi mengenai letak pixel mana yang
berada pada sisi yang terang dan gelap dari sebuah edge.
Threshold Based on Several Variables
Sensor menyediakan lebih dari satu variable untuk mengkarakterisasi setiap pixel
pada sebuah image, maka di sini diperbolehkan multispectral thresholding. Gambar
berwarna merupakan contoh dimana tiap pixelnya dikarakterikasi oleh tiga nilai RGB.
Maka sekarang bukan hanya histogram 2-D lagi, tetapi pada kasus ini 3-D. Prosedur
dasarnya sama seperti metode yang digunakan untuk satu variable. Contoh, sebuah
gambar dengan tiga variable (RGB komponen), masing-masing memiliki 16 level
kemungkinan, sebuah 16x16x16 cube. Tiap cell dari cube adalah nilai pixel yang
RGB komponennya memiliki nilai yang berkorespondensi dengan koordinat yang
mendefinisikan lokasi dari cell tertentu. Tiap nilai lalu dibagi dengan total nilai pixel
pada gambar untuk di tampilkan pada sebuah histogram.
Konsep dari thresholding sekarang menjadi satu cara untuk menemukan cluster dari
titik-titik pada ruang 3-D. Contoh, K signifikan cluster dari titik-titik yang ditemukan
pada histogram. Gambar bisa disegmentasi dengan menetapkan sebuah nilai (putih)
pada pixel yang memiliki komponen RGB yang lebih dekat pada satu cluster dan nilai
lainnya (black) pada pixel lainnya di gambar.
Hue and saturation merupakan property yang penting pada banyak aplikasi yang
menggunakan gambar untuk inspeksi secara otomatis.
2.4. Region-Based Segmentation
Tujuan dari segmentasi yaitu membagi sebuah gambar menjadi beberapa region. Pada bagian
ini membahas teknik segmentasi berdasarkan menemukan region secara langsung.
Basic Formulation
R merepresentasikan seluruh region gambar. Proses segmentasi yang mempartisi R
menjadi n subregion, R1,R2 ,…..,Rn yaitu
P(Ri) merupakan logical predicate yang mendefinisikan semua titik pada kumpulan Ri
dan merupakan himpunan kosong
o Mengindikasikan segmentasi harus lengkap, semua pixel harus pada region
o Titik-titik pada sebuah region harus terhubung
o Region-region harus disjoint
o Kesepakatan antara property harus dipenuhi oleh pixel-pixel pada region
segmentasi. Contoh, P(Ri) = TRUE jika Ri memiliki level gray yang sama.
o Region Ri dan Rj berbeda
Region Growing
Region growing merupakan sebuah prosedur dimana sekumpulan pixel atau subregion
hingga region yang lebih besar berdasarkan criteria yang sudah didefinisikan
Pendekatan dasar misalnya sekumpulan titik awal dan dari sini region tumbuh dengan
menambahkan pada masing-masing benih ke pixel tetangga yang memiliki property
yang sama dengan benih tersebut.
Deskriptor bisa mendapatkan hasil yang salah jika keterhubungan dan informasi pixel
yang bersebelahan tidak digunakan dalam proses growing region. Contohnya
visualisasi sebuah susunan random pixel dengan hanya tiga nilai gray level yang jelas.
Mengelompokkan pixel dengan level gray yang sama pada sebuah region tanpa
memperhatikan konektivitas yang akan menghasilkan hasil segmentasi menjadi tidak
ada artinya
Permasalahan multimodal histogram baik jika diselesaikan menggunakan pendekatan
dasar region
Region Splitting and Merging
Selain mendiskusina grow region dari sekumpulan benih titik , alternative lainnya
dengan membagi sebuah gambar ke dalam bagian-bagian secara acak, region yang
tidak berhubungan satu sama lain, lalu merge dan/atau split region sehingga
memenuhi kondisi yang ditentukan.
Prosedurnya yaitu :
1. Split menjadi empat disjoint quadrants pada region Ri dimana P(Ri ) =
FALSE
2. Merge region yang bersebelahan Rj dan Rk dimana P(Ri U Rk) = TRUE
3. Stop ketika tidak mungkin ada lagi merge dan split
Properti yang berdasarkan mean dan standard deviasi dari pixel pada sebuah bidang
untuk menentukan texture dari sebuah region. Konsep texture segmentation
berdasarkan kegunaan ukuran textur untuk predikat P(Ri )
2.5. Segmentation by Morphological Watersheds
Segmentasi dengan watershed lebih menghasilkan segmentasi yang stabil, termasuk lanjutan
batasan segmentasi
Basic Concepts
Konsep watershed berdasarkan memvisualisasikan sebuah gambar pada tiga dimensi,
dua ruang koordinat versus level gray. Seperti sebuah interpretasi topographic, dapat
ditentukan tiga jenis titik :
a. titik yang termasuk sebuah regional minimum
b. titik pada sebuah jatuhan air, jika ditempatkan pada lokasi ini, akan menjadi
sebuah single minimum
c. titik dimana air akan seperti jatuh je lebih dari satu seperti minimum
Prinsip tujuan algoritma segmentasi berdasarkan konsep ini yaitu untuk mencari garis
batas air
Dam Construction
Pembuatan dam berdasarkan pada binary image. Cara paling sederhana untuk
membangun dam yaitu dengan cara memisahkan himpunan titik binary menggunakan
pembesaran morfologis seperti digambarkan di gambar 10.45.
Watershed Segmentation Algorithm
M1, M2,…., MR merupakan koordinat titik pada daerah minima dari image g(x,y).
C(Mi) adalah koordinat titik pada kolam penampungan yang berhubungan dengan
daerah minimum M. T[n] merupakan himpunan koordinat titik pada g(x,y) di bawah
plane g(x,y)=n.
T[n]{(s,t)|g(s,t)<n}
Cn(Mi) merupakan himpunan koordinat titik pada kolam penampungan yang
berhubungan dengan daerah minimum M dan meluap pada stage n.
C[n] adalah gabungan dari porsi kolam penampungan yang meluap pada stage n :
C[max + 1] adalah gabungan dari semua kolam penampungan :
Algoritma untuk menemukan watershed lines diinisialisasi dengan
C[min+1]=T[min+1]. Algoritma berulang-ulang dengan asumsi pada step n, C[n-1]
sudah dibuat. Procedure untuk mendapatkan C[n] dari C[n-1] tergantung pada 3
kondisi sebagai berikut untuk masing-masing connected component qÎQ[n] dimana Q
adalah himpunan dari connected component di T[n]:
o q Ç C[n-1] kosong
o q Ç C[n-1] berisi satu connected component dari C[n-1]
o q Ç C[n-1] berisi lebih dari satu connected component dari C[n-1]
kondisi (a) terjadi jika sebuah minimum baru ditemukan dimana q disatukan dengan
C[n-1] untuk membentuk C[n]. Kondisi (b) terjadi ketika q berada di dalam kolam
penampungan dari beberapa daerah minimum dimana q disatukan dengan C[n-1]
untuk membentuk C[n]. Kondisi (c) terjadi ketika semua atau bagian dari pemisah dua
atau lebih kolam penampungan ditemukan.
The Use of Marker
Aplikasi dari Watershed Segmentation Algorithm yaitu mengarah pada
oversegmentation yang berkaitan dengan noise dan ketidakteraturan gradient lainnya.
Pendekatan untuk mrngontrol oversegmentation berdasarkan pada konsep markers.
Marker adalah sebuah connected component dari image. Internal marker berhubungan
dengan objek kepentingan sedangkan external marker berhubungan dengan
background. Procedure pemilihan marker terdiri dari preprocessing dan penentuan
himpunan criteria yang harus dipenuhi marker. Sebagai gambaran bisa dilihat pada
gambar 10.47 dan 10.48.
The Use of Motion in Segmentation
Motion adalah isyarat yang sangat kuat yang digunakan oleh manusia dan binatang untuk
memisahkan objek perhatian dari detail yang tidak relevan.
Spatial Techniques BasicApproach
Pendekatan paling sederhana untuk mendeteksi perubahan dua image frame f(x,y,ti)
dan f(x,y,tj) pada waktu ti dan tj yaitu dengan membandingkan dua image per pixel
membentuk sebuah image yang berbeda. Perbedaan antara dua image pada waktu ti
dan tj yaitu:
T adalah threshold yang sudah ditentukan.
Accumulative differences
Accumulative difference image (ADI) dibuat dengan membandingkan reference
image dengan setiap image berikutnya yang berurutan. Reference image merupakan
sebuah urutan image frame , ,…, . ADI terdiri atas tiga
tipe yaitu : absolute, positive, dan negative ADI. Untuk K > 1 maka nilai ADI yaitu :
Dimana , , adalah absolute, positive, dan negative ADI.
Urutan inequalities dan tanda dari threshold pada persamaan (10.6-3) dan (10.6-4)
dibalik jika nilai tingkat keabuan dari pixel background lebih besar dari tingkat
pergerakan obyek.
Berdasarkan gambar di atas dapat disimpulkan bahwa: (1) nonzero area dari positive
ADI sama dengan ukuran pergerakan obyek. (2 lokasi positive ADI sesuai dengan
lokasi pergerakan obyek pada reference frame. (3) penghitungan pada positive ADI
berhenti ketika pergerakan obyek sudah dipindahkan semua sama seperti obyek pada
reference frame. (4) absolute ADI terdiri dari wilayah positive dan negative ADI. (5)
arah dan kecepatan dari pergerakan obyek bisa ditentukan dari entry pada absolute
dan negative ADI.
Establishing a reference image
Procedure untuk mendapatkan reference image yaitu menentukan image pertama
dalam urutan image untuk menjadi reference image. Ketika sebuah komponen
nonstationary sudah dipindahkan semua dari posisinya pada reference image,
background yang sesuai pada frame yang sekarang disalin pada lokasi yang ditempati
oleh objek pada reference frame. Reference image yang hanya berisi stationary
component didapatkan jika semua pergerakan obyek sudah dipindahkan semua dari
posisi aslinya. Gambar 10.50 menunjukkan dua frame gambar dari persimpangan lalu
lintas. Gambar pertama ditetapkan sebagai reference.
Frequency Domain Techniques
Pada bagian ini akan dibahas masalah penentuan estimasi pergerakan dengan Fourier
transform. Rumus Euler :
Untuk t = 0, 1,…, K-1; x = 0, 1,…,M-1; a1>=0 dan Dt adalah interval waktu antar
frame.
Untuk K digital image berukuran MxN, maka jumlah proyeksi ke x axis pada setiap
integer waktu adalah :
Sedangkan jumlah proyeksi ke y axis yaitu:
1-D Fourer Transform dari persamaan (10.6-6) dan (10.6-7) yaitu:
dan
Hubungan frequency-velocity yaitu :
Tanda dari x-component velocity didapatkan dari perhitungan :
Karena gx sinusoidal, bisa ditunjukkan bahwa S1x dan S2x akan mempunyai tanda
yang sama pada sembarang titik, jika componen velocity v1
positif.