Upload
hadieu
View
253
Download
1
Embed Size (px)
Citation preview
GUELMA UNIVERSITY
PI: MIS
International Conference on Signal, Image, Vision and their Applications SIVA'11
November 21-24, 2011, Guelma
Inverse Problems Modeling, Information and Systems Laboratory (PI: MIS)
Faculty of Sciences and Technology, Guelma University, Guelma 24000, Algeria
Laboratory
UNIVERSIT 8 MAI 45 GUELMAInternational Conference on Signal, Image,
Vision and their Applications SIVA'11 SIVA'11, November 21-24, 2011, Guelma Algeria
OrganizerInverse ProblemsModeling, Information and Systems Laboratory (PI: MIS)
Organizing CommitteePresident: Abdelhani BOUKROUCHEMembers:Smain SAHOUR, Abdelaziz YOUNSI, Houcine BOUROUBA, Moussa SEDRAOUI, M. Cherif AMARA KORBA,Hakim DOGHMANE, Nadjib BOUSSETILA, Salim BENDJOUDI, Mohamed NEMISSI, Houria BOUDOUDA,Djalel DRICI, El Hadi MEHALLEL, Lotfi HOUAM, Laatra YOUSFI, El Hadi MEHALLEL, Djalel DRICI, SorayaZENATI.
Scientific CommitteePresident: R. JENNANE (France)Members:H. A. ABBASSI (Algeria), A. ALMHDIE (France), M. C. AMARA KORBA (Algeria), A. BABOURI (Algeria), M. BEDDA(Saudi Arabia), M. Hedi BEDOUI (Tunisia), A. BENIA (Algeria), S. BOUAKEZ (France), M. S. BOUDELLIOUA (Oman), H.BOUDOUDA (Algeria), A. BOUKROUCHE (Algeria), H. BOUROUBA (Algeria), N. BOUSSETILA (Algeria), A. F. CHAREF(Algeria), N.E. DEBBACHE (Algeria), M. DERICHE (Saudi Arabia), R. DJIMILI (Algeria), N. DOGHMANE (Algeria), M. ELHASSOUNI (Morocco), M. F. HARKET (Algeria), A. HAFIANE (France), S. KECHIDA (Algeria), M. KHAMADJA (Algeria),Y. LAFIFI (Algeria), R. LAKEL (Algeria), R. LEDEE (France), Dj. MESSADEK (Algeria), A. MOUSSAOUI (Algeria), M. NE-MISSI (Algeria), Ph. NEVEUX (France), J. RAGOT (France), P. RAVIER (France), S. SAHOUR (Algeria), D. SBIBIH (Morocco),M. SEDRAOUI (Algeria), H. SISSAOUI (Algeria), Y. SMARA (Algeria), H. SERIDI (Algeria), A. TALEB-AHMED (France), H.TEBBIKH (Algeria), A. YOUNSI (Algeria), O. UCAN (Turkey).
UNIVERSIT 8 MAI 45 GUELMAInternational Conference on Signal, Image,
Vision and their Applications SIVA'11 SIVA'11, November 21-24, 2011, Guelma Algeria
OrganizerInverse ProblemsModeling, Information and Systems Laboratory(PI: MIS)
TopicsBiomedical Signal and Image ProcessingSignal Processing for Communications SystemsImage and Video ProcessingDesign and Implementation of Signal Processing SystemsBiometricsInverse ProblemTexture AnalysisSystem IdentificationImage Segmentation and CharacterizationModeling and SimulationPattern recognitionControl and Systems
Prefacepqpqpqpq
The first International Conference on Signal, Image, Vision and their applications was held duringNovember 21-24 at Guelma, Algeria. SIVA'11 is organized by Inverse Problems Modeling, Infor-mation and Systems Laboratory (PI: MIS) of Guelma and May 8th, 1945 University.
The main aim of the Conference is to bring together people concerned by the multiple aspects ofsignal, image and vision. A wide range of topics is addressed, including Biomedical Signal and ImageProcessing, Image and Video Processing, Biometrics, Texture Analysis, Image Segmentation andCharacterization, Pattern recognition, Signal Processing for Communications Systems, Design andImplementation of Signal Processing Systems, Inverse Problem, System Identification, Modelingand Simulation, Control and Systems.
The scientific committee ensured the high quality and diversity of the scientific programme togetherwith the accessibility of the meeting to PhD students. We hope that the abstract will be useful forthose who are interested in the various conference fields. We also hope you will find your timerewarding and enjoyable in Guelma.
BProf. Abdelhani BOUKROUCHEPI: MIS Laboratory
CONFERENCES
Conferences
UNIVERSIT 8 MAI 45 GUELMAInternational Conference on Signal, Image,
Vision and their Applications SIVA'11 SIVA'11, November 21-24, 2011, Guelma Algeria
OrganizerInverse ProblemsModeling, Information and Systems Laboratory(PI: MIS)
CONFERENCES
C Rachid JENNANE (Universit d'Orlans, France)
C Mohamed Salah BOUDELLIOUA (Sultan Qaboos University, Sultanate of Oman)
C Mohamed DERICHE (King Fahd University of Petroleum and Minerals, Saudi Arabia)
International Conference on Signal, Image, Vision and their Applications SIVA11, November 21-24, 2011, Guelma Algeria
FRACTIONAL BROWNIAN MOTION MODELS
FOR BIOMEDICAL APPLICATIONS
Rachid Jennane
PRISME Laboratory, Universit dOrlans, 12 rue de Blois BP 6744, 45067 Orlans, France.
Abstract Fractal analysis for the characterization of complex structures is widely used in many fields. In the case of biomedical applications, analysis includes geometric characterization of biologic forms and investigation of dynamic processes. Among the fractal models, fractional Brownian motion (fBm) is well suited for the evaluation of images involving a varying range of gray levels. This talk will focus on the use of the fBm for image analysis. Starting from fractional Brownian motion of unique parameter H, different stochastic models are defined and discussed. The fractal anisotropy is considered and different methods emphasising this feature will be presented. An application of these models to the field of biomedical imaging will be demonstrated through trabecular bone data in order to access the bone microarchitecture quality.
mailto:[email protected]International Conference on Signal, Image, Vision and their Applications SIVA11, November 21-24, 2011, Guelma Algeria
Reduction of Linear Multidimensional
Systems
Mohamed S. Boudellioua
Dept. of Mathematics and Statistics, Sultan Qaboos University, Muscat, Oman.
Member of the Inverse Problems Modelling, Information and Systems Laboratory PI: MIS, University of Guelma, Algeria
Abstract A multidimensional system is a system in which information propagates in more than one independent direction. Examples of multidimensional systems are delay-differential systems, partial-differential systems and multidimensional recursive systems. Multidimensional systems have diverse applications in areas such as image and video processing, geophysical exploration, linear multipass processes, iterative learning control systems, lumped and distributed networks etc. A multidimensional system may be represented by a multivariate polynomial matrix. Using a polynomial matrix approach we give a necessary and sufficient condition under which a multivariate polynomial matrix can be reduced by unimodular equivalence to a simpler form which corresponds to the case when the reduced system consists of only one single equation with fewer unknowns. The proposed constructive method is illustrated by an example appearing in the literature using symbolic computation.
mailto:[email protected]International Conference on Signal, Image, Vision and their Applications SIVA11, November 21-24, 2011, Guelma Algeria
Feature Selection for Classification:
Challenges and Opportunities
Mohamed Deriche
Electrical Engineering Department, King Fahd University of Petroleum & Minerals,
PO Box 1427, KFUPM, Dhahran, 31261 Saudi Arabia
Abstract The presentation will discuss the problem of feature selection in classification problems. We will discuss the different techniques used to select a limited number of features from a pool of features. Then, we will discuss filter and wrapper techniques, the cost of feature selection algorithms and give a number of examples from signal and image processing applications.
TALKS
Talks
Contents SIVA'11, November 21-24, 2011, Guelma Algeria
CONTENTS
Mansouri S., Mansouri A., Latreche S., P. 1-7Speech Signal Compression using Discrete Wavelets Transforms.
Hamadache F., Diffellah N., Benmahammed K., P. 8-13Identification des Systmes Linaires Constantes de Temps Proches et Diffrentes par les Mthodes de Strejc et Broida.
Hamadache F., Diffellah N., et Benmahammed K., P. 14-18Arithmtique Base d'Intervalles Sur les Profiles.
Meziane Tani S., Bessaid A., P. 19-21Techniques d'indexation d'images Mdicales par contenu.
Aouat S., Larabi S., P. 22-27Mise en correspondance des contours d'objets bruits.
Diffellah N., Hamadache F., Benmahammed K., P. 28-33Interval arithmetic and its application to electrical circuits.
Diffellah N., Hamadache F., Benmahammed K., Abbada Y., P. 34-39Similitude entre deux nombres flous triangulaires.
Dali A., Bouchoucha M., Tadjine M., P. 40-45On Quadrotor Modeling: Hybrid Dynamical System Approach.
Djemili R., Bourouba H., Amara Korba M.C., P. 46-49Speaker Identification Using GMMs and Gender Dependent Multi-Class Support Vector Machines.
FIZAZI H., TEKKOUK A., P. 50-55Segmentation des images satellitaires par le k means floue et le seuillage adaptatif.
Lamiche C., Moussaoui A., P. 56-61Data Fusion Approach for the Segmentation of MR Images: A Study and an Evaluation.
Boujraf A., Sbibih D., et Leger C., P. 62-65Approximation des surfaces fermes. Kazem A., Hamza A., Salut G., P. 66-69Optimization of Particle Algorithm to Multiuser Detection in CDMA.
Sid Z., Aoufi L., Semchedine M., P. 70-72Nouvelle Approche de filtrage Non-linaire d'Images Numriques.
Menezia F., Meliani R., Mahdjoub Z. Moulay Lakhdar A., P. 73-78L'augmentation des performances d'un turbo-code dans son approche pragmatique.
Nemissi M., Seridi H., Boudouda H., Akdag H., P. 79-84Improving classification performances of the systems of multiple neural networks.
Amara Korba M.C., Bourouba H., Djemili R., Messadeg D., P. 85-88Robust Feature Extraction for Speech Recognition.
i
Contents SIVA'11, November 21-24, 2011, Guelma Algeria Behih M., Bekka R. E., Annou A., Djebari M., P. 89-93Stimulation Magntique d'un Axone d'un Nerf Priphrique l'aide d'une Nouvelle Bobine.
Assabaa M., Charef A., Ladaci S., Santouh Z., P. 94-99Tuning of PID Controllers Based on Bode's Ideal Transfer Function Using Fractional Calculus.
Tahi W., M.C. Mokrani K., P. 100-104La Sparation Aveugle de Sources.
Amrous A. I., Debyeche M., P. 105-109Robust Arabic speech recognition with auxiliary information in noisy environments.
Bourdjam O., Tighidet, Mehenni M ., Adggar D., P. 110-115Conception et Ralisation d'un Systme HOLTER d'enregistrement et d'analyse d'ECG.
Houam L., Hafiane A., Jennane R., Boukrouche A., Lespessailles E., Bands P. 116-121Trabecular Bone Texture Classification Using 1D LBP and Wavelet Coefficients in High-pass.
Gheraibia Y., Moussaoui A., P. 122-126Nouvelle Mthode pour la Prdiction des Structures 2D des Protines.
Belkhodja L., Hamdadou D., P. 127-132Vers l'aide au diagnostic mdical Ajustement des paires bilatrales de mammographies par algorithme Gntique.
Alim-Ferhat F., Kerdjidj O., Seddiki S., Messaoudi K., P. 133-138Implmentation de la transforme en ondelettes pour les images mdicales 3D sur FPGA.
Aggoune A., P. 139-144Approximate Flexible Queries Using Hausdorff Distance.
Halimouche R., Teffahi H., P. 145-148Vers une Mthode de Classification Automatique de Phrases Interrogatives et Affirmatives.
Bensafia Y., Ladaci S., P. 149-151Elimination du bruit dans une conduite d'aration en utilisant les filtres adaptatifs.
Meftah E.H., Anou A., Bensebti M., P. 152-157Etude de la technique OFDM-IDMA sur un canal surcharg en utilisateur.
Boukeffa S., Bouguelala A., P. 158-160Sidelobe Mitigation Using NLFM Waveforms For SAR Imaging.
Ouahioune M., Akrour L., Lahdir M., Ameur S., P. 161-166Compression d'images hyperspectrales par transforme en ondelettes 3D et SPIHT3D.
Bekaddour A., Bessaid A., Bendimerad F. T., P. 167-170SVM Regularization of Satellite Images K-MEANS Clustering Results.
Belgherbi A., Hadjidj I., Bessaid A., P. 171-175Segmentation automatique du Foie par la morphologie mathmatique, application l'imagerie mdicale TDM del'abdomen.
Bennamane A., Boutkedjirt T., P. 176-181Simulation et analyse d'images chographiques d'un tissue biologique mou.
ii
Contents SIVA'11, November 21-24, 2011, Guelma Algeria Lacheb Cheddadi A., Smara Y., P. 182-186Simulation d'images radar SAR.
Ajgou R., Sbaa S., Ghendir S., Taleb-Ahmed A., P. 187-192Dtection du pitch par un seuil adaptatif et en temps rel par les ondelettes discrtes.
Benyamina A., Fizazi H., P. 193-198Efficacit de l'algorithme hybride ACOClust pour le partitionnement des images satellitaires.
Elloumi W., Leconge R., Treuillet S., P. 199-204Pedestrian Localization: Literature Review and Illustration of a Monocular Vision Based Approach.
Harrar K., Hamami L., Jennane R., P. 205-208Fractal Analysis of Bone Radiographs Correlated with Histomorphometry.
Almhdie-Imjabber A., Rozenbaum O., Lespessailles E., Jennane R., P. 209-213A New local shape classification method for trabecular bone characterization.
Khader M., Seridi H., P. 214-219Face Detection Using Practical Swarm Optimization and Template Matching.
Benmazou S.,Layachi S., Merouani Hayet F., P. 220-223Automate cellulaire SMA pour la segmentation des images IRM. Mihoubi B., Souag N., Amrane Y., P. 224-229Estimation par la courbure du mouvement cardiaque sur des images Cin-IRM.
Akkoul S., Leconge R., Hafiane A., Lespessailles E., Jennane R., P. 230-233Stereo X-ray Reconstruction of the Proximal Femur.
Bachir R., Bouyadja, Khelfi M. F., P. 234-239Commande robuste par approche optimale d'un robot manipulateur 3 d.d.l.
Larbi Omar, P. 240-245Le Clustering Appliqu aux Traces des Utilisateurs dans une Plateforme E-learning.
Mehallel E. H., Boukrouche A., P. 246-250Spectral Analysis of UWB Signal based on Modulation and Multiple Access Scheme.
Mehallel E. H Drici Dj., Boukrouche A., P. 251-256Image Restoration with Total Variation Regularization.
Bourouba H., Amara Korba M. C., Djemili R., P. 257-261L'utilisation des machines vecteurs de support SVM pour l'identification du locuteur.
Meziani F., Debbal S. M., P. 262-266Application de La transforme en Ondelettes Discrte (TOD) dans L'analyse des Signaux Phonocardiogrammes.
Almhdie-Imjabber A., Deriche M., Aburrhman A., B., Lger C., P. 267-271Local comparison of multimodal medical surfaces using a compound registration-reconstruction algorithm.
Farou B., Seridi H., P. 272-276Systme de dtection et de suivi des objets en mouvement dans une vido de surveillance.
Chakour C., Ayech N., Harkat M. F., P. 277-283Diagnostic des systmes dynamiques en temps rel par MSPCA.
iii
Contents SIVA'11, November 21-24, 2011, Guelma Algeria Lakhfif A., Laski M. T., P. 284-289Un outil visuel bas sur la ralit virtuelle pour la gnration d'noncs en langue des signes.
Doghmane H., Boukrouche A., P. 290-294Rgularisation d'un problme mal pos des images omnidirectionnelles.
Atbi A., Debbal S.M., P. 295-299Segmentation des Signaux Phonocardiogrammes par l'Enveloppe de la Transforme de Hilbert.
Sedraoui M.,, Gherbi S.,, Abdelmalek S., P. 300-305Synthse d'un Contrleur Fractionnaire par l'Algorithme d'Essaim Particulaire.
Ayech N., Chakour C., Harkat M-F., P. 306-312New Adaptive Moving Window PCA for Process Monitoring.
Messaoudi F., Benyettou M., P. 313-318Identification Biomtrique par Fusion Multimodale du Visage et de la Dmarche.
Baadeche M., Smara Y., Dtection des Structures Linaires sur des Images RADAR SAR . P. 319-322 Fizazi H., Benmostefa S., P. 323-327Conception de la technique des chauves-souris pour la classification des images.
Kellalib B., Bouchoucha M., P. 328-333Vol en formation d'un groupe de Quadrotors base sur la technique de commande cooprative L et les saturationsimbriques.
Nasri N., Mokrani K., P. 334-339Classification floue par considration du contexte Spatial. Application aux images IRM du cerveau.
Gherbi S., Sedraoui M., P. 340-343Rglage optimal d'un contrleur bas sur le principe de Smith Predictor.
Bouagar S., Larabi S., P. 344-348Une Approche Globale pour la Reprsentation et la Mise en Correspondance d'Objets de Forme Libre.
Atoui I., Omeiri A., Bouraiou A., P. 349-354Application de l'Analyse en Ondelettes au Diagnostic de Dfauts d'une Machine Asynchrone.
Hameg S., Ameur Z., Lazri M., Ouallouche F., P. 355-357Estimation des prcipitations par une approche base sur la dure de vie des nuages sommets froids.
Fizazi Izabatene H., Ghardaoui S., P. 358-363Les mouches systme multi agents volutionnaire classification non supervise des images.
Boulemden A., Tlili Y., P. 364-367Pachinko Allocation Model with Local Features for Image Indexing and Retrieval.
Boudiaf A., Moussaoui A. KSeddiki. S. E. A., P. 368-371Condition Monitoring of Rotating Machines Using Artificial Neural Networks and Wavelet Transform.
Berradja K., Boughanmi N., P. 372-375Blind Separation of Cardiac Structures from Dynamic PET images using Markov Chain Monte Carlo sampling.
iv
International Conference on Signal, Image, Vision and their Applications SIVA11, November 21-24, 2011, Guelma Algeria
Speech Signal Compression using Discrete
Wavelets Transforms.
MANSOURI Sihem, MANSOURI Abdelhamid, LATRECHE Sadjia
Departement of electronics, Ferhat Abbas University, Setif, Algeria.
Elmaabouda city. BP 19000. SETIF.
E-mail : [email protected]
ABSTRACSpeech compression is the technology of converting human speech into an efficiently encoded representation that can
later be decoded to produce a close approximation of the original
signal. This thesis presents a new algorithm to compress speech
signals using Discrete Wavelet Transform (DWT) Techniques.
Wavelet analysis is the breaking up of a signal into a set of scaled
and translated versions of an original (or mother) wavelet.
Taking the wavelet transform of a signal decomposes the original
signal into wavelets coefficients at different scales and positions.
These coefficients represent the signal in the wavelet domain and
all data operations can be performed using just the
corresponding wavelet coefficients.
In this paper a Wavelet based speech coder is implemented in
software using Matlab 7.4 Wavelet Toolbox. The major issues
concerning the design of this Wavelet based speech coder are
choosing optimal wavelets for speech signals, decomposition level
in the
DWT, thresholding criteria for coefficient truncation and
efficient encoding of truncated coefficients.
KEY WORDS Compression, Filter-Bank , Speech, Wavelet.
I. INTRODUCTION
PEECH is a very basic way for humans to convey
information to one another. With a bandwidth of only 4
kHz, speech can convey information with the emotion of a
human voice. People want to be able to hear someones voice
from anywhere in the world-as if the person would be in the
same room. Speech can be defined such as the response of the
vocal tract to one or more excitation signals. Compression of signals is based on removing the redundancy
between neighboring samples and/or between the adjacent
cycles. In data compression, it is desired to represent data by
as small as possible number of coefficients within an
acceptable loss of visual quality. Compression techniques can
be classified into one of two main categories: lossless and
lossy.
Compression methods can be classified into three functional
categories:
Direct Methods: The samples of the signal are directly handled to provide compression.
Transformation Methods: such as Fourier Transform (FT), Wavelet Transform (WT), and Discrete Cosine
Transform (DCT) .
Parameter Extraction Methods: A preprocessor is employed to extract some features that are later used to
reconstruct the signal.
Fast Fourier transforms (FFT) have been among major tools
for compression and efficient coding of signals.
Particularly, the discrete cosine transform (DCT) based
compression algorithms have become industry standard still
and video image compression systems (JPEG, MPEG). The
ability of wavelets to outperform traditional orthogonal bases
in the mentioned systems is being extensively explored nowadays.
Wavelet compression is a form of predictive compression
where the amount of noise in the data set can be estimated
relative to the predictive function. Most modern compression
techniques use a two step process: First, a predictive
compression function (such as wavelet transform) is applied.
If the choice of the predictive compression function is good,
the result will be a new set of data with smaller values and
more repletion. Second, a coding compression step that will
represent the data set in its minimal form (Huffman coding,
run-length). The compression of speech signals has many practical
applications. One example is in digital cellular technology
where many users share the same frequency bandwidth.
Compression allows more users to the system than otherwise
possible.
This paper presents a speech coder model that is based on
wavelet transform. The paper uses the discrete wavelet
transform to model speech signals. This model is implemented
using MATLAB.
II. THE DISCRETE WAVELET TRANSFORM
The main idea is the same as is in the continuous wavelet
transform (CWT). A time-scale representation of a digital
signal is obtained using digital filtering techniques.
The CWT was computed by changing the scale of the analysis
window, shifting the window in time, multiplying by the
signal, and integrating over all times. The Discrete Wavelet
Transform (DWT) involves choosing scales and positions
based on powers of two. so called dyadic scales and positions.
The mother wavelet is rescaled ordilated by powers of two and translated by integers.
S
1
Specifically, a function f(t) L2(R) (defines space of square integral functions) can be represented as
= , 2 + , (2
=
=
=1
)
The function (t) is known as the mother wavelet, while (t)
is known as the scaling function. The set of functions { 2
( 2L t k ), 2( 2 j t k )| j L, j,k ,LZ}, where Z is the set of integers, is an orthonormal basis for L2(R).
The numbers a(L, k) are known as the approximation coefficients at scale L, while d(j,k) are known as the detail
coefficients at scale j. )The approximation and detail
coefficients can be expressed
The approximation and detail coefficients can be expressed as:
, =1
2 2
, =1
2 2
To provide some understanding of the above coefficients consider a projection fl(t) of the function f(t) that provides the
best approximation (in the sense of minimum error energy) to
f(t) at a scale l. This projection can be constructed from the
coefficients a(L, k), using the equation:
= , (2 )
=
As the scale l decreases, the approximation becomes finer,
converging to f(t) as l 0. The difference between the approximation at scale l + 1 and
that at l, fl+1(t) - fl(t), is completely described by the
coefficients d(j, k) using the equation:
+1 = , (2 )
=
Using these relations, given a(L, k) and {d(j, k) | j L}, it is
clear that we can build the approximation at any scale. Hence,
the wavelet transform breaks the signal up into a coarse
approximation fL(t) (given a(L, k)) and a
number of layers of detail { f j+1(t)-fj(t)| j < L} (given by {d(j,
k) | j L}). As each layer of detail is added, the approximation
at the next finer scale is achieved.
2.1 Vanishing Moments
The number of vanishing moments of a wavelet indicates
the smoothness of the wavelet function as well as the flatness
of the frequency response of the wavelet filters (filters used to
compute the DWT) [7].
Typically a wavelet with p vanishing moments satisfies the
following equation [6]:
t dt
for m=0,., p-1,
Or equivalently,
1 = 0 = 0, , 1.
For the representation of smooth signals, a higher number of
vanishing moments leads to a faster decay rate of wavelet
coefficients. Thus, wavelets with a high number of vanishing
moments lead to a more compact signal representation and are
hence useful in coding applications.
However, in general, the length of the filters increases with the
number of vanishing moments and the complexity of
computing the DWT coefficients increases with the size of the
wavelet filters.
2.2 The Fast Wavelet Transform Algorithm
The Discrete Wavelet Transform (DWT) coefficients can be
computed by using Mallat.s Fast Wavelet Transform
algorithm. This algorithm is sometimes referred to as the two-
channel sub-band coder and involves filtering the input signal
based on the wavelet function used.
2.2.1 Implementation Using Filters
To explain the implementation of the Fast Wavelet Transform
algorithm consider the following equations:
() = (2 )
= 1
1 (2 )
2 = 20,
The first equation is known as the twin-scale relation (or the
dilation equation) and defines the scaling function . The next
equation expresses the wavelet in terms of the scaling
function . The third equation is the condition required for the
wavelet to be orthogonal to the scaling function and its
translates.
The coefficients c(k) or {c0, .., c2N-1} in the above equations
represent the impulse response coefficients for a low pass
filter of length 2N, with a sum of 1 and a norm of 1 2 . The high pass filter is obtained from the low pass filter using
the relationship gk =(1)k c(1k) , where k varies over the
range (1 - (2N-1)) to 1.
Equation 2.7 shows that the scaling function is essentially a
low pass filter and is used to define the approximations. The
wavelet function defined by equation 2.8 is a high pass filter
and defines the details.
Starting with a discrete input signal vector s, the first stage of
the FWT algorithm decomposes the signal into two sets of
coefficients. These are the approximation coefficients cA1
2
(low frequency information) and the detail coefficients cD1
(high frequency information), as shown in the figure below.
Fig.1: Filtering operation of the DWT [15].
The coefficient vectors are obtained by convolving s with the
low-pass filter Lo_D for approximation and with the high-pass
filter Hi_D for details. This filtering operation is then followed
by dyadic decimation or down sampling by a factor of 2.
Mathematically the two-channel filtering of the discrete signal s is represented by the expressions:
1 = 2 , 1 = 2
These equations implement a convolution plus down sampling
by a factor 2 and give the forward fast wavelet transform.
If the length of each filter is equal to 2N and the length of the
original signal s is equal to n, then the corresponding lengths
of the coefficients cA1 and cD1 are given by the formula:
1
2 +
This shows that the total length of the wavelet coefficients is
always slightly greater than the length of the original signal
due to the filtering process used.
2.2.2 Multilevel Decomposition
The decomposition process can be iterated, with successive
approximations being decomposed in turn, so that one signal
is broken down into many lower resolution components. This
is called the wavelet decomposition tree.
Fig.2: Decomposition of DWT coefficients
The wavelet decomposition of the signal s analysed at level j
has the following structure [cAj, cDj, ..., cD1].
Looking at a signals wavelet decomposition tree can reveal
valuable information. The diagram below shows the wavelet
decomposition to level 3 of a sample signal S.
Fig.3: Level 3 Decomposition of Sample Signal S [5]
Since the analysis process is iterative, in theory it can be
continued indefinitely. In reality, the decomposition can only
proceed until the vector consists of a single sample.
Normally, however there is little or no advantage gained in
decomposing a signal beyond a certain level. The selection of
the optimal decomposition level in the hierarchy depends on
the nature of the signal being analysed or some other suitable
criterion, such as the low-pass filter cut-off.
III. WAVELET SPEECH COMPRESSION TECHNIQUES
The idea behind signal compression using wavelets is
primarily linked to the relative scarceness of the wavelet
domain representation for the signal. Wavelets concentrate
speech information (energy and perception) into a few
neighboring coefficients [7]. Therefore as a result of taking
the wavelet transform of a signal, many coefficients will
either be zeros or have negligible magnitudes. Data
compression is then achieved by treating small valued
coefficients as insignificant data and thus discarding them. The process of compressing a speech signal using wavelets
involves a number of different stages, each of which are
discussed below.
A. Choice of Wavelet
The choice of the mother-wavelet function used in designing
high quality speech coders is of prime importance. Choosing a
wavelet that has compact support in both time and frequency in addition to a significant number
of vanishing moments is essential for an optimum wavelet
speech compressor.
Several different criteria can be used in selecting an optimal
wavelet function. The objective is to minimize reconstructed
error variance and maximize signal to noise ratio (SNR). In
general optimum wavelets can be selected based on the energy
conservation properties in the approximation part of the
wavelet coefficients.
In [1] it was shown that the Battle-Lemarie wavelet
concentrates more than 97.5% of the signal energy in the
approximation part of the coefficients. This is followed very closely by the Daubechies D20, D12, D10 or D8 wavelets, all
concentrating more than 96% of the signal energy in the Level
1 approximation coefficients.
Wavelets with more vanishing moments provide better
reconstruction quality, as they introduce less distortion into the
processed speech and concentrate more signal energy in a few
3
neighboring coefficients. However the computational
complexity of the DWT increases with the number of
vanishing moments and hence, for real time applications it is
not practical to use wavelets with an arbitrarily high number
of vanishing moments [8].
B. Wavelet decomposition
Wavelets work by decomposing a signal into different
resolutions or frequency bands, and choosing the wavelet
function and computing the Discrete Wavelet Transform
(DWT) carries out this task [2]. Signal compression is based
on the concept that selecting a small number of approximation
coefficients (at a suitably chosen level) and some of the detail
coefficients can accurately represent regular signal
components. Choosing a decomposition level for the DWT usually depends
on the type of signal being analyzed or some other suitable
criterion such as entropy. For the processing of speech signals
decomposition up to scale 5 is adequate [1], with no further
advantage gained in processing beyond scale 5.
C. Truncation of coefficients
After calculating the wavelet transform of the speech signal, compression involves truncating wavelet coefficients below a
threshold. An experiment conducted on a male spoken
sentence [4], shows that most of the coefficients have small
magnitudes. More than 90% of the wavelet coefficients have
less than 5% of the maximum value.
This means that most of the speech energy is in the high-
valued coefficients, which are few [4]. Thus the small valued
coefficients can be truncated or zeroed and then be used to
reconstruct the signal. This compression scheme provided a
segmental signal-to-noise ratio (SEGSNR) of 20 dB, with only
10% of the coefficients.
Two different approaches are available for calculating thresholds. The first, known as Global Thresholding involves
taking the wavelet expansion of the signal and keeping the
largest absolute value coefficients. In this case you can
manually set a global threshold, a compression performance or
a relative square norm recovery performance. Thus only a
single parameter needs to be selected.
The second approach known as By Level Thresholding
consists of applying visually determined level dependent
thresholds to each decomposition level in the wavelet
transform.
D. Encoding coefficients
Signal compression is achieved by first truncating small-
valued coefficients and then efficiently encoding them. One
way of representing the high-magnitude coefficients is to store
the coefficients along with their respective positions in the
wavelet transform vector [2].
Another approach to compression is to encode consecutive
zero valued coefficient [4], with two bytes. One byte to
indicate a sequence of zeros in the wavelet transforms vector
and the second byte representing the number of consecutive
zeros.
For further data compactness a suitable bit-encoding format,
can be used to quantize and transmit the data at low bit rates.
A low bit rate representation can be achieved by using an
entropy coder like Huffman coding or arithmetic coding.
IV. IMPLEMENTATION AND RESULTS
The design of the wavelet transform speech coder is based on
the concepts covered in the Wavelet Speech Compression
Techniques. Figure (4) below illustrates the different
processes involved in coding speech signals using wavelets.
The MATLABs Wavelet Toolbox incorporates many
different wavelet families, from the Wavelet Speech
Compression Techniques. It was decided to use the Haar and
Daubechies wavelets for coding speech signals.
We introduce the wavelet-based speech coder, as some functions (i.e. Compress, Decompress, Encode, Decode,
Pefcal, Playingsound, Results and Plotresult ) which are
mainly called from the function Main.
A. Calculating Thresholds
For the truncation of small-valued transform coefficients, two
different thresholding techniques are used, Global
Thresholding and By-Level Thresholding.
The aim of Global Thresholding is to retain the largest
absolute value coefficients, regardless of the scale in the
wavelet decomposition tree. Global thresholds are calculated
by setting the % of coefficients to be truncated. Level dependent thresholds are calculated using the Birge-Massart
strategy [3]. This thresholding scheme is based on an
approximation result from Birge and Massart and is well
suited for signal compression.
Fig.4: Design Flow of Wavelet Based Speech Coder.
B. Encoding Zero-Valued coefficients
After zeroing wavelet coefficients with negligible values
based on either calculating threshold values or simply
selecting a truncation percentage, the transform vector needs
to be compressed. In this implementation, consecutive zero valued coefficients are encoded with two bytes. One byte is
4
used to specify a starting string of zeros and the second byte
keeps track of the number of successive zeros.
Due to the scarcity of the wavelet representation of the speech
signal, this encoding method leads to a higher compression
ratio than storing the non-zero coefficients along with their
respective positions in the wavelet transform vector, as suggested in the Wavelet Speech Compression Techniques .
This encoding scheme is the primary means of achieving
signal compression.
C. Performance Measurement Tools
A number of quantitative parameters can be used to evaluate
the performance of the coder, in terms of reconstructed signal
quality after compression scores. The following parameters
are compared:
Signal to Noise Ratio (SNR), Peak Signal to Noise Ratio (PSNR), Normalized Root Mean Square Error (NRMSE), Retained Signal Energy(RSE), Compression Ratios (CR).
The results obtained for the above quantities are calculated
using the following formulas:
SIGNAL TO NOISE RATIO (SNR)
= 10 10
2
2
2
is the mean square of the speech signal and 2
is the
mean square difference between the original and reconstructed
signals.
PEAK SIGNAL TO NOISE RATIO (PSNR)
PNSR = 10 log10 NX 2
xr 2
N is the length of the reconstructed signal, X is the maximum
absolute square value of the signal x and || x-r||2 is the energy
of the difference between the original and reconstructed
signals.
NORMALIZED ROOT MEAN SQUARE ERROR (NRMSE)
NRMSE = ( )2
( )2
x(n) is the speech signal, r(n) is the reconstructed signal, and
x(n) is the mean of the speech signal.
RETAINED SIGNAL ENERGY (RSE)
% = () 2
() 2 100
||x(n)|| is the norm of the original signal and ||r(n)|| is the norm
of the reconstructed signal.
COMPRESSION RATIO (CR)
=( )
( )
x(n) is the original signal and r(n) is the reconstructed signal.
V. RESULTS AND DISCUSSION
A. Performance of Recorded Speech Coding
A male and female spoken speech signals were
decomposed at scale 3 and level dependent thresholds were
applied using the Birge-Massart strategy.
Since the speech files were of short duration, the entire signal
was decomposed at once without framing. A summary of the
performance is given below for the different wavelets used.
a) A Male Speech Signal Decomposed at Different type of wavelets
Wavelet Zeros(%) RSE(%) SNR PSNR NRMSE
Haar 79.2184 93.3054 11.7428 92.7803 0.2587
Db4 79.0749 97.8056 16.5870 97.6245 0.1481
Db6 79.0609 97.9450 16.8722 97.9098 0.1433
Db8 79.0381 98.0706 17.1463 98.1838 0.1389
Db10 79.0118 98.2008 17.4502 98.4877 0.1341
b) Female Speech Signal Decomposed at Different type of wavelets
Wavelet Zeros(%) RSE(%) SNR PSNR NRMSE
Haar 79.1756 90.2214 10.0972 91.9450 0.3127
Db4 79.0771 95.4705 13.5870 95.2864 0.2128
Db6 79.0560 95.9561 13.8722 95.7948 0.2007
Db8 79.0386 96.2727 14.2463 96.1318 0.1931
Db10 79.0111 96.3477 14.3566 96.2324 0.1909
c) Compression scores
Wavelet Male Female
Haar 3.5438 3.4658
Db4 3.7742 3.5657
Db6 3.8220 3.5988
Db8 3.8250 3.6352
Db10 3.8753 3.6446
Table 1: a), b), c): Performance of Recorded Speech
Compression
B. Performance of Real Time Speech Coding
In this section the same speech files were used, except the
signals were divided into frames of length 20ms to simulate
real time coding. Each frame was then decomposed, truncated
and compressed. A level 5, wavelet decomposition was
applied along with global thresholds of close to 78-79% to
enable comparisons with the previous results. A summary of
the performance is given below for the different wavelets
used. a) Male Speech Signal Decomposed at Different type of wavelets
Wavelet Zeros(%) RSE(%) SNR PSNR NRMSE
Haar 78.8175 83.6181 9.1507 90.1882 0.3487
Db4 78.9216 89.4932 10.7339 91.8503 0.2852
Db6 78.7505 88.6178 11.0929 91.9448 0.2852
Db8 78.3683 88.4611 9.7060 90.8218 0.3242
Db10 77.9373 88.4156 9.6944 90.9158 0.3207
5
b) Female Speech Signal Decomposed at Different type of wavelets
Wavelet Zeros(%) RSE(%) SNR PSNR NRMSE
Haar 78.8531 85.7896 8.2749 90.1227 0.3857
Db4 79.0593 92.2694 10.5569 92.3711 0.2977
Db6 79.0560 92.2768 10.7596 92.5368 0.2921
Db8 78.9169 89.8339 8.5702 90.3742 0.3747
Db10 78.4119 88.8729 8.1457 90.1153 0.3860
c) Compressions scores
Wavelet Male Female
Haar 2.3152 2.2919
Db4 2.1076 2.1765
Db6 1.9757 1.9544
Db8 1.7834 1.8182
Db10 1.6393 1.6588
Table 2: a), b), c): Performance of Real Time Speech
Compression
Thus using a wavelet with a large no of vanishing moments
will start to deteriorate the performance of a real time speech
coder after a certain filter length. From table 2, the
Db6 wavelet gives better performance than all the other
wavelets tested. Thus for real time speech coding using
wavelets it is important to choose a wavelet function with less
vanishing moments and also a reasonable decomposition
level.
C. Varying Truncation % vs. Performance
To see the effects of varying the truncation percentage on the
reconstructed signal quality, a male spoken speech signal was
decomposed at level 5, using the Db10 wavelet. Figure 5
shows the percentage of samples with a certain threshold value
in he wavelet decomposition. From this figure it can be seen
that most of the coefficients have small magnitudes. Figures 6-
8 show trends in the quality of a signal as a function of the truncation percentage. Hence a signal of a certain quality can
be reconstructed, by choosing the appropriate threshold.
Fig.5 : Truncation % vs. Threshold
Fig.6: SNR vs. % Truncation
Fig.7: PSNR vs. % Truncation
Fig. 8: NRMSE vs. % Truncation
VI. CONCLUSIONS
Speech coding is currently an active topic for research in
the areas of Very Large Scale Integrated (VLSI) circuit
technologies and Digital Signal Processing (DSP). The
Discrete Wavelet Transform performs very well in the
compression of recorded speech signals. For real time speech
processing however, its performance is not as good.
Therefore for real time speech coding it is recommended to use a wavelet with a small number of vanishing moments at
level 5 decomposition or less. The wavelet based compression
software designed reaches a signal to noise ratio of 17.45 db
at a compression ratio of 3.88 using the Daubechies 10
wavelet.
The performance of the wavelet scheme in terms of
compression scores and signal quality is comparable with
other good techniques such as code excited linear predictive
6
coding (CELP) for speech, with much less computational
burden. In addition, using wavelets the compression ratio can
be easily varied, while most other compression techniques
have fixed compression ratios.
VII. REFERENCES
[1] Agbinya, J.I. Discrete Wavelet Transform Techniques in Speech
Processing, IEEE Tencon Digital Signal Processing Applications
Proceedings, IEEE, New York, NY, 1996, pp 514-519.
[2] Fgee, E.B., Phillips, W.J. and Robertson, W. Comparing Audio Compression using Wavelets with other Audio Compression
Schemes, IEEE Canadian Conference on Electrical and Computer
Engineering, IEEE, Edmonton, Canada, 1999, pp. 698-701.
[3] Misiti, M., Misiti, Y., Oppenheim G. and Poggi, J. Wavelet Toolbox Users Guide, Mathworks, 1997.
[4] Kinsner, W. and Langi, A. Speech and Image Signal Compression with Wavelets, IEEE Wescanex Conference Proceedings, IEEE, New York, NY,
1993, pp. 368-375.
[5] M. Misiti, Y. Misiti, G. Oppenheim and J. Poggi, Matlab Wavelet Tool Box, The Math Works Inc., 2000.
[6] J. Ooi and V. Viswanathan, Applications of Wavelets to Speech
Processing,. Modern Methods of Speech Processing, R.P. Ramachandran and
R. Mammone, ed., Kluwer Academic Publishers, Boston, 1995, pp. 449-464.
[7] V. Viswanathan, W. Anderson, J. Rowlands, M. Ali and A. Tewfik, .Real-Time Implementation of a Wavelet-Based Audio Coder on the T1
TMS320C31 DSP Chip,. 5th International Conference on Signal Processing
Applications & Technology (ICSPAT), Dallas, TX, Oct. 1994.
[8] A. Gersho, .Speech Coding,. Digital Speech Processing, A.N. Ince, ed.,
Kluwer Academic Publishers, Boston, 1992, pp. 73-100.
7
International Conference on Signal, Image, Vision and their Applications SIVA11, November 21-24, 2011, Guelma Algeria
AbstractLobjectif de ce travail est danalyser lidentification
paramtrique de systmes dynamiques linaires par les deux
mthodes didentification connus mthode de Strejc et mthode
de Broida pour les systmes avec des constantes de temps assez
proches et des systmes avec des constantes de temps trs
diffrentes pour une ventuelle comparaison.
Index Terms Broida, Identification , Strejc, , Systmes
dynamiques.
I. INTRODUCTION
N systme linaire a une fonction de transfert qui peut se
calculer en tablissant les quations diffrentielles qui
relient entre et sortie. Ces quations thoriques sont parfois
difficiles crire car on na pas forcement toute la
connaissance du systme ncessaire.
Souvent, un modle dont le comportement ressemble a celui
du systme tudier est suffisant pour laborer une loi de
commande adapte. On prsente deux mthodes celle de Strejc
et Broida pour obtenir un modle sous forme de fonction de
transfert quivalente en terme de rponse un systme dont on
ne sait pas modliser le comportement [1] , [2], [3].
II. IDENTIFICATION
Identifier un systme, cest rechercher partir
dexpriences sur celui-ci, un modle mathmatique dont le
comportement dynamique soit le plus voisin possible de celui
du systme.
Lidentification dun processus ncessite lenregistrement
pralable de sa rponse. Celle-ci peut tre une rponse
indicielle (modlisation temporelle) ou la rponse signal
contenu spectral plus dense (bruit analogique ou binaire)
permettant aprs transformation de Fourier de modliser la
rponse frquentielle du processus.
A. Identification dans le domaine temporel
Cette technique consiste attaquer le systme par un
chelon damplitude donne et sintresser par la suite
lvolution dans le temps de sa sortie. . On compare ensuite la
rponse obtenue avec une fonction de transfert normalise. Il
faut donc utiliser une mthode didentification ne demandant
aucune connaissance pralable si ce nest lenregistrement de
la rponse indicielle. Le modle que lon obtiendra alors sera
un modle de reprsentation qui peut navoir aucune
correspondance physique avec le systme considr. Mais, si
lidentification est bonne, les rponses indicielles et/ou
frquentielle seront aussi proches que possible de celles du
systme tudi.
a. Mthode de Strejc
Pour les systmes apriodiques dordre deux et plus, il est
difficile destimer lordre du systme avant de lavoir
identifi. On peut choisir de le modliser par une fonction de
transfert de la forme :
nTp
prTKpE
pSpT
1
)exp(
)(
)()( (1)
Les paramtres identifier sont donc :
le gain statique K,
le retard , la constante de temps et lordre n.
La rponse indicielle dun tel modle est reprsente
comme suit :
Partant de la rponse indicielle thorique dun systme
dordre sans retard pur, Strejc a calcul les temps caractristiques Tu et Ta. Ces rsultats ont t reports dans le
tableau suivant :
Identification des Systmes Linaires
Constantes de Temps Proches et Diffrentes par
les Mthodes de Strejc et Broida
F. HAMADACHE, N. DIFFELLAH, et K. BENMAHAMMED
U
8
International Conference on Signal, Image, Vision and their Applications SIVA11, November 21-24, 2011, Guelma Algeria
Table.1 Tableau des paramtres de Strejc
()
=
=
1 0 0 5.00
2 0.26 0.104 0.368
3 0.32 0.218 0.271
4 0.35 0.319 0.224
5 0.37 0.410 0.195
6 0.38 0.493 0.175
7 0.39 0.570 0.161
8 0.40 0.642 0.149
9 0.41 0.709 0.140
10 0.41 0.773 0.132
La premire colonne de ce tableau donne la position du point
dinflexion Q. . La deuxime colonne permet de calculer le
temps et den tirer le temps de retard = 1 . De la troisime colonne, on tire la constante de temps du systme.
Pour dterminer les paramtres dun modle de Strejc, il
faut :
Mesurer le gain statique du systme qui est le rapport dela valeur finale du signal de sortie et
dentre;
Mesurer les temps 1 ; Estimer le retard maximum ; Tirer du tableau de Strejc la valeur de =
. pour diffrentes valeurs de ; Calculer le retard = 1 qui doit tre
positif et infrieur ; Calculer la constante de temps = . ; Dterminer les ordres n possibles en ne conservant
que les temps de retard admissibles.
b. Mthode de Broida
La mthode de Broda consiste a assimiler la fonction de
transfert d'un systme d'ordre celle du premier ordre affecte d'un retard pur .
Le modle propos pour approcher le comportement du
systme est un premier ordre avec un retard pur. Sa fonction
de transfert est :
=
1 +
(2)
Les paramtres identifier sont donc :
le gain statique , le retard , la constante de temps
Afin de dterminer des valeurs de ces paramtres, Broda fait
correspondre la rponse indicielle identifier et la fonction de
transfert du premier ordre affecte d'un retard en deux points
1 2 d'ordonnes correspondant 28% 40% de la valeur finale de la sortie du systme.
Les paramtres du modle de Broida sont :
= 5.5 2 1 = 2.81 1.82 (3)
III. RELATION ENTRE LA METHODE DE STREJC ET BROIDA
Afin de mieux comprendre les relations existant entre les
modles de Strejc et Broida, appliquons cette mthode des
systmes dont les transmittances sont connues exactement.
A. Systmes avec des constants de temps proches
Considrons un systme dcrit par 3 constantes de temps
valant 5, 6 7 secondes.
=1
1 + 5 1 + 6 1 + 7
(4)
a. Mthode de Strejc
La reprsentation de la rponse indicielle du systme et la
tangente au point dinflexion est reprsente par la figure
suivante :
9
International Conference on Signal, Image, Vision and their Applications SIVA11, November 21-24, 2011, Guelma Algeria
La mesure des temps caractristiques sur la rponse indicielle
(Fig.3) a conduit aux valeurs suivantes :
1 = 5.1924[],2 = 27.4453 [], = 2 1 =22.2529[] qui nous permettent de construire le tableau didentification suivant :
Table.2Tableau des paramtres de Strejc
= . = 1 = . 2 2.3143 2.8780 8.1891 3 4.8511 0.3412 6.0305 4 7.0987 1.9063 4.9847 5 9.1237 3.9314 4.3393 6 10.9707 5.7783 3.8943 7 12.6842 7.4918 3.5827 8 14.2864 9.0940 3.3157 9 15.7773 10.5850 3.1154
10 17.2015
12.0092
2.9374
Les retards ngatifs nayant aucune signification physique, on
liminera sans autre les ordres suprieurs n = 3. Il reste donc
le choix entre les deux modles suivants :
2 =2.8780 p
1 + 8.1891 2
(5)
3 =0.3412 p
1 + 6.0305 3
(6)
Le trac de la rponse indicielle relle et les rponses
indicielles de Strejc dordre 2 et 3 est comme suit :
Le calcul derreur entre les rponses indicielles du systme
rel et les modles de Strejc dordre 2 et 3 est reprsent par
la figure suivante :
Interprtation : Le modle de Strejc dordre 3 est en trs
bonne concordance avec le systme rel et les diffrences
entre les rponses indicielles sont difficilement perceptibles
b. Mthode de Broida
La reprsentation de la rponse indicielle du systme et points
correspondant 28% et 40% de la valeur finale est reprsente
par la figure suivante :
La mesure des temps caractristiques sur la rponse
indicielle (Fig.3) a conduit aux valeurs suivantes : 1 = 10.9700[], 2 = 13.6300 [], qui nous permettent de calculer les paramtres de Broida.
= 14.6300 = 6.1820 (7)
Le modle de Broida est alors dfini comme suit :
=6.1820 p
1 + 14.6300
(8)
Le trac des rponses indicielles relles et du modle de
Broida est comme suit :
10
International Conference on Signal, Image, Vision and their Applications SIVA11, November 21-24, 2011, Guelma Algeria
Le trac de lerreur entre le systme rel et le modle de
Broida est reprsent par la figure suivante :
Interprtation : Le modle de Broida est loin dtre en
concordance avec le systme rel en le comparant avec le
modle de Strejc ; mme le modle de Strejc dordre 2
quon a rejet lors de ltape de modlisation est meilleur
que ce dernier.
B. Systmes avec des constants de temps diffrentes
Considrons un systme dcrit par 3 constantes de temps
valant 0.5, 5 10 secondes.
=1
1 + 0.5 1 + 5 1 + 10
(9)
a. Mthode de Strejc
La reprsentation de la rponse indicielle du systme et la
tangente au point dinflexion est reprsente par la figure
suivante :
La mesure des temps caractristiques sur la rponse indicielle
a conduit aux valeurs suivantes : 1 = 3.1790 [], 2 =
23.3126 [], = 2 1 = 20.1336 [] qui nous permettent de construire le tableau didentification suivant :
Tab.2 Tableau didentification de Strejc
= . = 1 = . 2 2.0939 1.0851 7.4092 3 4.3891 1.2101 5.4562 4 6.4226 3.2436 4.5099 5 8.2548 5.0758 3.9261 6 9.9259 6.7469 3.5234 7 11.4762 8.2972 3.2415 8 12.9258 9.7468 2.9999 9 14.2747 11.0957 2.8187
10 15.5633
-12.3843
2.6576
Les retards ngatifs nayant aucune signification physique, on
liminera sans autre les ordres suprieurs n = 2. Il reste donc
un seul modle qui est le suivant :
2 =1.0851
1 + 7.4092 2
(10)
Le trac de la rponse indicielle relle et la rponse indicielle
de Strejc dordre 2 est comme suit :
11
International Conference on Signal, Image, Vision and their Applications SIVA11, November 21-24, 2011, Guelma Algeria
Le calcul derreur entre les rponses indicielles du systme
rel et le modle de Strejc dordre 2 est reprsent par la
figure suivante :
Commentaire : Le modle de Strejc dordre 2 est en trs
bonne concordance avec le systme rel et les diffrences
entre les rponses indicielles sont difficilement perceptibles.
b. Mthode de Broida
La reprsentation de la rponse indicielle du systme et
points correspondant 28% et 40% de la valeur finale est
reprsente par la figure suivante :
La mesure des temps caractristiques sur la rponse
indicielle (Fig.3) a conduit aux valeurs suivantes : 1 = 8.0400[], 2 = 10.5200 [], qui nous permettent de calculer les paramtres de Broida.
La mesure des temps caractristiques sur la rponse
indicielle (Fig.3) a conduit aux valeurs suivantes : 1 =
8.0400[], 2 = 10.5200 [], qui nous permettent de calculer les paramtres de Broida.
= 13.6400 = 3.5760 (11)
Le modle de Broida est alors dfinie comme suit :
=3.5760 p
1 + 13.6400
(12)
Le trac des rponses indicielles relle et du modle de
Broida est comme suit :
Le trac de lerreur entre le systme rel et le modle de
Broida est reprsent par la figure suivante :
Commentaire : Le modle de Broida est loin dtre en
concordance avec le systme rel en le comparant avec le
modle de Strejc.
IV. CONCLUSION
On voit que la modlisation de Strejc pour les systmes sans
retard pur que ce soit constantes de temps proches ou
12
International Conference on Signal, Image, Vision and their Applications SIVA11, November 21-24, 2011, Guelma Algeria
diffrentes conduit une erreur minimale donc une
meilleure concordance avec le systme rel, alors que la
modlisation de Broida lerreur est assez importante.
Comme perspective, on dsire voir la meilleure
modlisation pour les systmes avec retard pur.
REFERENCES
[1] L. Ljung, System identification theory for the use, Prentice Hall information and system science series, 1999.
[2] Y. Zhu, Multivariable System Identification for Process Control. Elsevier Science & Technology Books, , October 2001.
[3] L. LjungT ,T.Glad, Modeling of dynamic systems, Prentice Hall, 1994.
13
International Conference on Signal, Image, Vision and their Applications SIVA11, November 21-24, 2011, Guelma Algeria
Rsum Cet article est une introduction larithmtique
base dintervalles sur les profiles, avec une telle procdure, il est
possible destimer les bornes infrieure et suprieure dun
intervalle.
Mots cls Arithmtique par intervalles, profiles, informations
imprcise, estimation, oprations.
I. INTRODUCTION
A reprsentation par intervalles peut tenir compte des
incertitudes, elle peut tre parfois insuffisante,
particulirement quand un degr de confiance est prfr. En
effet, dans une approche par intervalles, il est seulement
possible destimer les bornes infrieure et suprieure des
paramtres du systme. En effet, cette reprsentation nous
autorise supposer que la valeur dun paramtre se situe dune
manire galement probable en tout point de lintervalle. Cette
faon de voir les choses peut tre enrichie en exploitant une
reprsentation par intervalles flous..
Lutilisation des intervalles flous pour reprsenter les
incertitudes dans les systmes de commande nest pas une
thorie nouvelle mais intressante [1],[2],[3].
II. ARITHMETIQUE PAR INTERVALLE
Larithmtique par intervalle introduite par Moore ([1],
[4], [5], [6]) fait intervenir des intervalles. Lide est dune
part de garantir les rsultats en calculant un intervalle dans
lequel se trouve le rsultat effectif, et dautre part on cherche
fournir un encadrement de largeur raisonnable de la solution et
avoir un rsultat suffisamment prcis.
Manuscrit reu Septembre 27, 2011.
Arithmtique base dintervalle sur les profiles.
F HAMADACHE, Centre universitaire de Bordj Bou Arrridj, Algerie, LSI
Laboratoire des Systmes Intelligents, [email protected] , N DIFFELLAH, Centre universitaire de Bordj Bou Arrridj, Algerie, LSI
Laboratoire des Systmes Intelligents, [email protected]
K BENMAHAMMED, Universit el Baha, collge des ingnieurs, Arabie
Saoudite, LSI Laboratoire des Systmes Intelligents, [email protected].
A. Dfinition dun intervalle
Un intervalle xxX , est lensemble des rels x tel que
x et
x sont les extrmits de X.
xxxxX / (1) B. Opration sur les intervalles
Soit aaa , et bbb , deux intervalles. Les oprations arithmtique standard sont dfinis comme suit :
a. Addition
Laddition de deux intervalles est comme suit :
bababbaa ,,, (2)
b. Soustraction
La soustraction de deux intervalles est comme suit :
bababbaa ,,, (3)
c. Multiplication
La multiplication de deux intervalles est comme suit :
)max(),min(,, zzbbaa (4)
Avec :
babababaz .,.,.,. (5)
d. Division
La division de deux intervalles est comme suit :
bbaabbaa
1,
1,,/,
(6)
Avec :
bb ,0
Arithmtique Base dIntervalles Sur les
Profiles
F. HAMADACHE, N. DIFFELLAH, et K. BENMAHAMMED
L
14
International Conference on Signal, Image, Vision and their Applications SIVA11, November 21-24, 2011, Guelma Algeria
III. REPRSENTATION DE LINFORMATION IMPRCISE
Un intervalle standard a peut tre considr comme
ensemble dlments auxquels une fonction dappartenance
)(xa
rectangulaire est associe. En effet, un intervalle peut
tre vu comme un intervalle flou (nombre flou) spcial dont la
fonction dappartenance prend la valeur 1 sur tout
lintervalle et le 0 ailleurs. Dans ce cas, toute lanalyse et
larithmtique par intervalles peut tre considre comme
sous-ensemble de la thorie des ensembles flous.
Un intervalle flou A [7] contrairement une reprsentation
par intervalles conventionnels, toutes les valeurs dans un
intervalle flou ne sont pas galement possibles.
La distribution de possibilit est reprsente par la fonction
dappartenance de lintervalle flou o le support fait rfrence
lintervalle de toutes les valeurs possibles et le noyau
reprsente lensemble des meilleures valeurs dun paramtre
Dans ce cas, on peut dire que les intervalles flous
encapsulent dans un seul formalisme le cas optimiste (la
connaissance prcise) et le cas pessimiste (maximum de
l'incertitude).
Les diffrents types d'intervalles flous sont reprsents
comme suit :
A. Intervalle standard
Un intervalle standard est une reprsentation classique dun
intervalle.
B. Intervalle flou quelquonque
C. Intervalle flou trapzoidale
Dune manire conventionnelle, cet intervalle flou ([2], [3])
est souvent reprsent par la forme canonique de sa fonction
dappartenance donne par :
ailleurs
AS
ANxpourx
Ag
AN
ANxpour
AN
ASxpourx
Af
xA
0
,)(
,1
,)(
)(
(7)
Par exemple pour un intervalle flou trapzodale A, lquation
prcdente peut scrire sous la forme suivante :
ailleurs
AS
ANxpour
AN
AS
xA
S
AN
ANxpour
AN
ASxpour
AS
AN
ASx
xA
0
,
,1
,
)(
(8)
15
International Conference on Signal, Image, Vision and their Applications SIVA11, November 21-24, 2011, Guelma Algeria
D. Intervalle flou triangulaire
Dans le cas dun intervalle flou triangulaire (cas particulier
dun intervalle flou trapzodal) on obtient :
ailleurs
AS
ANxpour
NAA
S
xA
S
AN
ASxpour
AS
AN
ASx
xA
0
,
,
)(
(9)
IV. PRINCIPE DE REPRSENTATION PAR PROFILES
Pour des raisons de simplicit mais sans perte de gnralit,
dans toute la suite de ce document, les intervalles flous
exploits sont considrs sous forme triangulaire.
AN
AS
AS
AS
ANAf
AS
AS
ANxxAf
AS
AS
ANyx
ASx
AS
ANy
AS
AN
ASx
y
AS
AN
ASx
xAf
)1()()(1
)()(1
)(
)()(
(10)
AN
AS
AN
AS
ASAg
AN
ASy
ASxAgA
NA
SyA
Sx
xA
SA
NA
Sy
AN
AS
xA
S
y
AN
AS
xA
S
xAg
)1()()(1
)()(1
)(
)()(
(11)
Un intervalle Flou A triangulaire [3] est donn par ses
profiles gauche A- et droite A
+ :
AKASASxxAxA
AKASASxxAxA
.).1(;)(/inf)(
.).1(;)(/inf)(
(12)
Avec:
)0()0(.4
)1()1(.3
1,0)(.2
1,0)(.1
AAKA
AKAA
avectedcroissanestA
aveccroissanteestA
V. OPERATIONS ARITHMETIQUES A BASE DINTERVALLE SUR
LES PROFILES
Prenons deux ensembles flous )(),( AAA et
)(),( BBB avec :
droitesprofilesBA
gauchesprofilesBA
:)(),(
:)(),(
Les quatre oprations standards sont dfinies par:
A. Addition sur les profiles
)()(),()())(( BABABA
(13)
Exemple:
Considrons deux nombres flous A1 et A2 tels que :
16
International Conference on Signal, Image, Vision and their Applications SIVA11, November 21-24, 2011, Guelma Algeria
Premier nombre flou
A1 = [A1-, A1
+] : 24,1
1A
avec
A1- : 1
1A : profile gauche
A1+ : 24
1
A : profile droite
Deuxime nombre flou
A2 = [A2-, A2
+] : 22,26
2A :
avec
A2- : 26
2
A : profile gauche
A2+ : 222
A : profile droite
2224,261))(21
( AA
42,35))(21
( AA
Lutilisation de INTLAB ( Interval laboratory)pour la
simulation nous a donn les enveloppes dvolution
suivantes :
B. Soustraction sur les profiles
)()(),()())(( BABABA
(14)
21
,2121
AAAAAA
2624,221))(21
( AA
410,33))(21
( AA
Lutilisation de INTLAB pour la simulation nous a donn les
enveloppes dvolution suivantes :
C. Multiplication sur les profiles
BABABABAZ
avecZZBA
,.,.,.
:)max(),min())((
(15)
,2224,2624
,221,261
:)max(),min())(21(
Z
avecZZAA
221,2624))(21( AA Lutilisation de INTLAB pour la simulation nous a donn
les enveloppes dvolution suivantes :
D. Division sur les profiles
BSavecBB
AABA
0
)(
1,
)(
1)(),())((
(16)
26
1,
22
124,,1))(
2/
1( AA
261,22/24))(2/1( AA
17
International Conference on Signal, Image, Vision and their Applications SIVA11, November 21-24, 2011, Guelma Algeria
Lutilisation de INTLAB pour la simulation nous a donn les
enveloppes dvolution suivantes :
VI. CONCLUSION
Larithmtique par intervalles sur les profiles constitue une
bonne approche, elle repose sur le fait de chercher fournir un
encadrement de largeur raisonnable de la solution et avoir un
rsultat suffisamment prcis
REFERENCES
[1] R.E.Boche, " An operational interval arithmetic ", Lockheed Missiles
and Space Company, Palo Alto, California, Paper N.CP 63-1431,
IEEE, August 1963.
[2] R.E.Moore , Error in Digital Computation, Volume 1, John Willy and
sons, Inc. New York .London .Sidney; 1965.
[3] G.J. klir, Uncertainty and information,Foundation of Generalized
Information Theory, Binghamton University SUNY, 2006 by John
Wiley & Sons,
[4] R.E.Moore, Automatic error analysis in digital computation, Missiles
and space division.28 January
[5] R.E.Moore, Interval analysis, Lockheed Missiles and space division
Sunnyvale California. September 1959
18
International Conference on Signal, Image, Vision and their Applications SIVA11, November 21-24, 2011, Guelma Algeria
Rsum De nos jours, les systmes mdicaux produisent
une grande quantit de donnes images qui sont stockes dans
des bases de donnes, laccs rapide ces bases normes
ncessite des algorithmes dindexation efficaces. Lindexation
des images mdicales est devenu, pour les applications
cliniques, un outil essentiel parce quelle apporte une aide
efficace aussi bien en diagnostic quau suivi thrapeutique. Les
systmes de recherche dimages par contenu (en anglais
Content Based Image Retrievel) sont l'une des solutions
possibles pour grer efficacement ces bases. Dans ce papier, les
principales techniques dindexation dimage par contenu sont
analyses, ensuite nous discutons les problmes de ses
techniques, et nous proposons des dfis.
Mots cls Indexation dimage par contenu, recherche
dimage, CBIR, descripteur couleur, texture, forme.
I. INTRODUCTION
Lvolution de la technologie touch plusieurs secteurs dont le secteur mdical, do lapparition dappareils
dacquisition dimages qui produisent un nombre important
dimages chaque anne. Cependant laccs rapide ces bases
dimages normes ncessite des algorithmes dindexation
efficaces.
Plusieurs systme dindexation dimages ont t prsents
dans la littrature [6, 7,8].les Premiers systmes sont bass sur
le texte (en anglais :(Text-Based Image Retrivel), ces derniers
adoptent une approche qui consiste dcrire le contenu visuel
sous forme textuelle (utilisation de mots-cls). Ces mots-cls
servent comme index pour accder aux donnes visuelles
associes. Lavantage de cette approche est quelle permet de
consulter les bases de donnes en utilisant les langages
dinterrogation standard, par exemple SQL. Cependant, ceci
ncessite une grande quantit de traitement manuel. De plus la
fiabilit des donnes descriptives nest pas assure: elles sont
Manuscrit reu 16 Octobre2011. Techniques dindexation dimages
Mdicales par contenu. 1Souad. Meziane Tani, Laboratoire gnie biomdicales , Universit
Tlemcen 13000, Algrie 2Abdelhafid. Bessaid , Laboratoire gnie biomdicales , Universit
Tlemcen 13000, Algrie.
subjectives et elles pourraient ne pas dcrire correctement le
contenu de limage. Afin de rsoudre ces problmes, les
systmes dindexation dimage par contenu CBIR sont
introduits. Lobjectif est de reprsenter les images en utilisant
seulement le contenu visuel numrique de limage. Les principaux systmes de recherche dimages par contenu
existants sont : dune part ,les systmes commerciaux
comme : QBIC (IBM, 1995) Image Finder (Attrasoft)
,Excalibur (Excalibur Technologies, 1996) .Et dautre part ,les
systmes exprimentaux comme Blobworld (Universit de
Californie - Berkeley), Photobook (Massachussetts Institute of
Technology) ,Viper (Universit de Genve Computer Vision
Group) ,SIMPLIcity (Stanford University) ,Ikona (INRIA
Rocquencourt IMEDIA).
Ce papier est organis en trois principales sections. Dans la
(section-II) nous prsentons un aperu sur larchitecture
globale dun systme dindexation, puis nous discutons dans la
(section-III) des principales techniques dindexation dimage
par contenu. la fin (section-IV) les problmes et les dfis
sont proposs.
II. SYSTEME DINDEXATION PAR CONTENU
Un systme dindexation se compose de deux tapes
principales : la premire, en mode autonome (hors ligne ) pour
les prtraitements, lorganisation et la gestion de la base
dimages de rfrence (sous-systme dindexation de la base),
et la deuxime ,cest la phase de consultation en ligne pour les
traitements propres a chaque nouvelle requte de lutilisateur
(sous-systme de recherche). Les deux sous-systmes ont en
commun les deux traitements suivants :
Lextraction de descripteurs caractristiques des images, que ce soit pour une image de la base
durant la phase en mode autonome ou une image
requte propose par lutilisateur lors de la phase
en ligne.
La construction des index partir des descripteurs.
La figure II- 1 illustre larchitecture dun systme dindexation
par contenu.
Techniques dindexation dimages
Mdicales par contenu
S. Meziane Tani, A. Bessaid
19
International Conference on Signal, Image, Vision and their Applications SIVA11, November 21-24, 2011, Guelma Algeria
Figure II-1: Architecture dun systme dindexation.
La phase dindexation contient les oprations ncessaires
pour organiser les descripteurs de manire accder
rapidement aux donnes. Indexer une image consistera
calculer une signature depuis ses descripteurs par le biais
dune fonction dindexation. Idalement, plus deux signatures
sont proches au sens de la mtrique utilise, plus les images
associes sont proches au sens de lutilisateur. La complexit
de la comparaison des images est alors rduite la
comparaison de leur signature dindexation.
Pendant la consultation de la base, lutilisateur slectionne
une image par le biais dune interface graphique. Les index
ou signatures de la requte sont confrontes aux index des
images de rfrences. Finalement, le systme slectionne et
prsente lutilisateur les images les plus similaires la
requte.
III TECHNIQUE DINDEXATION DIMAGE PAR
CONTENU
Plusieurs approches ont t proposes dans la littrature
pour indexer le contenu dune image, nous prsentons dans la
section suivante un aperu sur les principales techniques
utilises.
A. Indexation dimage par caractristiques bas niveau
Une caractristique bas niveau est un ensemble de valeurs et
qui sont extraites directement de limage permettant de la
caractriser. Lextraction des caractristiques de bas niveau
reprsente une premire abstraction par rapport limage
brute, le but est que cette caractristique soit discriminante par
rapport aux entits visuelles que lon cherche caractriser.ces
descripteurs bas niveau peuvent tre utilis pour limage
entire comme ils peuvent tre utilis pour une partie de
limage [2].
1) Couleur
La couleur est lune des plus importantes caractristiques
et la plus attirante ds la premire vue de limage, cest pour
cela quelle est la plus utilise en recherche par le contenu. Il
existe plusieurs espaces colorimtriques pour reprsenter la
couleur tels que RGB, HSL, LAB [3].quelque soit lespace de
couleur utilise, il existe plusieurs faons de caractriser la
couleur tels que : lhistogramme couleurs, les moments
statiques, les angles de couleur etc.
Lhistogramme couleur a t propos pour la premire
fois par SWAIN [4], cette mthode consiste calculer
lhistogramme couleur de chaque image c..d. le nombre de
pixels pour chaque intensit lumineuse (couleur), ensuite la
similarit entre les images est calcul partir dintersection
entre histogrammes, le grand inconvnient de cette mthode
est que les histogrammes occupent une place importante en
espace mmoire ce qui alourdit lalgorithme de recherche.
pour rsoudre ce problme, au lieu de calculer la
distribution complte, dans les systmes de dindexation
dimages, on calcule seulement les caractristiques de
couleur des dominantes tels que lesprance, la variance et
dautres moments.La figure (Figure III-) prsente
lhistogramme couleur dune image.
Figure III- 2:Histogramme couleur d'une image(RGB).
2) Texture
Plusieurs chercheurs ont essay de donner une dfinition de la texture mais aucune nest gnrale et formelle ; la texture
se dfinit comme un ensemble de primitives (de pixels peu
prs semblables) arranges selon des rgles particulires de
placement.
20
International Conference on Signal, Image, Vision and their Applications SIVA11, November 21-24, 2011, Guelma Algeria
Figure III-A-3:Exemple d'une texture
Les mthodes proposes pour caractriser la
texture peuvent tre classifies en deux catgories[5] :La
premire inclut les mthodes statistiques qui caractrisent les
relations statistiques entres les diffrents niveaux de gris des
pixels utilisant une fonction de corrlation, la mthode la plus
connue cest la matrice de co-occurrence .La deuxime
catgorie comporte les mthodes spectrales bases sur le
traitement de signal ,tels que le filtre de Gabor , les moments
de hrmites .On peut galement trouver dautre mthodes de
caractrisation de la texture tels que : modlisation
markovienne qui peut modliser les interaction entre pixels .
1) Forme
La forme est une autre primitive qui sert caractriser le contenu dune image; deux mthodes de
description de la forme peuvent tre distingues [2], dune part
les mthodes bases sur le contour tels que: descripteur EOH
(Edge Orientation Histogram) qui consiste extraire les
contours dune image et de calculer lhistogramme de langle
des gradients sur les contours. Et dautre part la mthode base
sur les rgions: tels que les moments gomtriques.
B. Indexation dimage par caractristique haut
niveau
Une caractristique haut niveau, gnralement appele
caractristique smantique, reprsente le contenu
smantique qui se dfini par les attributs abstraits de
limage tels que : les scnes smantique (exemple : bord de
mer, rue, champ doiseaux, etc.), comportement
smantique (par exemple la performance, agression,) et
l'motion smantique (calme, l'harmonie, l'inspiration,
etc.). Cependant la smantique de limage est la
caractristique la plus complexe, floue et abstraites est
difficile a extraire de limage ;
Gnralement, les caractristiques hauts niveaux
dpendent des caractristiques bas niveaux.
III. CONCLUSION
Selon la prsente analyse et l'tude des techniques dindexation dimages bases sur le contenu, quelques
problmes ont t dcouverts savoir :
1) lindexation des images par la couleur prsente le problme du manque de considration de la scne
visuelle. De plus les images mdicales ne sont pas
toujours en couleur.
2) Il est difficile de caractriser tous types de textures avec une mthode particulire parce que la texture choisie
pour chaque mthode dpend de la texture de limage.
3) Lindexation des images par la forme prsente plusieurs problmes parmi lesquels ont peut citez le cas des
formes caches (Comment reconnatre les objets
partiellement cachs ?).
En plus des problmes cits en haut, ces descripteurs
(couleur, forme, texture) sont bass sur la prise en compte
directe du contenu visuel mais aucune considration pour la
smantique de l'image, ce qui cre un foss smantique qui a
t dfini par [5] comme le manque de concordance entre les
informations que l'on peut extraire des donnes visuelles et
linterprtation que les mmes donnes ont pour un utilisateur
dans une situation donne.
Le dfi actuel consiste amlior les descripteurs visuels
afin de rduire ce foss smantique et de passer lutilisation
des caractristiques hauts niveaux.
REFERENCES
[1] S. Jai-andaloussi ,M lamard guy gazuguel ,h tairi ,m meknassi , b cochenrer , Content based image retrievel :used of generalized
gaussien density , springer journal ,april 2009.
[2] Y .Xiaohong ,X jinhua , The related techniques of content based image retrieval,international sympusiumom of computer science and
computatiana technology ,IEEE computer society,2008.
[3] V.chtkara, Color based image retrievel using compact binary signatures , technical rapport, department of computer science , university of
Alberta Admonton, May 2001.
[4] M swain ,D ballard , Color indexing ,international journal of vision ,1991.
[5] Image Retrieval :ideas, influences ,and trend of the new age, the Pennsylvania state university, ACM transactions on computing surveys , April 2008.
[6] P. Aigrain et al. Content-based representation and retrieval of visual media : a-stateof- the-art review. Multimedia Tools and Applications,
3(3) :179202, septembre 1996
[7] New J.J. Fan and K.Y. Su. An efficient algorithm for matching multiple patterns. IEEE Trans. Knowl. Data Eng., 5(2) :339351, avril 1993.
[8]
21
International Conference on Signal, Image, Vision and their Applications SIVA11, November 21-24, 2011, Guelma Algeria
Mise en correspondance des contours dobjets
bruits
S.Aouat, S. Larabi
RSUM Nous prsentons dans ce papier une nouvelle approche qui permet de comparer les silhouettes dobjets. Les silhouettes sont extraites partir de deux images prises sous des points de vue lgrement diffrents, (dans le cas de deux images stroscopiques) ou partir dune squence dobjets en mouvement. La comparaison des silhouettes se fait en se basant sur leur description XLWDOS en prenant en considration la prsence du bruit dans les deux images. Le bruit modifie malheureusement dune manire assez considrable une telle description do la ncessit de rsoudre ce problme afin effectuer une meilleure comparaison des images. La mthode est valide par une exprimentation effectue sur des images relles. MOTS CLS Comparaison, Descripteur, Silhouette, Bruit, LWDOS, XLWDOS.
I. INTRODUCTION
lusieurs reprsentations des objets 3D partir dimages en
se basant sur diffrents lments ont t proposes dans la
littrature, nous citons : Des reprsentations bases sur les
parties composant un objet (primitives volumiques), [3]. Des
reprsentations bases sur les frontires 3D reconstruites
partir de la strovision [13]. Des reprsentations bases sur
lapparence [11,4]. Des reprsentations bases sur les
courbures des frontires de la silhouette qui est reprsente
moyennant le CSS (Curvature Scale Space) propose par
Mokhtarian [10,9,14], ainsi que beaucoup dautres mthodes
de reprsentation et reconnaissance utilisant des
caractristiques extraites des images que se soit gomtriques
ou photmomtriques [15-32].
Manuscript reu le 16 Octobre, 2011.
Saliha AOUAT Laboratoire LRIA, Dpartement
dInformatique USTHB, Alger, Algrie
([email protected], [email protected])
Slimane LARABI Laboratoire LRIA USTHB
Parmi les diffrentes mthodes de description des formes
utilises dans la reconnaissance d'objets, lquipe de vision par
ordinateur du Laboratoire de Recherche en Intelligence
Artificielle (LRIA) de lUSTHB a labor une technique de
description dobjets, la description propose est textuelle,
invariante au changement dchelle et la rotation mais
malheureusement elle est sensible au bruit (interfrences et
parasites). Cette description est base sur le langage LWDOS
(Language for Writing Descriptors of Outline Shapes)[8]. Et
XLWDOS (XML Language for Writing Descriptors of
Silhouettes) [7].
Dans ce papier, nous dveloppons une mthode qui permet
de comparer deux silhouettes dobjets extraites partir
dimages prises sous des points de vues lgrement diffrents
et cela en tenant compte de la prsence du bruit dans les deux
images. Pour effectuer le travail dcrit dans ce papier, nous
nous sommes inspirs de lide prsente dans [6,1],
cependant la particularit de notre approche rside dans
lexprimentation totalement automatique depuis la
description textuelle jusqu' la comparaison des silhouettes
reprsentant des images relles, ainsi que son application un
ensemble dobjets en mouvement. Cette approche est
diffrente du lissage textuel [2] appliqu sur les descripteurs et
aboutissant lindexation et la reconnaissance de silhouettes
dobjets.
Ce papier est organis comme suit : le paragraphe 2 est
consacr la description de silhouettes selon les langages
XLWDOS [7]. Nous aborderons ensuite dans le paragraphe 3
la notion du bruit dans une image ainsi que la mthode utilise
pour le lissage de celle ci. Dans le chapitre 4, nous expliquons
le processus de comparaison que nous avons conu pour
confirmer ou infirmer la ressemblance de deux silhouettes. Le
paragraphe 5 explicitera notre tude par une partie
exprimentation qui montrera le droulement du processus de
comparaison implment et sa validation sur des images
relles.
P
22
International Conference on Signal, Image, Vision and their Applications SIVA11, November 21-24, 2011, Guelma Algeria
II. DESCRIPTION XLWDOS DUNE SILHOUETTE
Le langage XLWDOS [7] est un langage XML dvelopp
pour la description des silhouettes, il est en fait issu du
langage LWDOS [8] Lintrt majeur du descripteur
XLWDOS (comme son prdcesseur) est son criture
textuelle, permettant une facilit dindexation, de traitement et
de stockage. Lexemple de la figure 1 illustre brivement la
description dune silhouette moyennant le langage XLWDOS
exemple de silhouette
P1 D1 P2 P3 (DS signifie description
of shape.)
Cette description signifie que la silhouette est forme dune
partition P1 suivie dune ligne de disjonction (D1) suivi son
tour de deux autres partitions P2 et P3. Il est noter que
lorsquon passe de plusieurs partitions une seule la ligne sera
appele ligne de jonction (J). Comme la mme description
globale peut dcrire plusieurs silhouettes dobjets, il serait
ncessaire de passer la description dtaille des lments
constituant la description prcdente. Le descripteur dtaill
est donn par :
Figure 1. Exemple de description dune silhouette
exemple de silhouette
cv 3 130 25 r 90 35 cc 25 60 40 r
90 20
h P1 5 s P1 P2 15 h P1 9 s P1 P3 17 h P1 6
r 90 20 r 180 15 r 90 20
r 90 20 r 180 15 r 90 20
.
A titre dexemple Le cot gauche de la partition P1 est une
succession dune courbe convexe (cv) dont le degr de
convexit est de 3%, langle dinclinaison est de 130 et de
longueur 25 pixels. Cette courbe est suivie dun segment de
droite (r) inclin de 90 et de longueur gale 35 pixels.
Le cot droit de P1 est une courbe concave (cc) suivi aussi
dun segment vertical. La ligne de disjonction (D) est
constitue dune succession de cinq petits segments :
h P1 5 : de longueur 5 et appartenant la partition P1 den haut do le nom free high symbolis par (h)
s P1 P2 15 : de longueur 15 appartenant deux partitions P1 et P2 do le nom shared segment symbolis par (s)
h P1 9 : de longueur 9 appartenant la partition P1 s P1 P3 17 : de longueur 17 appartenant deux partitions
P1 et P3.
h P1 6 : de longueur 6 et appartenant la partition P1.
Il est important dindiquer que toutes ces valeurs et
mesures sont calculs relativement lunique rectangle daire
minimum englobant la silhouette [7,8]. La dsignation CP
signifie partition compose (composed part).