Upload
others
View
4
Download
0
Embed Size (px)
Citation preview
RE
CO
NO
CIM
IEN
TO
SIN
TÁ
CT
ICO
D
E F
OR
MA
Se
jem
plo
de
tra
du
cció
n a
uto
má
tica
Ramón A. MollinedaCárdenas
Departamentde Llenguatgesi SistemesInformàtics
RECONOCIMIENTO DE FORMAS
RECONOCIMIENTO DE FORMAS
RECONOCIMIENTO DE FORMAS
RECONOCIMIENTO DE FORMAS
màsteroficial -sistemesintel�ligents
con
ten
ido
s
•in
tro
du
cció
n a
l R
F s
intá
ctico
•in
tro
du
cció
n a
la
ta
rea
de
tra
du
cció
n a
uto
má
tica
•u
n s
iste
ma
de
tra
du
cció
n a
uto
má
tica
Caste
llan
o-
Va
len
cia
no
reco
no
cim
ien
to s
intá
ctic
o d
e fo
rmas
intr
od
ucció
n
…o
rec
on
oci
mie
nto
es
tru
ctu
rald
e fo
rmas
un
a f
orm
ao
pa
tró
ne
s d
escri
to p
or
un
a e
str
uctu
ra
(usu
alm
en
te je
rárq
uic
a)
qu
e in
terr
ela
cio
na
su
be
str
uctu
ras
má
s s
imp
les (
de
acu
erd
o a
alg
un
a s
inta
xis
)
ejem
plo
s:•
ca
de
na
s e
n u
n le
ng
ua
je (
na
tura
l o
fo
rma
l)
•g
rafo
s q
ue
co
ne
cta
n n
od
os r
ela
cio
na
do
s
•á
rbo
les
…
reco
no
cim
ien
to s
intá
ctic
o d
e fo
rmas
len
gu
aje
na
tura
l:u
n e
jem
plo
co
ncre
to (
i)
frase p
reposic
ional
con
los a
mig
os
pre
posic
ión
con
frase n
om
inal
los a
mig
os
dete
rmin
ante
los
nom
bre
(susta
ntivo)
am
igos
raíz
am
ig
masculin
o
o
plu
ral
s
+
++
am
ig
+
gramática
sintaxis
morfología
prim
itiv
as d
el le
ngu
aje
reco
no
cim
ien
to s
intá
ctic
o d
e fo
rmas
len
gu
aje
na
tura
l:u
n e
jem
plo
co
ncre
to (
ii)
la s
inta
xis
regu
la las c
om
bin
acio
nes y
el ord
en d
e las
pa
labra
s e
n u
na f
rase
la f
rase
con
los a
mig
os
•in
terr
ela
cio
na
pa
lab
ras (
estr
uctu
ras m
ás s
imp
les)
•e
s u
na
Fra
se
Pre
po
sic
ion
al =
pre
po
sic
ión
+ F
rase
No
min
al
sie
nd
o F
rase
No
min
al=
De
term
ina
nte
+ N
om
bre
(su
sta
ntivo
)
mo
del
o f
orm
al(o
sin
taxis
):
FP
→P
FN
FN
→D
et
N
reco
no
cim
ien
to s
intá
ctic
o d
e fo
rmas
len
gu
aje
na
tura
l:u
n e
jem
plo
co
ncre
to (
iii)
la m
orf
olo
gía
regu
la las c
om
bin
acio
nes y
el ord
en d
e
los m
orf
em
as
para
form
ar
pala
bra
s c
on s
ign
ific
ado
la p
alab
ra a
mig
os
•in
terr
ela
cio
na
mo
rfe
ma
s(e
str
uctu
ras c
on
sig
nific
ad
o a
ún
má
s s
imp
les)
•a
mig
os =
am
ig(r
aíz
) +
o(m
ascu
lino
) +
s(p
lura
l)
un
mo
rfem
a in
terr
elac
ion
a le
tras
o f
onem
as (
qu
e s
on
las u
nid
ad
es m
ás s
imp
les o
in
div
isib
les)
trad
ucc
ión
au
tom
átic
ag
en
era
lida
de
s
trad
ucc
ión
: cam
bia
r (e
scritu
ra,
hab
la)
de u
n leng
uaje
orig
en a
otr
o d
estino
trad
ucc
ión
au
tom
átic
a: r
ealiz
ar
tare
as d
e t
raducció
n
media
nte
técn
icas c
om
puta
cio
nale
s
trad
ucc
ión
asi
stid
a p
or
com
pu
tad
or:
concie
rne a
la
ap
licació
n d
e t
écnic
as c
om
puta
cio
na
les d
e a
yud
a a
la
tra
ducció
n d
e u
n t
exto
fuente
trad
ucc
ión
au
tom
átic
ae
jem
plo
de
co
mp
lejid
ad
de
la
ta
rea
traducir w
ell
del in
glé
s a
l caste
llano
sa
tisfa
cto
rio
to b
e w
ell
ad
jetivo
ele
va
rse
to w
ell
up
ve
rbo
fue
nte
de
ag
ua
hu
eco
de
l a
sce
nso
r
wa
ter
we
ll
ele
va
tor
we
llsu
sta
ntivo
bie
n h
ech
ow
ell
do
ne
ad
ve
rbio
sig
nif
icad
oej
emp
loca
teg
orí
a lé
xica
ambigüedad léxica
am
big
üedad s
em
ántica
trad
ucc
ión
cas
tella
no
↔ ↔↔↔va
len
cian
og
en
era
lida
de
s
•V
ale
ncia
no
y C
aste
llano s
on le
nguas r
om
ances o
ro
mánic
as (
tie
ne
n s
u o
rig
en
en
el la
tín
, a
l ig
ua
l q
ue
el
po
rtu
gu
és,
fra
ncé
s,
ita
lian
o,
sa
rdo
, ru
ma
no
, …
)
•V
y C
com
part
en m
ucho d
e e
str
uctu
ra s
intá
ctica d
e
ora
cio
nes (
ord
en d
e la
s p
ala
bra
s)
•el esq
uem
a d
e t
raducció
n C
↔V
que s
e p
resenta
apro
vecha e
sta
cara
cte
rística c
om
ún
trad
ucc
ión
cas
tella
no
↔ ↔↔↔va
len
cian
oa
rqu
ite
ctu
ra d
e u
n s
iste
ma
(S
ish
itra
, IT
I-U
PV
)
fragm
enta
dor
↓
etiqueta
dor
↓desam
big
üado
r sin
táctico ↓
módulo
de c
on
cord
ancia
↓
localiz
ad
or
↓desam
big
üado
r sem
ántico ↓
módulo
de infle
xió
n↓
form
ate
ador
↓in
tegra
dor
↓
text
o e
n
cast
ella
no
xml
qu
e d
eli
mit
a
pá
rra
fos,
ora
cio
nes
, y
ut
…u
na
ora
ció
n
gra
fo q
ue
aso
cia
ca
da
pa
lab
ra a
su
s p
osi
ble
s ca
teg
orí
as
sin
tácti
cas
secu
enci
a d
e c
ate
go
ría
s si
ntá
ctic
as
má
s p
rob
ab
leco
rrig
e/es
tab
lece
co
nco
rdan
cia
en
tre
pa
lab
ras
de
la o
raci
ón
nu
evo
gra
fo c
on
ca
da
po
sib
le t
rad
ucc
ión
d
e ca
da
pa
lab
ra d
el o
raci
ón
ori
gin
al
secu
enci
a d
e t
rad
ucc
ion
es
má
s p
rob
ab
lese
gen
era
n i
nfl
exi
on
es
de
los
lexem
as
con
tra
ccio
nes
y
ap
ost
rofa
cio
nes
text
o e
n
vale
nci
ano
trad
ucc
ión
cas
tella
no
↔ ↔↔↔va
len
cian
ofr
ag
me
nta
do
r (i
)
entr
ada:
texto
en e
sp
año
l a t
raducir …
La estudiante atendió.
salid
a: f
orm
ato
XM
L q
ue
de
limita
un
ida
de
s lin
gü
ística
s,
es
de
cir
, p
árr
afo
s,
ora
cio
ne
s,
un
ida
de
s d
e t
rad
ucció
n,
…
<doc> <p>
<o> <ut ort=”M”>la</ut> <ut>estudiante</ut>
<ut>atendió</ut> </o>
</p> </doc>
trad
ucc
ión
cas
tella
no
↔ ↔↔↔va
len
cian
ofr
ag
me
nta
do
r (i
i)
•la
ora
ció
n e
s la
mín
ima
un
ida
d lin
gü
ística
co
n s
en
tid
o
co
mp
leto
•m
od
ela
r re
lacio
ne
s (
sin
táctica
s y
sem
án
tica
s)
en
tre
su
s
pa
rte
s,
me
jora
ro
bu
ste
z y
fia
bili
da
d
•co
mo
un
ida
de
s d
e t
rad
ucció
n (
ut)
, d
ete
cta
y m
arc
a
térm
ino
s q
ue
no
ha
y q
ue
tra
du
cir
, p
or
eje
mp
lo:
–sig
las (
BB
C, F
AO
, F
IFA
, …
)
–n
úm
ero
s y
, en
part
icu
lar,
añ
os
–n
om
bre
s p
rop
ios (
Lucía
, A
leja
nd
ro, …
)
�
trad
ucc
ión
cas
tella
no
↔ ↔↔↔va
len
cian
oe
tiq
ue
tad
or
ob
jeti
vo:
da
da
un
a o
ració
n (
en
xm
l),
pro
du
ce
un
gra
fo c
on
tod
os s
us p
osib
les a
ná
lisis
sin
táctico
s
entr
ada:
<o> <ut ort=”M”>la</ut> <ut>estudiante</ut>
<ut>atendió</ut> </o>
salid
a:
01
23
la,
Pro
n., F
S3
la,
Art
ículo
, F
S
la,
Sust
anti
vo
estu
dia
nte
, A
dj
estu
dia
nte
, S
ust
ate
nd
ió,
V, S
3P
S
�
trad
ucc
ión
cas
tella
no
↔ ↔↔↔va
len
cian
od
esa
mb
igu
ad
or
sin
táctico
ob
jeti
vo:
de
cid
e la
ca
teg
orí
a lé
xic
a m
ás p
rob
ab
le d
e c
ad
a
pa
lab
ra d
en
tro
de
l co
nte
xto
actu
al (o
ració
n).
entr
ada:
sa
lida
de
l m
ód
ulo
etiq
ue
tad
or
01
23
la,
Pro
n., F
S3
la,
Art
ículo
, F
S
la,
Sust
anti
vo
estu
dia
nte
, A
dj,
S
estu
dia
nte
, S
ust
, S
ate
nd
ió,
V, S
3P
S
salid
a: g
rafo
lin
ea
lco
n s
ecu
en
cia
de
ca
teg
orí
as m
ás p
rob
ab
le
01
23
la,
Art
ículo
, F
S
estu
dia
nte
, S
ust
, S
ate
nd
ió,
V, S
3P
S
des
amb
igu
ado
r si
ntá
ctic
om
od
elo
esta
dís
tico
pro
ble
ma:
elim
ina
r a
mb
igü
ed
ad
sin
táctica
en
lo
s t
érm
ino
s
de
un
co
nte
xto
(p
.e.,
un
a o
ració
n)
dad
os,
•W
, e
l vo
ca
bu
lari
o d
el le
ng
ua
je f
ue
nte
•C
, e
l co
nju
nto
de
po
sib
les c
ate
go
ría
s s
intá
cticas
•u
na
se
cu
en
cia
de
en
tra
da
w=
w1,
w2,
…,
wL
∈W
L
calc
ula
rla
se
cue
ncia
c’
= c
1,
c 2,
…,
c Lde
cate
gorí
as m
ás p
roba
ble
)|
()
(m
axar
g)
|(
max
arg
'c
wP
cP
wc
Pc
LL
Cc
Cc
∈∈
==
des
amb
igu
ado
rsi
ntá
ctic
om
od
elo
esta
dís
tico (
ii):
pro
ble
ma
pro
ble
ma:
sien
do
,
P(c
), m
od
elo
de
le
ng
ua
jeo
pro
ba
bili
da
de
s c
on
textu
ale
s:
mo
de
la la
pro
ba
bili
da
d d
e c
ua
lqu
ier
secu
encia
o c
on
texto
P(w
|c),
mo
de
lo l
éx
ico
o p
rob
ab
ilid
ad
es d
e e
mis
ión
:
mo
de
la la
re
lació
n e
ntr
e v
ocab
ula
rio
y c
ate
gorí
a
apre
nd
izaj
e d
e m
od
elo
s,
se
rea
liza
sob
re te
xto
s r
eale
s c
orr
ecta
me
nte
etiq
ue
tad
os (
corp
us)
)|
()
(m
axar
g)
|(
max
arg
'c
wP
cP
wc
Pc
LL
Cc
Cc
∈∈
==
des
amb
igu
ado
rsi
ntá
ctic
om
od
elo
esta
dís
tico (
iii):
so
lució
n
pro
ble
ma:
se a
sum
e(p
ara
sim
plif
ica
r e
l p
rob
lem
a)
qu
e,
•p
rob
ab
ilid
ad
es c
on
textu
ale
s a
pre
nd
en
se
cue
ncia
s d
e n
ca
teg
orí
as
•p
rob
ab
ilid
ad
es d
e e
mis
ión
de
pe
nd
ien
tes d
e ú
nic
a c
ate
gorí
a
solu
ció
npara
n =
2(b
igra
mas):
)|
()
(m
axar
g)
|(
max
arg
'c
wP
cP
wc
Pc
LL
Cc
Cc
∈∈
==
=∏
−
L
ii
ii
cc
c
cw
Pc
cP
cL
KK
11
21
)|
()
(m
axar
g'
,,
,
des
amb
igu
ado
rsi
ntá
ctic
om
od
elo
esta
dís
tico (
iv):
so
lució
n
la e
cu
ació
n
pue
de r
epre
senta
rse c
om
o M
od
elo
Ocu
lto
de
Mar
kov
•lo
s e
sta
do
s r
ep
rese
nta
n c
ate
go
ría
s
•P
(ci|c
i-1)
so
n p
rob
ab
ilid
ad
es d
e t
ran
sic
ión
en
tre
esta
do
s
•P
(wi|c
i)so
n d
istr
ibu
cio
ne
s d
e p
rob
ab
ilid
ad
pa
lab
ra-c
ate
go
ría
el A
lgo
ritm
o d
e V
iter
bi,
pe
rmite
, d
ad
a u
na
ora
ció
n d
e
en
tra
da
, e
nco
ntr
ar
su
se
cu
en
cia
de
ca
teg
orí
as m
ás p
rob
ab
le
=∏
−
L
ii
ii
cc
c
cw
Pc
cP
cL
KK
11
21
)|
()
(m
axar
g'
,,
,
�
trad
ucc
ión
cas
tella
no
↔ ↔↔↔va
len
cian
om
ód
ulo
de
co
nco
rda
ncia
ob
jeti
vo:
esta
ble
ce
r co
nco
rda
ncia
en
tre
té
rmin
os d
e f
rase
s
no
min
ale
s (
art
ícu
los,
su
sta
ntivo
s,
ad
jetivo
s).
entr
ada:
sa
lida
de
l m
ód
ulo
de
sa
mb
igu
ad
or
sin
táctico
01
23
la,
Art
ículo
, F
S
estu
dia
nte
, S
ust
, S
ate
nd
ió,
V, S
3P
S
salid
a: o
ració
n e
n la
qu
e e
xis
te c
on
co
rda
ncia
de
gé
ne
ro y
nú
me
ro a
niv
el d
e f
rase
no
min
al.
01
23
la,
Art
ículo
, F
Ses
tud
ian
te,
Sust
, F
Sate
nd
ió,
V, S
3P
S
�
trad
ucc
ión
cas
tella
no
↔ ↔↔↔va
len
cian
om
ód
ulo
lo
ca
liza
do
r
ob
jeti
vo:
tra
du
cir
ora
ció
n a
le
ng
ua
je d
estin
o.
entr
ada:
sa
lida
de
l m
ód
ulo
de
co
nco
rda
ncia
salid
a: g
rafo
de
to
da
s la
s p
osib
les tra
du
ccio
ne
s (
en
fo
rma
de
lexe
ma
s)
de
ca
da
té
rmin
o (
da
do
un
dic
c).
01
23
la,
Art
ículo
, F
Ses
tud
ian
te,
Sust
, F
Sate
nd
ió,
V, S
3P
S
�
01
23
la,
Art
ículo
, F
Ses
tud
ian
t, S
ust
, F
Socu
par,
V, S
3P
S
ate
nd
re,
V,
S3P
S
ten
ir+
cura
+d
e, V
, S
3P
S
trad
ucc
ión
cas
tella
no
↔ ↔↔↔va
len
cian
od
esa
mb
igu
ad
or
se
má
ntico
ob
jeti
vo:
de
cid
e la
me
jor
tra
du
cció
n d
e c
ad
a t
érm
ino
de
acu
erd
o a
su
co
nte
xto
.
entr
ada:
sa
lida
de
l m
ód
ulo
lo
ca
lizad
or
salid
a: g
rafo
lin
ea
l co
rre
sp
on
die
nte
al ca
min
o d
e t
rad
ucció
n
má
s p
rob
ab
le d
el g
rafo
de
en
tra
da
�
01
23
la,
Art
ículo
, F
Ses
tud
ian
t, S
ust
, F
Socu
par,
V, S
3P
S
ate
nd
re,
V,
S3P
S
ten
ir+
cura
+d
e, V
, S
3P
S
01
23
la,
Art
ículo
, F
Ses
tud
ian
t, S
ust
, F
S
ate
nd
re,
V,
S3P
S
trad
ucc
ión
cas
tella
no
↔ ↔↔↔va
len
cian
om
ód
ulo
de
in
fle
xió
n
ob
jeti
vo:
ap
lica
in
fle
xio
ne
s a
le
xe
ma
s d
e a
cu
erd
o a
re
gla
s
de
l le
ng
ua
je d
estin
o.
entr
ada:
sa
lida
de
l m
ód
ulo
de
de
sa
mb
igu
ació
n s
em
án
tica
salid
a: g
rafo
de
té
rmin
os c
om
ple
tos q
ue
re
su
lta
n d
e a
plic
ar
las in
fle
xio
ne
s in
dic
ad
as a
ca
da
le
xe
ma
�
01
23
la,
Art
ículo
, F
Ses
tud
ian
t, S
ust
, F
S
ate
nd
re,
V,
S3P
S
01
23
La
estu
dia
nt
ate
ngu
é
trad
ucc
ión
cas
tella
no
↔ ↔↔↔va
len
cian
om
ód
ulo
fo
rma
tea
do
r
ob
jeti
vo:
ap
lica
ap
óstr
ofe
s,
co
ntr
accio
ne
s,
y o
tro
s f
orm
ato
s.
entr
ada:
sa
lida
de
l m
ód
ulo
de
in
fle
xió
n
salid
a: g
rafo
qu
e r
esu
lta
de
ap
lica
r re
gla
s d
e a
po
str
ofa
ció
ny
co
ntr
acció
n (
y t
am
bié
n f
orm
as m
ás u
su
ale
s d
el p
asa
do
)
�
01
23
La
estu
dia
nt
ate
ngu
é
01
2L
’est
ud
ian
tv
a a
ten
dre
trad
ucc
ión
cas
tella
no
↔ ↔↔↔va
len
cian
om
ód
ulo
in
teg
rad
or
ob
jeti
vo:
co
nvie
rte
gra
fo c
on
tra
du
cció
n f
ina
l e
n f
orm
ato
te
xto
.
entr
ada:
salid
a d
el m
ódu
lo f
orm
ate
ador.
salid
ad
el s
iste
ma:
te
xto
en
Va
len
cia
no
, e
l cua
l e
s u
na
tra
du
cció
n d
el te
xto
Ca
ste
llan
o d
e e
ntr
ad
a
L’e
studia
nt
va
aten
dre
.
�
01
2L
’est
ud
ian
tv
a a
ten
dre
resu
men
•se
ha
in
tro
du
cid
o e
l p
ara
dig
ma
sin
táctico
de
RF
•co
mo
ca
so
pa
rtic
ula
r, s
e h
a in
tro
du
cid
o la
ta
rea
de
tra
du
cció
n a
uto
má
tica
•se
ha
pre
se
nta
do
la
arq
uite
ctu
ra d
e u
n s
iste
ma
bid
ire
ccio
na
ld
e t
rad
ucció
n a
uto
má
tica
SIS
HIT
RA
(IT
I,
UP
V,
20
01
-20
06
) C
aste
llan
o-V
ale
ncia
no
•se
ha
exp
lica
do
la
po
sib
ilid
ad
de
usa
r M
od
elo
s O
cu
lto
s d
e
Ma
rko
vy e
l A
lgo
ritm
o d
e V
ite
rbi, e
n u
na
de
su
s e
tap
as
•e
n la
pró
xim
a c
lase
, se
estu
dia
rán
am
bo
s m
éto
do
s,
así
co
mo
la
fo
rma
de
ap
lica
rlo
s a
la
ta
rea
de
tra
du
cció
n