Upload
zoltan-varju
View
894
Download
1
Embed Size (px)
Citation preview
Automatikus értékelés- és érzelemelemzés magyar nyelvű szövegeken
VARJÚ ZOLTÁNPrecognox Informatikai kft. [email protected]
A NYÍLT INFORMÁCIÓGYŰJTÉS FEJLŐDŐ TERÜLETEI nemzetközi tudományos-szakmai konferencia
2015. november 3-4.
SZABÓ MARTINA KATALIN• Precognox Informatikai kft.
[email protected] • Szegedi Tudományegyetem,
Szláv Intézet, Orosz Filológiai Tanszék [email protected]
R-index és nowcasting
Racionalitás és érzelmek
Racionalitás?
Descartes tévedése
• Érzelmek hiányában döntésképtelenek vagyunk, mivel nem tudjuk gyorsan rangsorolni a lehetséges alternatívákat
Darwin
•Az érzelmek kifejezéséről embernél és állatoknál
Ekman
• Hat alapvető emóció• Mikrokifejezések
akaratlan megjelenése az arcon
Mi a helyzet a nyelvvel?
• A gazdasági döntésekre nagy hatással vannak a gazdasági hírek• A mindennapi döntéshozatal során
gyorsan kell határoznia a szereplőknek• Találhatunk-e összefüggést a
hírekben megjelenő emóciók és a makromutatók alakulása között?
Az értékelés- és az érzelemelemzés
Az új megoldások
Cél és haszon
• A nyelvtechnológia részfeladatai• Céljuk: automatikus tartalmi elemzés nagy mennyiségű szövegről• Magas hasznosíthatóság különböző alkalmazásokban; pl. ogazdasági trendek azonosítása és előre jelzése;oA vásárlói hangulat mérése;opolitikusokkal, pártokkal szembeni aktuális beállítódás mérése;oegy adott társadalmi, gazdasági jelenségre reflektáló
közönséghangulat;opszichológiai szempontú szövegelemzés; ostb.
Bővebben az értékeléselemzésről•Másképpen: szentimentelemzés • A feladat: az értékelő véleményt kifejező tartalmak
automatikus kivonatolása. Pl.94 millió forintos vagyoni hátrányt okozott a győri
kórház gazdálkodásért felelős vezetője. (forrás: index.hu)
A közelmúltban ötletes szuperhősös könyvtartó duójával hívta fel magára a figyelmet (…) az ügyesen kitalált, rajzfilmfigura-szerű minimalista, mágneses sziluettcsalád gyerekeket és felnőtteket egyaránt képes levenni a lábairól. (forrás: index.hu)
És …
•…nem csak a detektálás, a következők is fontosak:oaz értékelés típusa (másképpen: polaritás): pozitív
vagy negatívointenzitásoaz értékelés tárgya (target)
Bővebben az érzelemelemzésről•A nyelvtechnológiában kisebb jelentőséget
tulajdonítanak a az emócióknak, mint a szentimenteknek. Az érzelemelemzés új irány máshol központi szerep, pl. viselkedéstudomány vagy pszichológia. •A magyar nyelvre: Precognox Informatikai kft.
foglalkozik•A feladat célja: a szövegekben tükröződő érzelmek
kivonatolása.
PéldákFélelem, aggodalom: Tisztaság- és illatmániásként először féltem a folyékony mosódiótól. Mi lesz, ha nem a megszokott tisztaság lesz az eredmény? (forrás: hazipatika.com)Bánat, elkeseredettség: Nem értem. Semmit nem fogyok, értem hogy mozogni kell, minden nap biciklivel járok, és gyaloglok sokat. (…) Már nagyon el vagyok keseredve. (forrás: gyakorikerdesek.hu)Meglepetés: Amikor a műtétem után terveztem a szezont, nem is hittem volna, hogy ilyen gyorsan javul az állapotom. Nincs semmilyen panaszom. (forrás: mob.hu)
A technikai háttér
• Szentiment- és emóciószótárak• Szentimentszótáraink: • pozitív polaritású kifejezések• negatív polaritású kifejezések
• Emóciószótáraink: • az Ekman-féle hat kategória szerint: ÖRÖM, DÜH, BÁNAT,
FÉLELEM, UNDOR, MEGLEPŐDÉS• nyolc kategória szerint: + FESZÜLTSÉG, VONZALOM
Értékelés- és érzelemelemzésa gyakorlatban
A vizsgált korpuszAz INDEX-korpuszoA szöveggyűjtés eszköze: az index.hu keresőjeoA szöveggyűjtés időpontja: 2015. január 2.oKritériumok: oazok a szövegek, amelyek tartalmazták a válság és a
recesszió szavak valamelyikétoa 2006. január 1. és 2014. december 31. közé eső
időszakbóloA korpusz mérete: összesen 1731 cikk
A fontosabb események és jelenségek, amelyekre figyelünk
országgyűlési választások
2006 zavargások
negatív gdp növekedési időszakok
Szófelhők a szentimentek
relatív arányából
Szentimentelemzés a korpuszon
Düh
Bánat
Félelem
Meglepődés
Undor
Öröm
Összegzés, távlatok
•Az érzelmek feldolgozása olyan folyamatokra is rámutat, amelyekre semmilyen más tartalomelemző megoldás nem•A targeteket kezelnünk kell az egyik
jelenlegi projektünk
Köszönjük a figyelmet!
Elérhetőségek:
http://precognox.com/http://kereses.blog.hu/
SEMANTIC SEARCHTEXT MINING
AGILE SOFTWARE DEVELOPMENT
• Phone: +36-82-222-193• Fax: +36-82-222-193• Email: info at precognox dot
com
• SZABÓ MARTINA KATALIN
• VARJÚ ZOLTÁ[email protected]