Come le imprese possono usare i discorsi 2018. 5. 20.آ  Fare sentiment analysis أ¨ difficile perchأ©,

  • View
    0

  • Download
    0

Embed Size (px)

Text of Come le imprese possono usare i discorsi 2018. 5. 20.آ  Fare sentiment analysis أ¨ difficile...

  • Come le imprese

    possono usare i discorsi

  • Perché distinguere dati fattuali e

    opinioni

    Fabrizio Sebastiani Gruppo Human Language Technologies – NeMIS Lab Istituto di Scienza e Tecnologie dell’Informazione Consiglio Nazionale delle

    Ricerche 56124 Pisa

  • Cos’è la Corporate Reputation?

    “Corporate reputation affects the way in which various stakeholders behave towards an organization, influencing, for example, employee retention, customer satisfaction and customer loyalty.”

    Corporate reputation: Meaning and measurement, Volume: 7, Issue: 2, Pages: 91-109, First published: 25 November 2005, DOI: (10.1111/j.1468-

    2370.2005.00109.x)

  • Cos’è la Corporate Reputation?

    • Post and Griffin 1997  “reputation is a synthesis of the opinions, perception and

    attitudes of an organization's stakeholders including employees, customers, suppliers and investors and community”

    • Fombrun 1996  “a perceptual representation of a company's past actions

    and future prospects that describe the firm's appeal to all of its key constituents”

    • Fombrun et al. 2000  “corporate reputation represents a collective and

    multidimensional construct which is an aggregated perception of many individuals”

    Corporate reputation: Meaning and measurement, Volume: 7, Issue: 2, Pages: 91-109, First published: 25 November 2005, DOI: (10.1111/j.1468-

    2370.2005.00109.x)

  • Cos’è la Corporate Reputation?

  • Cos’è la Corporate Reputation?

  • User Generated Content

  • Net-consumatori

    Della Volpe, M. (2013). Imprese tra web 2.0 e big data. Nuove frontiere per innovazione e competitività, CEDAM.

    Anche se il negozio fisico resta ancora un luogo importante, • il 62% degli utenti su scala mondiale commenta un prodotto o servizio

    online dopo l’acquisto.

    • se si aggiungono post e tweet il dato arriva al 69%

    • il 55% degli utenti ibridi (coloro che si informano in rete ma poi effettuano l’acquisto in un punto vendita) postano commenti.

    www.globalwebindex.com

  • Net-consumatori

    Della Volpe, M. (2013). Imprese tra web 2.0 e big data. Nuove frontiere per innovazione e competitività, CEDAM.

    Anche se il negozio fisico resta ancora un luogo importante,

    dobbiamo prendere seriamente in considerazione il modello di impresa che emerge dall’adozione strategica

    dei social media.

    www.globalwebindex.com

  • Filtrare l’informazione automaticamente

    Fatti Opinioni

    Gli spinaci sono ricchi di ferro

    Gli spinaci hanno un brutto sapore

  • Filtrare l’informazione automaticamente

    Fatti Opinioni

    Gli spinaci sono ricchi di ferro

    • Oggettivi

    • Ritraggono la realtà

    • Possono essere verificati

    • Presentati con obiettività

    Gli spinaci hanno un brutto sapore

    • Soggettive

    • Interpretano la realtà

    • NON possono essere verificate

    • Presentate attraverso una valutazione

  • Filtrare l’informazione automaticamente

    Fatti Opinioni

    • Data Mining

    • Information Retrieval

    • Information Extraction

    • Opinion Mining

    • Sentiment Classification

    • Feature-based Sentiment Analysis

  • Filtrare l’informazione automaticamente

    Metodi Rule-Based

    cercano di imitare il modo in cui l’uomo utilizza e

    comprende il linguaggio, riproducendo le strutture sintattiche che sono alla

    base di questo processo di comprensione, costruendo

    risorse lessicali come i dizionari elettronici, le

    tassonomie, le ontologie

    Metodi Stocastici

    trattano la lingua come un insieme di parole,

    quantificando queste in modo matematico e cercando di estrarre

    informazioni senza la necessità di individuare le

    strutture sintattiche o, addirittura, cercando di

    rendere capace la macchina stessa di

    imparare la sintassi.

  • Filtrare l’informazione automaticamente

    Quali Vantaggi?

    • Ads placement

    • Text summarization

    • Recommendation systems

    • Flame and cyberbullying detection

    • Literary reputation tracking

    • Political texts analysis

  • Cos’è l’Analisi dei Sentimenti

    La Sentiment Analysis (SA) consiste nel trattamento automatico di opinioni e sentimenti espressi all’interno di testi non strutturati.

    Sono sinonimi della SA opinion mining, subjectivity analysis, or appraisal extraction.

    Alcune sfide nella ricerca sulla SA: • Sentiment and Subjectivity Classification,

    • Feature-based Sentiment Analysis,

    • Sentiment Analysis of comparative sentences,

    • Opinion search and retrieval,

    • Opinion holders, Opinion features and opinion targets extraction.

    15

  • Cos’è un’opinione?

    oj, fjk, ooijkl, hi, tl

    dove

    oj è l’oggetto sul quale viene espressa l’opinione

    fjk rappresenta le caratteristiche (features) dell’oggetto

    ooijkl è l’orientamento (positivo o negativo) dell’opinione

    hi è opinion holder, colui che esprime l’opinione

    tl rappresenta il tempo in cui l’opinione viene espressa

    16

    Liu, B. (2010). Sentiment analysis and subjectivity. Handbook of natural language processing, 2, 568.

  • Cos’è un’opinione?

  • Cos’è un’opinione?

  • Cos’è un’opinione?

  • Cos’è un’opinione? oj

  • Cos’è un’opinione? oj, fjk

  • Cos’è un’opinione? oj, fjk, ooijkl

  • Cos’è un’opinione? oj, fjk, ooijkl, hi

  • Cos’è un’opinione? oj, fjk, ooijkl, hi, tl

  • Cos’è un’opinione? I dati non strutturati

  • Cos’è un’opinione? I dati non strutturati

  • Cos’è un’opinione? I dati non strutturati

  • Indicatori di Sentimento

    • Parole dotate di

    Orientamento Semantico

    1. gentile +2 2. pulito +2 3. abbondante + 4. buono +2 5. esagerato + 6. spettacolare +3 7. lussuoso +2 8. bene +2

    Cos’è un’opinione? Strutturare i dati

  • Indicatori di Sentimento

    • Espressioni dotate

    di Orientamento Semantico

    Contextual Valence Shifters: 1. molto gentile 2. non spettacolare 3. non lussuoso 4. avere da ridire sul prezzo

    Dipendenza dal dominio: 1. hotel molto caratteristico 2. Colazione abbondante 3. arredo con tutto

    l’occorrente 4. prezzo esagerato

    Cos’è un’opinione? Strutturare i dati

  • Sentiment Polarity Classification

    Correzione. Polarity Switching: 4 stars → 2 stars

    Ridimensionamento. Polarity Shifting : 4 stars → 3 stars

  • Sentiment Polarity Classification

    Correzione. Polarity Switching: 4 stars → 2 stars

    Ridimensionamento. Polarity Shifting : 4 stars → 3 stars

  • Alcuni task della Sentiment Analysis

  • Sentiment Polarity Classification

  • Sentiment Polarity Classification

    Classificare interi documenti in base alle seguenti macro-classi • Positivo • Negativo • Neurale

    Ciò che differenzia questo task dal comune Topic Detection and Classification è il fatto che le categorie in gioco non sono semanticamente slegate l’una rispetto all’altra. Tali categorie possono essere rappresentate come:

    • Un’ opposizione binaria • Una rating scale • Un continuum

  • Feature-based Sentiment Analysis

  • Feature-based Sentiment Analysis

    T=O(f)

    F = {f1, f2, . . . , fn}

    Wi = {wi1, wi2, . . . , wim} Ii = {ii1, ii2, . . . , iiq}

    Sintetizzare il contenuto delle opinioni espresse nei testi individuando le singole caratteristiche che rappresentano i punti di forza e/o le debolezze discusse nell’opinione. La relazione intercorrente tra features e opinione viene perfettamente espressa grazie al concetto di Target (T) dell’opinione, descritto dalla seguente funzione:

    Ogni feature può essere descritta da sottoinsiemi di altre features:

    Il Target può essere descritto nei testi da indicatori diretti (W) o indiretti (I)

  • Feature-based Sentiment Analysis

    Un esempio di testo annotato

  • Sentiment Role Labeling

  • Sentiment Role Labeling

    Il task del Semantic Role Labeling (SRL) ha come finalità il mapping degli elementi sintattici localizzati nei testi liberi e le loro rappresentazioni semantiche. Esse verranno poi etichettate in base ad appropriati ruoli tematici o semantici. Il Sentiment Role Labeling focalizza l’analisi sui frame semantici relativi alla sfera della soggettività.

  •  Frame Semantics  Sentiment