COS’È E A COSA SERVE LA SENTIMENT ANALYSIS?
Nel senso più ampio, la Sentiment Analysis (o opinion mining) è una disciplina finalizzata al ritrovamento di documenti opinionati per fornire sempre più accurate valutazioni sui “sentimenti” in essi contenuti.
Da un punto di vista tecnico, essa ha come obiettivo quello di scoprire, all’interno di testi o gruppi di parole, pattern che definiscono il sentimento di una persona verso un prodotto/servizio; dunque, un modello di Sentiment Analysis è finalizzato al riconoscimento, all’estrazione, all’elaborazione ed all’analisi, all’interno di contenuti web, dei “sentimenti” degli utenti riguardo un particolare prodotto/servizio.
La presa di coscienza che gran parte del tempo destinato alla raccolta di informazioni è finalizzato a capire cosa pensa la gente ha fatto salire l’attenzione del mondo scientifico verso questo tema; conseguentemente, è aumentato l’interesse verso le tecniche e gli approcci da utilizzare per realizzare sistemi automatici incentrati sulla scoperta delle opinioni all’interno di testi.
Naturalmente, anche il mondo dell’impresa non è rimasto indifferente a queste problematiche; anzi, spinge sempre di più per avere strumenti automatici più raffinati e mirati a specifiche problematiche ed i motivi sono essenzialmente due: il primo è quello di riuscire ad andare incontro prima di altri alle esigenze ed ai gusti delle persone e potenziali clienti estraendo informazioni dai sempre più diffusi siti web su cui gli utenti hanno la possibilità di rilasciare contenuti; queste informazioni vengono analizzate dalla Sentiment Analysis sia dal punto di vista orientativo che dal punto di vista dell’intensità emotiva. Il secondo è quello di riuscire a monitorare un sentimento negativo che si sta diffondendo ed elaborare, quindi, le giuste strategie per combatterlo (brand reputation management).
L’opinion mining è applicabile a qualsiasi ambito, dal marketing alla politica, dalla finanza alla sociologia, ecc.
La Sentiment Analysis fonda le sue origini nelle tecniche di Natural Language Processing (NLP) e una opinione viene definita da Bing Liu nel suo “Handbook of Natural Language Processing” come una quintupla (oj, fjk, soijkl, hi, tl) dove:
- oj è l’oggetto in questione
- fjk è una caratteristica di oj
- soijkl, è il valore del sentimento dell’opinione della persona hi, sulla caratteristica fjk dell’oggetto oj al tempo tl
Inoltre, essa si basa sulle tecniche di linguistica computazionale e, naturalmente, di text mining, di cui si può dire che è una specializzazione. A livello di metodi, essa è fortemente legata al machine learning con cui condivide alcuni strumenti quali, per esempio, quelli di latent semantic analysis.
I tool attualmente in commercio si basano, quindi, su incroci di tecniche quali l’analisi sintattica e semantica del testo, l’interpretazione del linguaggio scritto, l’individuazione di idiomi, l’analisi statistica e la ripetizione di parole chiave. La maggior parte di questi tool utilizza algoritmi di classificazione sia per risolvere il problema di discriminare i documenti contenenti fatti da quelli contenenti opinioni che per risolvere il problema di individuare le polarità positive/negative all’interno del testo, graduandone l’intensità.