STANDARD DI QUALITÀ

  • Home
  • /
  • Norme di Qualità per la Social Media Research

Norme di Qualità per la Social Media Research

DOCUMENTI ALLEGATI

Norme di Qualità Assirm per la Social Media Research
Le presenti Norme sono state ratificate in sede di Assemblea degli Associati del 10 Dicembre 2015 e aggiornate nel Giugno 2018.

NORME DI QUALITA' PER LA SOCIAL MEDIA RESEARCH

1. Introduzione
Il documento in essere rappresenta il codice etico e le norme Assirm per la conduzione di ricerche di mercato, sociali e di opinione che hanno come oggetto i contenuti generati dai vari stakeholder sui social media in relazione a determinati argomenti o fenomeni (da qui in poi genericamente indicate come "Social Media Research").

La continua evoluzione tecnologica e la viralità che lo caratterizzano, hanno reso il web un canale privilegiato per la rilevazione di dati ed informazioni. La SMR (Social Media Research) coinvolge un complesso di strumenti e metodi di ricerca in costante evoluzione,

Le indicazioni contenute nel documento si ispirano agli standard di settore ed offrono per la SMR un approccio esemplificativo degli aspetti tecnici per la realizzazione di un buon lavoro di ricerca.

Social media sono definiti come piattaforme e tecnologie presenti in internet che permettono l'interazione degli utenti e/o facilitano la creazione e lo scambio dei contenuti generati (messaggi, immagini, video, azioni, ecc.). Nonostante il raggio d'azione continui ad espandersi, attualmente gli ambiti più frequenti sono:

  • forum/ community di discussione tematica;
  • blog;
  • social network (ad esempio Facebook) / piattaforme di collaborazione e/o comunicazione di gruppo o pluri-personale (ad esempio Twitter);
  • social news, ovvero testate giornalistiche online che permettono l'inserimento di commenti da parte degli utenti, in calce all'articolo del giornalista;
  • siti di condivisione di video/foto (ad esempio YouTube) e/o recensioni relative a prodotti, servizi, esperienze, ecc. (ad esempio Tripadvisor);
  • siti di raccolta di domande e risposte tra utenti (ad esempio Yahoo Answers).

La Social Media Research (SMR) comprende tutte quelle tecniche d'indagine che rilevano dati sulle fonti online di natura principalmente social, ovvero piattaforme virtuali, generalmente non finalizzate alla ricerca di mercato, che gli utenti adottano per creare e condividere contenuti testuali, immagini, video e audio.


I requisiti generali contenuti nelle Norme di Qualità Assirm si applicano anche alle diverse tecniche di Social Media Research. Questo paragrafo descrive la maniera in cui tali requisiti dovrebbero essere resi operativi nella raccolta di dati provenienti dai social media per scopi esclusivi di ricerca di mercato, sociale e di opinione, riconoscendo l'esistenza e distinguendosi dalle diverse e molteplici attività rese possibili dai social media (ad esempio l'assistenza ai clienti, la gestione delle pubbliche relazioni, ecc).

2.1 Essere conformi con la legge
La Società si impegna a trattare tutte le informazioni fornite dal Cliente e rilevate per suo conto in maniera strettamente riservata e a non renderle note a terzi senza la sua autorizzazione. Le informazioni riservate vanno conservate in modo sicuro, in conformità con la normativa sulla sicurezza dei dati (Riservatezza della ricerca). I risultati di ricerca, ottenuti dalla Società per aver condotto una particolare ricerca “ad hoc”, sono di proprietà del Cliente e non devono essere utilizzati per scopi diversi da quello della ricerca stessa o in ricerche per altri Clienti senza autorizzazione, salvo accordi diversi. I risultati di una ricerca multiclient sono di proprietà della Società che può cederli o utilizzarli per uno o più Clienti senza autorizzazione, sulla base dei contratti stabiliti con ciascuno di essi.

La ricerca attraverso i social media deve attenersi alla normativa sulla privacy nazionale ed internazionale e ai requisiti rilevanti per la notifica, il consenso, l'accuratezza, la sicurezza e l'accesso inerente la raccolta e l’archiviazione delle informazioni personali identificative. Accedendo virtualmente ai vari siti/piattaforme online, i ricercatori sono soggetti ai Termini di Utilizzo (TdU) e alle Condizioni dei proprietari di tali siti/piattaforme, come le clausole sui diritti di proprietà intellettuale che proibiscono esplicitamente la copia non autorizzata di materiale, o i divieti di qualunque tipo di raccolta ed analisi dei dati senza averne il permesso. I TdU di solito trattano argomenti come le questioni di copyright e l'uso di materiale reperibile dal sito. Spesso, il proprietario del sito web è anche il proprietario del copyright. Ad ogni modo le leggi sul copyright sono complesse e variano a seconda della giurisdizione. I ricercatori devono esserne a conoscenza e devono rispettare le leggi vigenti in materia. Nella maggior parte dei casi, tuttavia, i dati per la Social Media Analysis vengono reperiti tramite cosiddetti software di crawling, ossia programmi volti a intercettare e scaricare i flussi di discussione sui social media corrispondenti a determinati parametri di ricerca. Oggi la rete rende disponibili molteplici piattaforme di crawling, anche gratuite, che si prestano a questo compito di raccolta. Tutti i contenuti ai quali i software di crawling accedono online e rendono fruibili per i ricercatori sono rigorosamente contenuti pubblici, ossia pubblicati dagli utenti in ambienti di pubblica visibilità. Non saranno recuperati in automatico dati provenienti da profili privati e chiusi dei singoli utenti oppure da siti per i quali è previsto un login per l’accesso. Vi possono essere tuttavia casi in cui è necessario accedere a contenuti provenienti da una Community per la quale è prevista la registrazione. Tale procedura è possibile solo previo accordo con l’amministratore della Community stessa, che procederà a regolarizzare e tutelare la privacy dei propri iscritti. È responsabilità dell’amministratore del crawling inoltre controllare le singole condizioni che si applicano al contenuto di un determinato social media che viene utilizzato per la raccolta di dati e rispettare le richieste di privacy (incluse le richieste di file robot.txt, pagine sicure, ecc.). Essi devono chiedere il permesso di acquisire contenuti da qualunque fonte e nei casi in cui ciò possa costituire una violazione dei TdU devono sempre e comunque rispettare le regole di quel servizio.

2.2 Consenso e notifica

Le Norme di Qualità Assirm affermano che la cooperazione dei partecipanti alla ricerca deve essere basata su informazioni adeguate circa lo scopo e la natura della ricerca (4.3.2. Informativa al rispondente) e che bisogna ottenere il consenso di questi a partecipare. Nonostante sia potenzialmente semplice ottenere il consenso dei membri delle community a scopo di ricerca di mercato, sociale e di opinione, il problema si pone per altri social media, i cui utenti generalmente non vengono informati in anticipo, o non hanno acconsentito all'uso dei dati per delle ricerche, a meno che ciò non sia esplicitamente menzionato nei TdU. Data la non consapevolezza degli utenti web ad essere “ascoltati” da parte di società di ricerca, l’accorgimento che i Social Media Analyst devono sempre seguire è trattare tutti i dati raccolti in modo anonimo. Ogni riferimento a contenuti prodotti dagli user all’interno di report di ricerca per i clienti devono nascondere i dati sensibili e anagrafici degli utenti (vedi oltre, tecniche di “masking”). Gli screen-shot tratti dal web riprodotti nei report per il cliente sono dunque sempre anonimizzati, eliminando nome e cognome dell’interessato. Si evidenzia che i sistemi di crawling in commercio e in uso non consentono di impostare filtri e, pertanto non consentono in automatico di “rimuovere i dati identificativi quali nome, foto, collegamenti al profilo dell'utente, ecc.”. Per quanto riguarda il rispetto della normativa sul copyright (diritti d’autore) e dei termini di utilizzo (TdU), si rinvia al caso specifico del servizio utilizzato. In ogni caso, la documentazione relativa all’utilizzo di tali servizi deve essere disponibile nella cartellina di ricerca o in un’area comune, con le relative analisi legali e organizzative. Per quanto riguarda la privacy si vedano anche le misure definite nelle procedure interne definite per la privacy (es. Documento programmatico sulla Sicurezza o equivalente), e la normativa applicabile (D.Lgs. 196/2003) e per quanto riguarda i “cookies”, art. 122 del D.Lgs. 196/2003, dal D.Lgs. 69/2012 e dal Provvedimento del Garante Privacy n. 229/2014. Per quanto riguarda la riservatezza della ricerca, si veda anche il punto 2.2 delle Norme di Qualità Assirm.

2.3 Protezione dei dati personali

La legislazione sulla privacy (ai sensi del d.lgs. n. 196/2003) si applica solo ai dati personali identificativi e non ai dati tramite i quali è impossibile identificare un soggetto. Le piattaforme di social media offrono molte opportunità di visualizzazione di dati personali identificativi. Alcuni soggetti postano informazioni che svelano apertamente la propria identità; essi ne sono consapevoli e hanno delle aspettative limitate in materia di privacy. Altri, invece, non sono consapevoli del fatto che i servizi che stanno usando siano aperti ad altri, anche per la raccolta di dati, oppure pensano di non essere riconoscibili, mascherando la propria identità con un nickname o uno pseudonimo. Ad ogni modo, oggigiorno esistono servizi online che rendono possibile in molti casi l'identificazione di chi posta un determinato contenuto, ad esempio grazie allo user name o ai commenti pubblicati in seguito al post, e possono collegare l’utente a molti altri dati identificativi, inclusi l'indirizzo, il numero di telefono, il reddito approssimativo e i dati socio-demografici. Detto ciò, appare chiaro che i dati non possano essere resi anonimi al 100% su internet, semplicemente rimuovendo lo user name e l'URL collegato al commento. Quindi, se i ricercatori intendono citare all'interno di un report dei commenti pubblici, essi devono prima controllare che l'identità dell'utente non sia facilmente rintracciabile usando i suddetti servizi disponibili in rete. Se questa ipotesi è verosimile, i ricercatori devono sforzarsi di ottenere il permesso dall'utente, al fine di poterlo citare, o, in caso contrario, di mascherare il commento, in modo che l'identità di chi lo ha postato non possa essere svelata. Il "masking" è una tecnica tramite la quale i dati originali vengono talmente modificati da rendere difficilissima la ricerca degli stessi in rete, tramite un motore di ricerca. In tal modo, anche l'identità dell'utente che li ha originati è difficile da scoprire. Questa è una tecnica molto utile per assicurarsi che l'anonimato delle persone che commentano sia rispettato, nei casi in cui:

1. il ricercatore non ha cercato di ottenere il permesso;
2. il commento sarebbe facilmente rintracciabile tramite un servizio di ricerca.

Il masking può essere applicato in vari gradi, che vanno dal semplice cambiamento di qualche parola tramite l'alterazione di alcuni elementi chiave di un commento, fino all'abbreviazione. E' responsabilità del ricercatore decidere quale grado sia il più appropriato. Alcuni fattori da tenere in considerazione al riguardo sono:

• se l'argomento di discussione è delicato o personale;
• se vi è uso di linguaggio offensivo;
• se ci sono riferimenti contro la legge;
• se ci sono elementi che potrebbero creare imbarazzo o avere un impatto negativo sulle opportunità di carriera;
• se ci sono informazioni identificative;
• se ci sono dati a proposito di altre persone che non siano già stati resi pubblici.

Nel caso di foto o video pubblici bisognerebbe tenere in considerazione alcune tecniche come ad esempio la dissimulazione dei volti tramite l'uso di pixel, nei casi in cui il masking è necessario. E' importante considerare che il masking probabilmente non sarà sufficiente in molti contesti business-to-business oppure quando la ricerca viene condotta all'interno di un gruppo molto ristretto, visto che l'identificazione è molto semplice, nonostante si cerchi di mascherare i dati identificativi. Quando i ricercatori inseriscono un commento in un report per un Cliente è necessario indicare chiaramente se sono state utilizzate delle tecniche di masking. Se il ricercatore decide di chiedere il permesso dell'utente per citarlo, egli deve rispettare le normative vigenti nel paese dove è residente l’utente; deve inoltre rassicurare l'utente sul fatto che queste vengano rispettate e deve spiegare chiaramente e onestamente lo scopo del suo lavoro. Si dovrebbe dare l'opportunità all'utente di verificare la buona fede del ricercatore, se lo desidera, prima di autorizzarlo a procedere. Nei casi in cui i ricercatori utilizzano dei servizi per arricchire i commenti dell’utente con dati demografici ad esso associati (ad esempio informazioni tratte dai profili personali), essi dovrebbero usare queste informazioni solo per scopi di classificazione della ricerca. Visto che questi servizi spesso forniscono informazioni identificative personali (come i numeri di telefono e gli indirizzi e-mail), questi potrebbero permettere un collegamento non intenzionale dei dati di ricerca ai dati personali e ciò non deve assolutamente essere usato nell'analisi o trasmesso a terzi.


2.4 Assicurarsi di non arrecare danno
Un principio chiave stabilito e condiviso dalle Norme di qualità Assirm è che i rispondenti non debbono mai ed in alcun modo subire conseguenze negative, come risultato diretto della loro partecipazione ad una ricerca. Il rischio maggiore nella ricerca tramite i social media è collegare alla rivelazione accidentale l'identità degli utenti, che non avevano compreso di partecipare ad una ricerca e che quindi non si aspettavano di poter essere identificati. Ancora una volta, per assicurarsi che gli utenti non subiscano danni a causa delle attività di ricerca, bisogna rispettare un principio di cautela, rimuovendo ogni dato personale identificativo al più presto possibile e prendendo in considerazione l'attuazione dei controlli di qualità necessari. In tal senso i ricercatori devono essere particolarmente cauti quando conducono ricerche in cui sono coinvolti bambini o minori (4.3.3. Raccolta dati da minori o da rispondenti vulnerabili). Questa è una questione particolare nel caso di piattaforme social, alle quali anche i bambini possono prendere parte. Quando dei dati provengono probabilmente da un bambino, i ricercatori devono prestare particolare attenzione alla dissimulazione delle risposte, al fine di assicurare che l'utente non possa essere identificato, oppure ottenere il permesso da un genitore o dal tutore legale per raccogliere ed usare i dati identificativi. Anche la SMR condotta nel campo farmaceutico necessita di particolari procedure. La normativa sulla farmacovigilanza prevede infatti che ogni cosiddetto “evento avverso” su un farmaco rilevato all’interno delle conversazioni web debba essere segnalato agli appositi uffici della casa farmaceutica che ha commissionato l’indagine e proprietaria del farmaco in questione. Per evento avverso si intende qui un qualsiasi fenomeno clinico spiacevole che si presenta durante un trattamento con un farmaco, ma che non abbia necessariamente un rapporto di causalità (o di relazione) con il trattamento stesso. Le aziende hanno diretta responsabilità nel monitorare ciò che avviene sulle proprie properties digitali. Nel momento in cui invece si affidano a società di ricerca per il monitoraggio del conversato sui farmaci su forum e social network, diviene responsabilità della Società stesso attenersi alle procedure della farmacovigilanza, così come comunicate e inoltrate dall’azienda. Le conversazioni online sono infatti spesso ricche di dettagli sul contesto della reazione avversa, sulle comorbilità, sugli usi off label, sulle interazioni tra farmaci. Eventuali post o commenti che riportino perciò un evento avverso, un reclamo su prodotto o altro che l’azienda ritiene rilevante, devono essere inoltrati da parte del ricercatore all’azienda farmaceutica che provvederà ad attivare la segnalazione al reparto di farmacovigilanza, seguendo le tempistiche e le modalità previste dalla legge. Nel caso di rintracciamento di un evento avverso sarà peraltro richiesto e concesso al ricercatore di raccogliere e inoltrare all’azienda farmaceutica le informazioni personali (se disponibili) dell’autore del post o del commento essenziali per poter procedere con la segnalazione.

2.5 Reputazione del Cliente e del settore
I ricercatori e tutti le componenti partecipanti alla ricerca si impegnano a trattare tutte le informazioni fornite dal Cliente e rilevate per suo conto in maniera strettamente riservata, a non renderle note a terzi senza la sua autorizzazione, a non fare nulla che possa danneggiare la sua reputazione. In generale occorre sempre tenere a mente e rispettare i principi chiave del Codice di Etica Professionale ASSIRM nel lavoro condotto, cercando di evitare attività e pratiche che possano minare la fiducia del pubblico nella ricerca di mercato, sociale e di opinione. La Società risponde interamente di tutti i servizi svolti in relazione alla ricerca, incluse le parti del lavoro o servizio affidate a fornitori, singoli professionisti o società (Outsourcing) per le seguenti categorie di servizi, con impatto determinante sulla qualità della ricerca, tranne i casi in cui la scelta del fornitore sia del Cliente:

• Traduttori
• Centri di trattamento dati (Data Entry, etc.)
• Tool e software per il crawling, la normalizzazione e l’elaborazione dei dati
• Altre Società di ricerca
• Consulenti

La Società deve documentare per le categorie di servizi sopra indicate le modalità per:

• selezionare e qualificare i fornitori;
• stabilire i rapporti contrattuali con essi;
• fornire agli stessi le necessarie istruzioni per l’esecuzione del servizio loro affidato;
• controllare la qualità del servizio fornito;
• valutare le prestazioni dei fornitori con cadenza almeno annuale.
Come precedentemente indicato la SMR comprende tutte quelle tecniche d’indagine che rilevano dati sul web ed in particolare nei social network, ovvero su piattaforme virtuali della rete, che le persone adottano per condividere contenuti testuali, immagini, video e audio. Nell’ambito di tale tipologia di ricerca sono utilizzate terminologie specifiche.

3.1 Definizioni specifiche

• Crawling o Scraping è il processo di estrazione dei dati dalle fonti originarie di pubblicazione, ovvero i social media, a scopo di analisi. I dati raccolti dai social media si riferiscono ai contenuti (post, commenti, foto, ecc.) che gli utenti generano, arricchiscono o condividono mentre interagiscono sui social media. La raccolta di dati include spesso dati identificativi degli utenti.

• Post è ogni messaggio originario pubblicato su un social media (può essere un post su Facebook, un post di un blog, un articolo sul sito interattivo di un quotidiano online, un tweet, un post su Instagram, etc.).

• Interazioni sono le attività che gli utenti possono effettuare su un post originario, quali like, commenti, risposte o condivisioni.

• Engagement è una misura di quanto un post originario è stato in grado di coinvolgere altri utenti attraverso le loro interazioni.

• Social Properties sono i canali ufficiali delle aziende o brand o personaggi sui social network.

• Masking è una tecnica con la quale i dati originari estratti dai social media, come i post, i commenti, le foto o i video, sono alterati e anonimizzati fino al punto in cui non possono più essere tracciati o attribuiti all’utente che li ha pubblicati in origine.

• Community di ricerca è una community online creata con lo scopo specifico di ospitare ricerche di mercato, sociali e di opinione.

• Utente è un soggetto o un'organizzazione da cui si raccolgono informazioni per scopi di ricerca di mercato, indipendentemente dal fatto che esso ne sia consapevole o inconsapevole. Nel contesto della SMR, l'utente può anche essere menzionato come Autore, Membro, Fan, Follower o Poster (colui che posta un contenuto su un social media), termini equivalenti a quello di Rispondente o Partecipante per altre modalità di ricerca di mercato, sociale e di opinione di tipo tradizionale.

• Influencers è un utente specifico che ha una capacità di impatto sul conversato oggetto di studio in termini di attività svolta (numero di post scritti sull’argomento) e di livello di engagement prodotto (interazioni ricevute).

• Sentiment è la valenza positiva/negativa o neutra che il messaggio rilevato contiene in termini di opinione espressa dall’autore sull’oggetto di studio.


3.2 Strumenti di ricerca
Al pari di questionari, piani di campionamento, tracce dei focus group nella ricerca tradizionale tali elementi della SMR, devono essere dettagliati, verificati e validati, internamente alla Società e, dove richiesto, dal Committente mediante approvazione formale. Come detto, nella maggior parte dei casi i ricercatori raccolgono i dati rilevanti per il monitoraggio attraverso il ricorso a specifici software di crawling o scraping. La maggior parte dei tool gratuiti sono dedicati ad analizzare i flussi e le metriche di un particolare tipo o sottoinsieme di social media. Le versioni più evolute sono a pagamento e consentono di andare oltre il dato grezzo e fornire intelligence alle aziende, leggendo dentro e oltre una conversazione, un commento, un like o un retweet. Ovviamente anche le piattaforme di crawling a pagamento differiscono sulla base di una serie di parametri, quali ad esempio la tecnica di data capture. Ci sono due approcci al data collection, ognuno dei quali genera impatto sulla qualità e quantità dei dati restituita. Vi sono piattaforme che lavorano su White List, ovvero su un perimetro prestabilito di siti legittimati sui quali vengono effettuate le ricerche. Tale approccio garantisce da un lato dati mirati e puliti, ma limita i risultati in termini di quantità, creando in altre parole il rischio di “perdersi qualcosa”. Le piattaforme cosiddette di crawling spediscono i crawlers su un database di dati registrati attraverso lo spazio dei pubblici domini online. Tale approccio consente di costruire un record ampio di discussioni online, seppur aumenti il rischio di catturare anche contenuti spam o di bassa qualità. Vi è anche un tipo di raccolta di dati dai social media, che si aggancia ai risultati ottenuti dai motori di ricerca (Google, Yahoo, …). Gli spider lavorano utilizzando i primi risultati ottenuti dai motori di ricerca web (as Google). Restituisce gli hot topic legati ai ranking dei motori di ricerca in un preciso momento temporale, legandosi dunque in maniera parziale ai criteri di ranking dei motori, nonché al limite impostato nello scaricare i risultati (solitamente le prime decine di pagine di risultati). I software di crawling vanno in ogni caso impostati dai ricercatori attraverso la definizione di una serie di parametri, quali:

• IL PERIMETRO DELLE FONTI:
la scelta, la numerosità e le peculiarità delle fonti monitorate, in particolare quando si vuole focalizzare l’attenzione su alcune fonti social specifiche della rete in cui rilevare i comportamenti e/o le reazioni.

• STIMOLI:
la scelta, la sequenza e gli scopi degli stimoli somministrati, in particolare quando si vogliono analizzare le differenze fra i contenuti spontanei e sollecitati degli utenti, per rilevarne insight specifici.

• LE QUERY:
l'interrogazione da parte del ricercatore di uno o più database o software di crawling attraverso la combinazione dei seguenti strumenti:
o KEYWORD:
identificazione delle parole chiave più appropriate e pertinenti l’oggetto d’indagine, compresa la gestione di omonimi, sinonimi, misspelling, neologismi e ambiguità linguistiche
o SINTASSI
Spesso le keyword vengono combinate tra di loro attraverso l’uso di una sintassi specifica che ricorre ad esempio all’uso di operatori booleani (AND, OR, NEAR, AND NOT).

• I FILTRI:
identificazione degli ambiti di ricerca mediante filtri di natura geografica (es. mercato: Italia), linguistica (es. lingua: italiano), e di periodo (indagine retroattiva, su dati riferiti al passato, oppure ongoing, su dati aggiornati periodicamente, oppure real time, su dati aggiornati in tempo reale). È possibile anche filtrare per tipologia di fonte (es. solo social network o solo forum). In alcune piattaforme più evolute è possibile anche filtrare la ricerca solamente sulle social properties oppure sul resto del web.

3.3 Analisi volumetrica
Ciascuna SMR produce (reperisce) una certa mole di contenuti che richiedono la presentazione di un resoconto volumetrico che ne identifichi a livello quantitativo gli output principali e la bontà della ricerca:

• quanto se ne parla (es. totale numero di messaggi rilevati);
• dove se ne parla (es. totale fonti, distribuzione per tipo di fonte e per singolo dominio);
• chi ne parla (es. numero di autori unici e identificazione autori più attivi);
• di che cosa si parla (es. identificazione di termini e concetti più ricorrenti);
• come se ne parla (es. qual è la distribuzione delle opinioni positive, negative, neutre e interrogative).

Tale analisi volumetrica dell’indagine è ulteriore elemento chiarificatore della buona impostazione e della qualità della ricerca stessa e pertanto va verificata e validata, internamente alla Società e dove richiesto dal Committente.

All’analisi volumetrica o quantitativa può essere affiancata, in alcuni progetti di ricerca, anche l’analisi qualitativa delle discussioni, tramite lettura da parte dei ricercatori di un sotto-insieme o della totalità dei messaggi raccolti. I ricercatori procedono così, attraverso una griglia di analisi tipica delle ricerche qualitative, alla interpretazione del materiale raccolto e alla stesura di un report volto alla generazione di insight per il committente. La costruzione dell’eventuale sotto-insieme da analizzare in profondità può essere fatta attraverso tecniche di campionamento dei messaggi. Una tecnica diffusa è quella del campionamento semplice, che riproduca dunque l’universo di riferimento del totale messaggi raccolti. Ma il ricercatore, in accordo con il committente, può procedere anche nell’analisi qualitativa attraverso carotaggi specifici su alcune fonti o piattaforme. L’estrazione del campione di messaggi ha anche la funzione di agevolare l’analisi del sentiment, qualora non si ricorra a motori automatici. Non tutte le piattaforme di crawling infatti possiedono un motore di sentiment automatico o talvolta il ricercatore ritiene più efficace procedere con il “tagging” manuale dei messaggi.

3.4 Tool informatici e Metodologie di analisi
Per definire e rendere efficace l’output della ricerca nel progetto di ricerca vanno descritti i software utilizzati e le metodologie di analisi applicate. Si tratta di sintetiche descrizioni dei tool e delle metodologie per garantire la comprensione dell’approccio e la fruibilità dei risultati. Tali descrizioni descrivono e spiegano, ove presenti, i seguenti elementi:

• le metriche per l’analisi dei contenuti, la tipologia di motore di sentiment, le modalità di misurazione della polarità dei contenuti;

• le tecniche di analisi testuale, linguistica e semantica impiegate;

• i modelli di selezione dei contenuti e di elaborazione/interpretazione dei dati.

I software che possono essere utilizzati nella SMR sono i seguenti:
• software di crawler o scraping;
• software di analisi del sentiment;
• software di text mining o analisi linguistica;
• programmi di analisi statistica.
Tutti i progetti di ricerca devono essere documentati accuratamente, come accurate, trasparenti e oggettive devono essere le documentazioni inerenti le varie fasi di sviluppo del progetto dal briefing del Cliente al report finale di ricerca. Più specificamente, come avviene per tutti i progetti di ricerca, le registrazioni ed i documenti devono essere identificati e conservati secondo le modalità di seguito indicate:

• ogni ricerca deve avere una identificazione univoca;

• ogni ricerca deve avere una cartella che contenga i documenti, oppure i riferimenti sulla loro reperibilità, relativi alle specifiche di base del progetto stesso;

• ogni documento collegato al progetto deve richiamare il codice identificativo del progetto, per permettere una sua identificazione univoca e assicurarne la rintracciabilità e la disponibilità;

• tutti i documenti devono riportare il numero di revisione affinché la versione valida possa essere chiaramente identificata;

• i documenti devono essere utilizzabili e reperibili, tenuti al sicuro e conservati per periodi prestabiliti, nel rispetto delle procedure di sicurezza.

Gli elementi, gli attori e le loro competenze, i documenti ed i tempi di conservazione che attestano la buona conduzione di una qualunque ricerca sono indicati nelle Norme di Qualità ASSIRM.

4.1 Briefing del Cliente
Il briefing da parte del Cliente è la sintesi delle esigenze informative e delle richieste per la Società; ovvero un documento di qualità che determina il perimetro d’indagine e la scelta delle tecniche di rilevazione e delle metodologie di elaborazione ed analisi dei dati da utilizzare nella ricerca. La Società deve documentare la richiesta ricevuta dal Cliente ed il brief di ricerca. Se il brief è fornito dal Cliente in forma scritta, va conservato il documento originale ricevuto; se il brief è stato trasmesso verbalmente, la Società dovrà farne una sintesi degli elementi principali da inserire nella proposta. La documentazione del brief è conservata nella cartella di lavoro digitale e non.

4.2 Progetto di ricerca della Società
La Proposta della Società, documentata in forma scritta, descrive tutti questi elementi: perimetro d’indagine, tecniche di rilevazione, metodologie di elaborazione ed analisi dei dati, ed è un documento di qualità da conservare nella cartella di lavoro digitale e non. Il Progetto di ricerca attesta l’attinenza della proposta della Società al briefing del Cliente e descrive le specifiche tecniche dell’esecuzione e le prestazioni offerte dalla Società. Nel Progetto di ricerca, pertanto, sono indicati gli elementi essenziali del lavoro o perimetro d’indagine:

• l’argomento trattato;
• l’entità dell’impegno richiesto (dimensioni e durata della ricerca);
• le tecniche, le metodologie e le modalità di rilevazione (es. software di crawling);
• gli strumenti di ricerca (fonti, stimoli, query, ecc.);
• tool informatici e metodologie applicate per il trattamento dei dati;
• la descrizione di ciò che verrà consegnato in esecuzione dell’incarico;
• il prezzo.

In particolare le descrizioni relative ai tool informatici e software di ricezione, trattamento e/o analisi dei dati in forma automatica, rappresentano un manuale d’uso (funzionalità e modalità di fruizione) a disposizione dei Committenti, nel quale andrebbero descritti, ove presenti, i seguenti elementi:

• le metriche di rilevanza ed influenza adottate per l’analisi dei contenuti, la tipologia di motore di sentiment eventualmente utilizzato, l’indicatore del sentiment e le modalità di misurazione della polarità dei contenuti;

• eventuali tecniche di analisi testuale, linguistica e semantica (associazione in fattori, clusterizzazione, etc.) impiegate;

• i criteri di scelta e selezione del campione di messaggi analizzati “manualmente”;

• eventuali modelli di elaborazione/interpretazione dei dati.

Infine, già dal Progetto dovrà essere indicato come il Cliente potrà alla fine disporre delle informazioni di ricerca: la base dati, i rapporti scritti, le sintesi, le presentazioni, la partecipazione a workshop interni, la consultazione dei risultati online, etc. Il progetto e le metodologie di ricerca sono di proprietà della Società.

4.3 L’assegnazione dell’incarico
L’assegnazione dell’incarico deve essere documentata per iscritto, sotto forma di lettera di incarico/contratto del Cliente o di accettazione da parte del Cliente della Proposta/contratto della Società. La Società può decidere di avviare la ricerca prima di aver ricevuto formale lettera di incarico o di accettazione della Proposta. In tale caso, la Società definisce le modalità più idonee per autorizzare e comunicare all’interno l’avvio del progetto prima dell’approvazione formale da parte del Cliente. L’assegnazione dell’incarico fa riferimento alle specifiche tecniche contenute nella Proposta.

4.4 Rapporti con il Cliente
I rapporti con il Cliente nel corso della ricerca devono essere documentati. Nella cartella di lavoro digitale e non deve essere conservata la corrispondenza scambiata con il Cliente (es. copia delle e-mail, ecc.), oltre alle note relative a comunicazioni verbali che abbiano per oggetto decisioni su specifiche modalità di esecuzione della ricerca. Nel caso di accordi verbali su aspetti di rilievo, la Società deve inviare comunque una nota scritta al Cliente, conservandone copia in cartella. Al Cliente è garantito l’accesso a tutta la documentazione tecnica di ricerca ed ha anche la facoltà di contribuire allo svolgimento di qualunque fase di ricerca, fatte salve le norme a tutela della privacy e nel rispetto del corretto svolgimento del field. E’ responsabilità della Società assicurare in ogni caso la possibilità per il Cliente di dare la propria approvazione alle scelte operative più rilevanti (es. gli strumenti di ricerca, le modalità, gli ambiti e le tempistiche per lo svolgimento dei lavori, le metodologie applicate, etc.). Il Cliente deve quindi essere messo in condizioni di ottenere in tempo utile le informazioni relative e di poterle discutere con la Società. La documentazione di assegnazione dell’incarico deve essere conservata nella cartella di lavoro digitale e non.

4.5 Pianificazione ed esecuzione dei lavori
La pianificazione del lavoro nelle sue varie fasi deve essere documentata per iscritto. La Società deve provvedere a un’accurata pianificazione interna di tutte le ricerche e degli altri incarichi assegnati, coinvolgendo i responsabili interni, in base all’organizzazione della Società. Nei documenti di pianificazione deve essere indicato il Responsabile di Progetto e gli eventuali responsabili di singole parti. Il Cliente deve essere tempestivamente informato di eventuali ritardi o di altre difficoltà che possano modificare lo svolgimento della ricerca. I documenti di pianificazione dei lavori devono essere conservati nella cartella di lavoro digitale e non. La realizzazione di ciascuno studio deve seguire l’impostazione rigorosa indicata nel Progetto di ricerca e sottoscritta nella lettera d’incarico, garantendo la tempistica ed il corretto svolgimento della ricerca.

4.6 Output della ricerca
Prima della consegna di tutti i dati e dei materiali (risultati della ricerca) al Cliente, il Responsabile di Progetto deve attestare il controllo e la conformità di tali risultati agli obiettivi stabiliti. Tale conformità deve essere documentata, conservando copia dell’output consegnato al Cliente ed attestando le relative modalità di consegna nella cartella di lavoro digitale e non (Report finale, Presentazione dei risultati, Documenti indicanti della data di consegna e presentazione). Nel caso l’output di ricerca sia anche costituito da un archivio di dati elementari (al massimo livello di disaggregazione), e/o dagli strumenti di ricerca e/o dalla disponibilità d’uso dell’eventuale tool di ricerca per elaborazioni personalizzate, lo stesso deve essere documentato: copia o gli originali dei files trasmessi devono essere conservati in Società.

4.7 Controlli di qualità
Lo scopo dei controlli di qualità è di stabilire che la raccolta ed il trattamento dei dati siano stati condotti secondo le istruzioni del progetto di ricerca. I controlli a monte della rilevazione (ovvero sugli strumenti stessi della ricerca) devono essere effettuati al più presto, dopo un paio di giorni dall’inizio della fase di crawling e prima che i dati risultanti vengano elaborati e/o presentati ai Clienti. La Società dovrà provvedere, laddove possibile, ad automatizzare controlli di tipo logico (eventualmente già all’interno del tool) e suggerire eventuali azioni correttive al perimetro e alle tecniche d’indagine, laddove si rendessero necessarie (ad es.: nuove parole chiave, nuovi filtri per una migliore gestione di omonimie, sinonimi, misspelling, neologismi e ambiguità linguistiche, nuove fonti, etc.). I controlli a valle della rilevazione (analisi volumetrica, funzionalità del tool e delle metodologie applicate) devono essere effettuati prima che i dati risultanti vengano presentati ai Clienti. I controlli devono essere organizzati dal responsabile qualità della Società ed in tutti i casi devono essere fatti da persone terze (altre rispetto ai ricercatori di cui si verifica il lavoro). Tutte le fasi di rilevazione di ogni progetto devono essere controllate con procedure di Osservazione concomitante (controllo in tempo reale dei contenuti estratti) e Verifiche su dati aggregati. Tutti i controlli di qualità, di tipo campionario o censuario, effettuati sulla ricerca sono soggetti a registrazioni, cioè devono essere documentati riportando le modalità di esecuzione, le date e gli esiti dei controlli stessi. Laddove il controllo identifichi discrepanze o problemi, si devono intraprendere azioni correttive. Le registrazioni dei controlli devono essere reperibili per progetto e devono includere:

• il nome ed il ruolo della persona che ha effettuato i controlli;
• la descrizione dei metodi di controllo usati;
• la descrizione di qualsiasi discrepanza eventualmente emersa;
• gli eventuali provvedimenti adottati.

Il Responsabile di Progetto deve inoltre garantire le seguenti verifiche:

• la coerenza del brief con il progetto di ricerca;
• il rispetto di tutte le fasi metodologiche;
• la precisione, la correttezza e la completezza delle informazioni contenute nel rapporto.

4.8 Back up, conservazione e sicurezza dei dati
La Società ha l’obbligo di conservare tutta la documentazione relativa a ciascun progetto di ricerca.
Tutti i documenti devono essere conservati in modo sicuro per prevenire accessi non autorizzati, danni o perdite accidentali. La Società deve assicurare che tutti i documenti siano immagazzinati e conservati in accordo con la normativa vigente in materia di sicurezza dei dati e di privacy e le procedure previste dalle presenti norme.