Il sondaggio politico non presenta problemi di campionamento diversi da quelli di qualsiasi altra ricerca sociale e di mercato. Un numero elevato di casi e una accurata stratificazione garantiscono in genere la bontà del campione, cioè la sua rappresentatività statistica, e margini ridotti delle stime campionarie, almeno della componente random.
La popolazione di riferimento per i sondaggi politici viene fatta coincidere convenzionalmente con quella degli elettori (aventi diritto al voto) che corrisponde in larga misura con la popolazione residente di 18 anni e oltre. L’utilizzo di quest’ultima per il piano di campionamento di un sondaggio politico comporta modesti svantaggi sul fronte della rappresentatività, mentre consente, grazie alla disponibilità dei dati istituzionali sulla popolazione, un’accurata stratificazione del campione.
4A. LA NUMEROSITÀ DEL CAMPIONE
Nella pratica della ricerca si ritiene che un sondaggio politico (nazionale, ma anche locale), per stimare ad esempio una percentuale, possa essere condotto su un campione di 1.000 casi con sufficiente accuratezza. Nel caso di un campione casuale semplice (a puro titolo di esempio) il margine di errore campionario si collocherebbe attorno al ±3%. Cioè se la stima campionaria (ad esempio la percentuale di intervistati che apprezza il candidato X o il ministro Y) è pari al 40%, ciò significa che il valore “vero” nella popolazione è compreso tra 37% e 43% con almeno 95 probabilità su 100. Un margine forse sopportabile nell’issue polling, assai meno in un sondaggio preelettorale sulle intenzioni di voto ai partiti.
Aumentare la numerosità del campione per ridurre il margine di errore è una strategia costosissima e di fatto impraticabile. Per scendere dal 3 al 2% bisognerebbe quasi triplicare la numerosità del campione, come mostra il grafico della Figura 2. Soluzione improponibile nella maggior parte dei casi, e ancor più nel caso dei sondaggi politici che possono normalmente far affidamento su budget molto limitati. L’ alternativa è una precisa e appropriata stratificazione del campione e un accurato controllo sui meccanismi di autoselezione del campione.
In linea di principio campioni inferiori ai 1.000 casi, se non in casi limitati e particolari, sono quindi da ritenersi di qualità inferiore allo standard ASSIRM, sia a livello nazionale che locale.
La numerosità del campione è comunque una variabile decisiva per la qualità del sondaggio politico. Nei sondaggi preelettorali perché è pur vero che un campione più ampio non contribuisce molto alla riduzione dell’errore campionario, ma in genere – se associato a un questionario più articolato – consente di ridurre l’incertezza delle stime con opportune tecniche di analisi dell’area del non voto , ma soprattutto degli elettori indecisi o reticenti dai quali dipende in sostanza la bontà delle “previsioni” .
Ma anche nell’issue polling un campione numericamente robusto è condizione determinante della qualità del sondaggio, perché di norma i risultati vengono presentati in tavole bidimensionali e in questi casi l’errore delle stime campionarie relative alle sottocategorie aumenta perché l’aumento dell’errore derivante dalla diminuzione del numero di casi non è mai o quasi mai compensato da una diminuzione di pari entità indotta dalla riduzione della varianza interna. Ne deriva un’incertezza nell’interpretazione delle differenze tra i dati delle sottocategorie, in genere poi neppure sostenuta da calcoli di significatività statistica.
4B. CAMPIONI PROBABILISTICI E NON, MULTICANALITÀ
Il ricorso al campionamento probabilistico (legato soprattutto all’utilizzo del telefono fisso) è ormai in molti casi superato dalla pratica della ricerca, che fa largo uso di canali alternativi per l’esecuzione delle interviste. Tutti i “campioni” (o “sotto campioni”) che si ottengono da popolazioni di cui è incerta la stima della numerosità e della composizione sono campioni per definizione non probabilistici e come tali non potrebbero dare alcuna garanzia scientifica sulla generalizzabilità dei risultati alla popolazione degli elettori.
L’uso di campioni probabilistici è quindi ancora preferibile quando l’esigenza di assicurare che i risultati rientrino entro un certo intervallo di confidenza (non calcolabile nei campioni non probabilistici) prevale su quella della più elevata precisione possibile delle stime. Così ad esempio in un sondaggio sulle intenzioni di voto non avrebbe molto senso garantire che la percentuale di voti stimata per un partito sia il 5% con un intervallo del ±3%, mentre lo avrebbe in un issue poll che stima al 50% il giudizio positivo degli elettori su un determinato provvedimento.
Da molto tempo per la verità nella pratica della ricerca sociale e politica l’uso di campioni non probabilistici, o di disegni di ricerca misti, ha dato risultati comparabili, in termini di accuratezza delle stime, a quelli ottenuti con procedure di random sampling. La pratica non ha quindi controindicazioni per un sondaggio di qualità, soprattutto se è finalizzata all’aumento della numerosità campionaria. L’uso anche parziale di campioni non probabilistici (auto-selezionati, con compenso, panel internet, ecc.) va quindi chiaramente indicato e documentato nella SQA, riportando per ciascuno numerosità, criteri di autoselezione (opt-in) e stratificazione.
4C. LA STRATIFICAZIONE DEL CAMPIONE
Almeno nella situazione italiana le correlazioni tra orientamenti politico-elettorali e variabili sociodemografiche sono piuttosto deboli, se non quella della distribuzione territoriale del voto. Per questo nei sondaggi politici la stratificazione del campione in base a queste sole variabili porta in genere modesti margini di miglioramento delle stime campionarie.
L’alternativa di qualità è quella di aggiungere ai criteri di stratificazione tradizionali almeno una variabile politica, di solito un precedente comportamento di voto a un’elezione o a un referendum, anche se questa soluzione può aggravare tempi e costi per il completamento della campagna di interviste e la chiusura delle “quote”. Infatti la domanda “Può dirmi come ha votato alle ultime elezioni?” implica sempre un errore sistematico derivante da quell’effetto noto come “spirale del silenzio”, effetto mediatico che tende appunto a “silenziare” i comportamenti “perdenti” o le opinioni minoritarie .
L’effetto spirale del silenzio si manifesta non solo con una maggiore reticenza a dichiarare il proprio comportamento di voto passato, ma anche nell’autoselezione degli elettori che concedono l’intervista. Tenerlo sotto controllo con la stratificazione del campione è quindi condizione dirimente per valutare la qualità del sondaggio.
Un secondo elemento da tenere in considerazione perché può creare un insidioso bias nella composizione del campione è il livello di istruzione dell’intervistato. È noto, e ciò vale per tutte le ricerche sociali, ma non solo, che la propensione a rispondere è proporzionale al livello di istruzione e può essere molto difficoltoso ottenere un campione correttamente proporzionato in termini di titolo di studio dell’intervistato.
Poiché riempire tutte le quote può rilevarsi impraticabile a causa dei tempi e dei costi, si potrà chiudere la fase di rilevazione quando la somma degli scarti in valore assoluto tra valori ponderati e non, non superi i 10-15 punti percentuali, lasciando poi alla ponderazione il compito di ridurre al minimo questo valore.
4D. LA PONDERAZIONE DEI DATI
Per la ponderazione dei dati si utilizza la procedura di sample balancing su tutti i criteri di stratificazione utilizzati. È una procedura iterativa di ponderazione del campione che riequilibra contemporaneamente le distribuzioni di tutte le variabili di stratificazione e minimizza gli scarti dalle distribuzioni della popolazione con l’utilizzo dell’algoritmo di Stephan-Deming.
La SQA riporta la procedura di sample balancing utilizzata e per ciascuna modalità delle variabili di stratificazione il valore del parametro della popolazione, il valore campionario non ponderato e quello ponderato. Meno rilevante, e forse non consigliabile nel caso dei sondaggi politici, è la ponderazione in base al canale utilizzato per l’intervista (CATI, CAMI, CAWI). L’utilizzo di formule, come ad esempio quella riportata nella figura seguente, può eventualmente essere utilizzata prima della ponderazione in base alle variabili sociodemografiche e politiche.