Tècniques de mostratge. Probabilístics.
mostratge aleatori simple
Mètode de selecció de n unitats d'un conjunt N de manera que cadascuna de les mostres tinguin la mateixa oportunitat de ser escollides.
mostratge per proporcions i percentatges
En determinades ocasions volem estimar el número total, la proporció, o el percentatge d'unitats en la població, que posseeix alguna característica o atribut, o que s'engloben dins d'alguna classe definida.
La classificació es pot incloure a l'enquesta (si, no) o pot introduir-se després (preguntar l'edat i al final determinat si està jubilat/da o no)
mostratge aleatori estratificat
En el mostratge estratificat, la població de N unitats es divideix en subpoblacions anomenades estrats que volem que estiguin representats a la mostra. Passos:
- Determinar els estrats (p.e. un barri, un districte)
- Nombre d'elements de la mostra en cada estrat
- Es pren una mostra aleatòria simple en cada estrat.
mostratge sistemàtic
Suposem que les N unitats de la població es numeren de 1 a N en un cert ordre. Per a escollir una mostra de n unitats, prenem una unitat al atzar entre les k primeres, amb k entre 1 i n/n, i a continuació prenem les següents a intervals de k. La selecció de la primera unitat determina tota la mostra, que es denomina mostra de totes les k-ésimes unitats.
mostratge per conglomerats
S'utilitza quan es té una idea clara del total de la població, o quan seria massa costós generar-ne la llista.
Les unitats conglomerats (municipis, ciutats...) contenen números diferents d'elements o subunitats (regions geogràfiques, escoles, habitatges, persones). Un cop determinats els conglomerats i els individus a seleccionar dins de cadascun es pot aplicar qualsevol dels mètodes anteriors.
Determinació del nombre de mostres
El pas previ a iniciar una enquesta per mostratge és enunciar la hipòtesi de partida. En general aquesta hipòtesi s'expressa en termes dels límits d'error esperats o tolerables. Aquesta decisió l'han de prendre les persones que utilitzaran els resultats de l'enquesta, basant-se en experiències anteriors.
Generalment es mesura més d'un atribut o característica en una enquesta per mostratge: en ocasions, el nombre d'atributs és gran. Si s'estipula un grau de precisió per a cada atribut, els càlculs ens conduiran a una sèrie de valors conflictius de n; un per a cada atribut. Pel tant s'ha de trobar un mètode per reconciliar aquests valors.
En ocasions és clar que n s'ha de reduir dràsticament, i llavors és necessari prendre una decisió difícil, que és la de procedir amb una mostra molt més petita, la qual cosa redueix la precisió, o bé, abandonar els esforços fins a comptar amb majors recursos.
En planejar una enquesta per mostratge, sempre s'arriba a una etapa on cal prendre una decisió respecte a la mida de la mostra. Aquesta decisió és important. Una mostra massa gran implica un malbaratament de recursos i una de molt petita disminueix la utilitat dels resultats. La decisió no sempre pot prendre's satisfactòriament; sovint no disposem de la suficient informació per saber si la mida de la mostra seleccionada és l'òptima. La teoria del mostratge proporciona un marc dins del qual es pot pensar intel·ligentment respecte a aquest problema.
A continuació veurem un exemple hipotètic en el qual es ressalten els passos necessaris per arribar a una solució. Un antropòleg està preparant un estudi sobre els habitants de certa illa. Entre altres coses, desitja estimar el percentatge d'habitants que pertanyen al grup sanguini O. Li han assegurat la cooperació necessària per extreure una mostra aleatòria simple. Què tan gran ha de ser la mostra?
Aquest assumpte no es pot discutir sense abans contestar a una altra pregunta. Amb quin grau de precisió desitja conéixer l'antropòleg el percentatge de persones del grup sanguini O? A la pregunta, el nostre amic contesta que estarà satisfet si el percentatge no conté un error major de més o menys el 5%, és a dir que si la mostra indica que el 43% de la població és del grup sanguini O, el percentatge per a tota l'illa es trobarà amb certesa entre el 38 i el 48%.
Per evitar malentesos, és aconsellable aclarir l'antropòleg que no li podem assegurar una exactitud dins d'un 5%, llevat que s'analitzi el tipus sanguini de tots els habitants. Per molt gran que prengui n, existeix la possibilitat d'una mostra desafortunada que presenti un error major al 5% desitjat. L'antropòleg contesta fredament que ho sap, que accepta el risc d'una possibilitat en vint d'obtenir una mostra poc afortunada i que tot el que demana és un valor de n i no una classe d'estadística.
Ara estem en posició d'estimar en termes generals el valor de n. Per simplificar les coses s'ignora la cpf (correció per població finita) i el percentatge de la mostra p se suposa normalment distribuït.
En termes tècnics, p ha de trobar-se en l'interval (P±5), excepte per a un cas en 20 ( veieu que 1/20=0.05 un 5%). Ja que p se suposa normalment distribuïda al voltant de P, es trobarà en l'interval (P±2sp) (sp=desviació standard), llevat d'una possibilitat entre 20. A més (atenció !! Q = 1 - P ),
sp=SQRT(PQ/n) SQRT=arrel quadrada
De manera que podem escriure (creieu-vos-ho o llegiu el capítol 3, apartat 3.2 i, al capítol 4 del llibre):
n=4PQ/25
En aquest moment apareix una dificultat comuna a tots els problemes per a l'estimació de la mida de la mostra. S’ha obtingut una fórmula per a n, però n depèn d'una propietat de la població subjecta al mostratge. En aquest cas, la propietat és la quantitat P que desitjaríem mesurar. Per tant, preguntem a l'antropòleg si ens pot donar una idea del valor que s'espera de P. Ell contesta que amb base en dades obtingudes prèviament amb altres grups ètnics, i d'acord a les seves especulacions sobre la història racial de l'illa, li sorprendria que P fos fora de l'interval del 30 al 60%.
Aquesta informació serà suficient per proporcionar una resposta útil. Per a qualsevol valor de P entre 30 i 60, el producte PQ és entre 2100 i un màxim de 2500 amb P=50. El valor corresponent de n és entre 336 i 400. Per no córrer riscos en pren 400 com a estimació inicial de n.
Ara poden reexaminar-se les hipòtesis fetes en aquesta anàlisi. Amb n=400 i p entre 30 i 60, la distribució de p hauria d'estar a prop de la normal. Si es requereix o no la cpf, depenen del nombre d'habitants de l'illa. Si la població en supera 8000, la fracció de mostratge és menor al 5% i no es necessita ajust per a la cpf.
No probabilístics
Hi ha diferents mètodes:
- La mostra és una part de la població fàcilment accessible (p.e. es mira la qualitat del carbó de la part superior d'una vagoneta)
- La mostra es selecciona a l'atzar.
- Es fa una visió superficial de tota la població i s'agafa una mostra que sembla que siguin típiques (que s'acostin a la mitjana de la població).
- S'agafa una mostra de voluntaris.
No permeten dir res de la població d'on provenen les mostres.
|