Introducció
La investigació científica és un procés d'aprenentatge dirigit. Aquest es basa en la iteració: una hipòtesi condueix, mitjançant un procés de deducció, a unes conseqüències que es poden valorar amb dades, p.e combinar dos productes en un laboratori a una certa temperatura donaran més d'un tercer producte que si es fa a una altra temperatura. Si les dades resultants de l'experiment no coincideixen amb el que s'ha deduït caldrà fer un procés d'inducció que portarà a modificar la hipòtesis i iniciar una nova iteració
Dificultats amb les que es troba un investigador
- Error experimental: el produeixen factors coneguts, com per exemple la manca de precisió de les eines de mesura, i altres factors desconeguts
- confusió entre correlació i causalitat: Es considera que dues variables estan molt lligades (correlacionades) i en veritat el que passa es que les dues depenen d'una tercera
- Complexitat dels efectes: Si en un experiment es modifiquen més de dues variables els resultats poden ser imprevisibles ja que els efectes poden no ser additius linealment.
Notes prèvies
Els mètodes que es presenten requereixen d'uns coneixements estadístics previs que aquí no és possible desenvoluparem. Tan sols introduirem les mesures descriptives de la població i les mostres, la distribució Normal, la t student i el Teorema Central del Límit.
Mesures descriptives de la població i les mostres
Per descriure una població o una mostra utilitzem la mitjana, la variança i la desviació estàndard
Mesura de la centralitat
η = Σy/N mitjana poblacional també anomenada Esperança matemàtica = E(y) . y = valor variable observada de la població (per exemple pes o alçada) i N = nombre individus de la població.
Ў = Σy/n mitjana mostral. y = valor variable observada de la mostra (per exemple pes o alçada) i n = nombre individus de la mostra.
Mesura de la dispersió
V(y) = б2 = Σ ( y - η )2 / n variança poblacional = E(y - η )2
s2 = Σ ( y - Ў )2 / (n-1) variança mostral
Explicació de perquè dividim per n-1 i els graus de llibertat.
Per a n observacions Σ ( y - Ў ) = 0 per tant coneguts n-1 ( y - Ў ) l'n serà el que ens faci que la suma dels anteriors sigui 0 i ja ve determinat. Es diu que tenim n-1 graus de llibertat.
La Normal N i la t d'student t
Les observacions repetides que es diferencien per error d'experimentació varien al voltant d'un valor central seguint una distribució simètrica en les que les petites desviacions son molt més freqüents que les grans. La distribució Normal serveix per representar situacions d'aquest tipus i es representa com N(η,б)
z = ( y - η ) / б la distribució de z és N(0,1) mitjana 0 i variança 1 i ho podem representar de la següent manera Pr(y > η + б) = Pr ( (y - η) > б ) = Pr ( (y - η) / б> 1 )
Quan es desconeix б i s'utilitza la variança mostral s, les desviacions respecte al valor central segueixen una t-student
Utilització de les taules
Per saber quina probabilitat tenim de que y sigui superior a un determina y0 es calcula la desviació normal z0 = (y0 - η) / б i obtindrem Pr(z > z0) de la taula de la N (nosaltres utilitzarem una funció d'excel). En el cas de la t-student el procés és similar però les taules donen diferents valors segons els graus de llibertat (n -1) , quan n>30 podem considerar que la forma de la distribució t és igual a la N.
Exemple d'utilització de la normal
Funció EXCEL =1-DISTR.NORM.ESTAND(z0)
η = 4,0 y0 = 4,4 б = 0,3 aleshores z0 = (y0 - η) / б = (4,4 - 4,0 ) / 0,3 = 1,33
Pr( z > 1,33) = 0,0918 -> que hi ha un 9% de probabilitat de que trobem casos amb valors superiors a 4,4
Exemple d'utilització de la t
Funció EXCEL =DISTR.T(t0;n-1;1)
η = 4,0 y0 = 4,4 б = 0,3 aleshores t0 = (y0 - η) / s = (4,4 - 4,0 ) / 0,3 = 1,33
Pr( t> 1,33) = 0,12 -> que hi ha un 9% de probabilitat de que trobem casos amb valors superiors a 4,4
El Teorema Central del Límit
Aquest teorema diu que sota certes circumstàncies, que es donen normalment en el món de l'experimentació, la distribució d'aquesta funció lineal dels errors tendirà a una distribució normal sempre que hi hagi un nombre prou gran d'observacions.
|