![]() |
|
||||||||||||||||
![]() |
||||||||||||||||
Pràctica |
![]() |
Exercicis
|
||||||||||||||
Idees sobre estimació. Estimació d'una proporció ![]() |
Glossari
|
|||||||||||||||
El teorema del límit central. Estimació d'una mitjana ![]() |
||||||||||||||||
Quin és el millor estimador? | |
L'objectiu d'aquesta pràctica és fer simulacions que visualitzaran l'exemple que es presenta en un dels documents teòrics d'aquest mòdul per entendre què es pot fer en una situació pràctica per decidir quin és el millor estimador. |
|
![]() |
|
Quin és el màxim nombre
que ha intervingut en un sorteig o en una tria de nombres aleatoris?
|
|
Treballareu aquests aspectes concrets:
|
|
![]() |
Plantejament del problema i simulacions |
Us presentem una situació didàctica que ajuda a presentar l'objectiu i el marc de treball de l'estimació estadística i els recursos de què es disposa per donar consistència als procediments que es fan servir. Imagineu que en començar una classe presenteu al vostre grup d'alumnes un conjunt de 50 dades (nombres enters positius), per exemple aquesta: 36 45 95 107 149 222 258 400 423 489 509 549 566 638 849 892 918 947 962 989 1063 1078 1087 1090 1102 1116 1150 1172 1214 1246 1406 1479 1606 1609 1626 1642 1700 1702 1764 1895 1964 2018 2056 2089 2090 2298 2311 2414 2435 2457 Els dieu que l'heu generada amb la funció de l'Excel ALEATORIO.ENTRE, posant al quadre de diàleg corresponent inferior: 1, però sense dir-los quin és el superior. La feina que els proposeu és suggerir idees que els permetin esbrinar quin és el valor màxim que havíeu posat per fer la generació de nombres aleatoris. Els heu de dir que no ho poden saber del cert i que els demaneu que facin una inferència. Han d'inventar mètodes i amb cadascuna de les seves idees s'associarà un estimador. Ben segur que tindran una bona inventiva i passareu una bona estona posant en comú les seves idees. Com sabríem quines característiques tenen els estimadors inventats en el problema que ens ocupa? Com es pot saber en una situació d'aplicació pràctica quin dels possibles és el millor estimador? Per poder-ho decidir, es fa un treball de laboratori. Es parteix d'una situació anàloga a la que interessa estudiar, però amb tots els paràmetres coneguts, i se'n fan repetides simulacions. Llavors s'analitza la distribució mostral de cadascun dels estimadors i es comparen unes amb les altres. I encara més: hi ha moltes situacions en estadística en què la distribució mostral de lestimador més adequat té un model teòric ben conegut: aquests són els casos interessants. Així, doncs, ara farem simulacions en l'exemple que ens ocupa.
Ara sí que sabrem quin és el nombre màxim que pot
sortir i llavors mirarem què passa.
|
|
![]() |
Alguns estimadors: variabilitat mostral |
|
Com podem valorar quin d'aquests estimadors ens ajudaria més? Ja tenim unes simulacions fetes. Analitzarem com es comporta cada estimador amb el nostre conjunt de dades. Ara ho farem amb tres d'aquests estimadors: el màxim observat, el doble de la mitjana i el doble de la mediana. Aquests tres estimadors il·lustraran molt bé la idea de biaix i de precisió i ens serviran per fer un debat sobre quin dels tres seria més encertat de prendre com el millor estimador. Recordeu que tenim plenes les primeres 50 files i 200 columnes, que representen 200 simulacions de l'extracció de 50 boles (amb reemplaçament) d'una bossa amb nombres de l'1 al 400. Comencem per l'anàlisi de l'estimador el màxim observat:
Repetiu aquestes accions a les files 54, 55 i 56 amb l'estimador el doble de la mitjana.
Finalment, repetiu-ho encara a les files 57, 58 i 59 per a l'estimador el doble de la mediana. Cada vegada que premeu F9 es fa una nova simulació. Feu-ho unes quantes vegades i observeu com varien la mitjana i la desviació estàndard dels tres estimadors que hem estudiat. La mitjana de la distribució mostral té relació amb el biaix; la desviació estàndard de la distribució mostral, amb la precisió. Tot seguit, podeu observar dos resultats. La mitjana de la distribució mostral empírica de l'estimador en les 200 simulacions que més s'ha acostat al veritable valor en aquestes dues experimentacions és el doble de la mediana. Passa el mateix en les proves que feu vosaltres? Vol dir això que aquest és el millor estimador? Un estudi més complet del comportament d'aquests estimadors el tindríem si miréssim no solament els dos paràmetres comentats, sinó un histograma de la distribució mostral empírica, en les nostres simulacions, de cada estimador. Així podríem tendir a fer-ne una valoració global. Així, doncs, quin és el millor estimador? |
![]() |
Biaix i precisió. Conclusions |
|
|
Un estimador és centrat si la mitjana de la distribució mostral coincideix amb el valor del paràmetre que es vol estimar; és esbiaixat en cas contrari. En l'exemple que estem estudiant:
Ara bé, el biaix no és l'únic element que cal tenir en compte. També és molt important la precisió en l'estimació, que es mesura en funció de la desviació estàndard de la distribució mostral de l'estimador.
Què hem de tenir més en compte, el biaix o la precisió? És difícil d'afirmar-ho amb rotunditat. En aquest exemple didàctic, ben segur que ens posaríem d'acord dient: "Si sabéssim com hem d'augmentar una mica el màxim, aquesta seria la millor manera!". Us proposem que continueu "jugant" amb aquest exemple en un dels exercicis. |
|
![]() |
|
Ampliacions, aclariments i comentaris |
|
![]() |
Gràfics
per analitzar globalment el comportament dels tres estimadors
Abans de fer els gràfics, us suggerim fixar les dades per estudiar els gràfics que resulten d'una simulació i que les dades aleatòries no vagin modificant-se.
Ara procedireu a fer l'histograma de les distribucions mostrals empíriques dels tres estimadors estudiats.
D'aquesta manera obtindreu unes sortides en pantalla semblants a les que es mostren tot seguit (on a mà hem afegit un senyal per a la classe [397,5; 402,5) que conté el vertader valor del paràmetre que volem estimar. En aquests gràfics, es fa del tot clara la precisió de cada estimador: el més precís és el màxim; el que ho és menys, el doble de la mediana (fixeu-vos en el gran nombre de valors menors que 337,5 i el gran nombre de valors més grans que 452,5). Pel que fa al biaix, és clar que el màxim és esbiaixat cap a l'esquerra; en canvi, el doble de la mitjana i el doble de la mediana semblen força centrats (però amb tanta o "tantíssima!" variabilitat) que costa pensar que siguin uns bons estimadors. |