|
Exercicis
Per enviar les respostes als exercicis elaborareu un document del Word
en què:
- Posareu un títol per a cada exercici (no cal que hi copieu els enunciats).
- Escriureu les respostes numèriques concretes que es demanen i redactareu,
breument, els comentaris adients.
En aquest mòdul, com en tots els mòduls del curs, heu d'enviar les respostes
a un mínim de sis exercicis amb les consideracions següents:
- Els exercicis que concreten el treball de les quatre primeres pràctiques
i del document teòric sobre contrastos d'hipòtesis i la
prova de khi-quadrat són els nou que estan numerats com 1.I,
1.II, 1.III, 2.I, 2.II, 2.III, 2.IV i 3.I i 3.II.
- Si n'envieu 6 d'entre els anteriors, amb el benentès que
n'hi ha d'haver com a mínim un dels 1.i, un dels 2.i
i un dels 3.i "ja heu complert".
- Els tres exercicis 1.i s'adequen a allò que s'ha explicat
en la primera pràctica i el primer exemple de la quarta, l'ajust
d'unes dades mitjançant un model "teòric"
intuïtiu; els quatre exercicis 2.i corresponen a la recerca
d'un model donat per una distribució de probabilitat, com es
fa a la pràctica 2; finalment els dos exercicis 3.i
tracten de les relacions entre variables, com la pràctica 3
i el darrer exemple de la pràctica 4 i és fonamental
entendre'ls bé per la seva aplicació posterior al nostre
treball global.
- Els exercicis 4, 6, 7 i 8 enllacen amb la pràctica 6 que tracta
del tema dels contrastos entre mostres diverses de variables numèriques
per veure si les diferències que s'observen es poden considerar
estadísticament significatives o no. (Ja s'ha dit que el tema
es pot considerar d'ampliació però això
no vol dir pas que no sigui "important" en les aplicacions
estadístiques!... per exemple "el grup A de quart d'ESO
és significativament millor que el grup B de quart d'ESO"
o qüestions d'aquest tipus, que poden incidir en la nostra tasca
quotidiana)
- L'exercici 5 demana l'aplicació d'alguna de les proves de normalitat
explicades al corresponent document teòric i a la pràctica
5. És un exercici d'ampliació.
Si teniu dubtes sobre algun exercici, encara que sigui dels d'ampliació
i no el vulgueu enviar resolt, podeu consultar-los per via telemàtica.
En tots els exemples següents, exposeu les conclusions de l'aplicació
de la prova de khi quadrat o de les altres proves que es comenten amb
un nivell de significació del 5 %, com és norma bastant
habitual en els treballs estadístics.
|
|
-
Heu d'enviar com a mínim 1 dels exercicis següents, que valoren el
bon ajust (o no) a un model intuïtiu. Els altres són exercicis
opcionals.
- Creuríeu que és honrat un jugador que juga a tirar
dos daus i sumar els punts i treu les freqüències absolutes
següents {65, 51, 84} respectivament per a les puntuacions {menys
de 7, 7, més de 7} en 200 tirades?
- En un institut hi ha 684 alumnes i les freqüències
de les dates de naixement mes a mes (donades ordenadament) són
les següents: 58, 44, 73, 68, 66, 65, 55, 66, 49, 54, 46, 40.
Creieu que es pot acceptar estadísticament una frase que
digui: "El nombre de naixements tendeix a ser el mateix cada
mes"?
- Al web www.onlae.com podeu
trobar informació sobre Loterías y Apuestas del Estado.
De les taules de dades que apareixien a principis de setembre de
2002 transcrivim la que dóna els nombres ordenats segons
la quantitat d'aparicions fins en aquell moment (1.480 sorteigs,
sense considerar els nombres complementaris, és a dir, que
cal comptar 6 nombres en cada sorteig).
39
204 |
5
191 |
41
187 |
29
183 |
11
178 |
16
175 |
43
172 |
38
203 |
25
191 |
22
187 |
17
182 |
4
178 |
13
175 |
28
170 |
23
201 |
36
189 |
27
185 |
42
181 |
48
178 |
31
174 |
44
168 |
6
200 |
3
188 |
34
185 |
21
180 |
32
177 |
33
174 |
2
162 |
47
198 |
35
188 |
30
185 |
10
179 |
7
176 |
18
173 |
24
161 |
45
193 |
15
188 |
37
184 |
26
179 |
19
176 |
46
173 |
49
161 |
14
193 |
9
187 |
40
184 |
1
179 |
12
175 |
8
172 |
20
158 |
Proposeu un model intuïtiu que digui quants nombres de cada
desena haurien d'haver sortit i feu un contrast d'aquesta hipòtesi
mitjançant la prova de khi quadrat. (Penseu que el sorteig
es fa sobre els nombres de l'1 al 49; a la primera desena hi ha 10
nombres, de l'1 al 10; el mateix a les altres, excepte a la darrera
desena, que només té 9 nombres, del 41 al 49).
- Heu d'enviar com a mínim un dels exercicis següents, que valoren el
bon ajust (o no) a un model donat per una distribució de probabilitat
(i un d'ells avança cap a la comparació de mostres). Els altres són
exercicis opcionals.
- Per fer una comprovació de la (suposada) telepatia existent
entre dues germanes bessones, es fa 48 vegades la prova de fer que
una d'elles escrigui una llista de 10 símbols, cadascun d'ells
a triar entre 5 símbols concrets, i l'altra miri d'encertar
quina llista ha escrit la seva germana. Resulta que només
1 vegada no ha encertat cap símbol; 11 vegades n'ha encertat
1; 13 vegades n'ha encertat 2; 12 vegades n'ha encertat 3; 6 vegades
n'ha encertat 4; 3 vegades n'ha encertat 5; 1 vegada n'ha encertat
6, i 1 vegada n'ha encertat 7. Amb la prova de khi quadrat, podem
trobar arguments significatius per defensar que hi ha telepatia?
(Hipòtesi nul·la: no hi ha telepatia; llavors, el model
seria la distribució binomial amb n = 10 i p
= 1/5=0,2.)
- Quina de les dues variables, nombre de germans o bé
nombre de germans sense comptar l'alumne, us sembla més
plausible que es pugui ajustar per una distribució de Poisson?
Per què? (Penseu en el valor 0.) Estudieu numèricament
la bondat de l'ajust a dades recollides en una classe vostra, o
bé en el fitxer TERCERJM.XLS que forma part dels materials
del curs.
- Volem aplicar la prova de khi quadrat per tal d'ajustar, mitjançant
la distribució de Poisson, les dades de l'exemple
del nombre de morts per una coça de cavall a l'exèrcit
prussià. Prèviament, a partir de les dades, hem d'estimar
la mitjana d'aquesta distribució i, per altra banda, cal
ajuntar algunes classes per respectar al màxim les precisions
amb què cal aplicar la prova.
- Amb quants graus de llibertat cal aplicar la prova i quin
valor p resulta?
- Quina interpretació té el fet que resulti un
valor p tan gran?
- Accidents mortals.
Estudieu les dades sobre la freqüència d'accidents mortals
de trànsit durant els anys 1982 o 1983 (consulteu el fitxer MORACC.XLS i la pràctica
2).
- Es poden ajustar mitjançant una distribució
de Poisson?
- Estudieu algun procediment per decidir si
hi ha diferències significatives entre les dades d'un
any i les de l'altre.
- Heu d'enviar com a mínim un dels dos exercicis següents sobre taules
de doble entrada. L'altre és un exercici opcional.
- Comproveu amb la funció PRUEBA.CHI( ) la independència
de les variables color dels ulls i grup d'alçada
de l'exemple que il·lustrava el test d'independència
en la introducció teòrica d'aquest mòdul.
- Al fitxer NOTES.XLS hi ha consignades les notes de català,
castellà i matemàtiques d'un nombrós grup d'alumnes.
Doneu un raonament estadístic que justifiqui la no-acceptació
de la hipòtesi d'independència entre la variable nota
de català i la variable nota de matemàtiques.
- (Exercici opcional) Descriviu un estudi amb dades del vostre centre
en què escaigui aplicar alguna de les proves explicades a la pràctica
6. Tot seguit, entreu les dades en un llibre de l'Excel (que no cal
que ens envieu!) i expliqueu els resultats obtinguts i les conclusions
que heu tret.
- (Exercicis opcionals: podeu enviar-ne un, cap o més d'un) Apliqueu
alguna prova de normalitat (i en un cas, de confrontació de mitjanes)
a alguna de les situacions següents. Cal que expliqueu quina prova heu
fet servir i com arribeu a la vostra conclusió:
- La plausibilitat de l'ajust mitjançant la distribució
normal de les variables PROVA i EXP a partir de les dades obtingudes
del fitxer PAU.XLS a la pràctica
4 del mòdul 2. Estudieu també si hi ha diferències significatives
entre aquestes dues variables i expliqueu quin procediment heu seguit
per decidir-ho.
- Quina de les variables, ALT1, ALT2, ALT3, del fitxer DADES74.XLS
es pot ajustar millor per una normal? Creieu que hi ha raons intuïtives
que justifiquin la resposta?
- Creieu que la variable que dóna la puntuació total en la
prova Cangur de l'SCM es pot ajustar mitjançant una distribució
normal per algun dels nivells de la prova (fulls del llibre CANGUR.XLS)
?
- (Exercici opcional) Feu les proves que cregueu convenients i expliqueu
quin estudi i quina prova heu fet i quines conclusions traieu per estudiar
si hi ha diferències significatives entre les dades següents en el fitxer
DADES74.XLS:
- Les altures de la variable ALT1 i les d'ALT3
- Les altures de la variable ALT2 i les d'ALT3
- Les altures dels nois i les altures de les noies a ALT1
- Les altures dels nois i les altures de les noies a ALT3
- (Exercici opcional) Ajunteu en un sol full les dades dels fulls LL85,
LL86 i SAL85 del fitxer TEMPS.XLS. Apliqueu la
tècnica explicada per al contrast de dades emparellades a la pràctica 4 per decidir
si:
- Es pot dir que hi va haver diferències
significatives de temperatura a la Llacuna l'any 1986 i l'any 1985?
- Es pot dir que hi va haver diferències
significatives de temperatura a la Llacuna i a Saldes l'any 1985?
- (Exercici opcional) Apliqueu proves de dues mostres per justificar
la diferència significativa entre qualsevol de les tres varietats
de lliris incloses al fitxer IRIS.XLS. (Alternativament, també
podeu fer una prova ANOVA després de desapilar convenientment les dades.)
|