lunes, 30 de enero de 2012

Conceptos

28. Un valor chi-cuadrada nunca puede ser negativo porque: 
a) Las diferencias entre las frecuencias observadas y esperadas están elevadas al cuadrado.
b) Un valor negativo significaría que las frecuencias observadas son negativas.
c) Se calcula el valor absoluto de las diferencias.
d) Ninguno de los anteriores.
e) a) y b), pero no e).

29. Suponga que existen ocho clases posibles a considerar en una prueba de bondad de ajuste.
¿Cuántos grados de libertad deberá utilizar?
a) 8.
b) 7.
c) 6.
d) No se puede determinar con la información dada.

30. Suponga que se va a realizar una prueba chi-cuadrada sobre una tabla de contingencia con cuatro
renglones y cuatro columnas. ¿Cuántos grados de libertad deberán utilizarse?
a) 16.
b) 8.
c) 9.
d) 6.

31. Las distribuciones chi-cuadrada y t, ambas:
a) Son siempre simétricas.
b) Se usan para pruebas de hipótesis.
c) Son dependientes del número de grados de libertad.
d) Todas las anteriores.
e) b) y c), pero no a).
f) Ninguno de los anteriores.

32. Cuando se realiza una prueba de hipótesis chi-cuadrada, ¿qué sucede cuando las frecuencias esperadas
en varias celdas son demasiado pequeñas?
a) El valor de ji-cuadrada estará sobrestimado.
b) Será más probable de lo que en debería ser que se rechace la hipótesis nula.
c) Los grados de libertad se reducen mucho.
d) Ninguno de los anteriores.
e) a) y b), pero no c).

33. ¿Cuáles de estas distribuciones tiene un par de grados de libertad?
a) Poisson.
b) Normal.
c) Ji-cuadrada.
d) Binomial.
e) Todas las anteriores.
f) Ninguno de los anteriores.

34. La prueba ________________________ determina si existe una diferencia significativa entre las
distribuciones observada e hipotética para una muestra.

35. Suponga que conocemos la estatura de una estudiante, pero no su peso. Usamos una ecuación de estimación
para determinar una estimación de su peso, basándonos en su estatura. Por tanto, podemos
concluir que:
a) El peso es la variable independiente.
b) La altura es la variable dependiente.
c) La relación entre peso y altura es inversa.
d) Ninguno de los anteriores.
e) b) y c), pero no a).

Richard I. L y David S.

Tema teórico

1. EXPLIQUE LAS LIMITACIONES DE LA CHI CUADRADA
Y LAS DOS REGLAS ACEPTADAS.

RESPONDA VERDADERO O FALSO
--------------------------

(V) (F) 2. Cuando se utiliza la distribución chi-cuadrada como prueba de independencia, el número de grados
de libertad se relaciona tanto con el número de columnas como con el número de renglones de la tabla de contingencia.

(V) (F) 3. La chi-cuadrada puede usarse como una prueba para decidir si una distribución dada es una aproximación
cercana de una muestra de alguna población. Nos referimos a este tipo de pruebas como prueba de bondad de ajuste.

(V) (F) 4. Al usar una prueba chi-cuadrada debemos asegurar que tenemos un tamaño de muestra adecuado, de
modo que podamos evitar cualquier tendencia a sobrestimar el valor del estadístico chi-cuadrada.

(V) (F) 5. Una “tabla de contingencia de 3 x 5” tiene tres columnas y cinco renglones.

(V) (F) 6. El área total bajo la curva de una distribución chi-cuadrada, como la de otras distribuciones, es 1.

(V) (F) 7. La frecuencia esperada de cualquier celda de una tabla de contingencia puede calcularse de manera inmediata, con sólo conocer los totales por renglón y por columna para esa celda.

(V) (F) 8. Si el valor chi-cuadrada de una observación es cero, sabemos que nunca habrá diferencia entre las
frecuencias observadas y las esperadas.

(V) (F) 9. La precisión y la utilidad de una prueba chi-cuadrada son altamente dependientes de la calidad de los datos de la prueba.

(V) (F) 10. Al determinar el número de grados de libertad para una prueba chi-cuadrada de bondad de ajuste,
la estimación de los parámetros de la población a partir de los datos de las muestras no tiene ningún impacto.

(V) (F) 11. El análisis de regresión se usa para describir qué tan bien una ecuación de estimación describe la relación
que se está estudiando.

(V) (F) 12. Dado que la ecuación para una recta es Y'= 26-24X, podemos decir que la relación de Y con X es
directa y lineal.

(V) (F) 13. Un valor r2 cercano a cero indica una fuerte correlación entre X  y  Y.

(V) (F) 14. Los análisis de regresión y correlación se usan para determinar relaciones de causa y efecto.

(V) (F) 15. El coeficiente de correlación de la muestra, r, es simplemente la raíz cuadrada de r2, y no podemos interpretar su significado
directamente como un porcentaje de algún tipo.

(V) (F) 16. El error estándar de la estimación mide la variabilidad de los valores observados alrededor de la ecuación
de regresión.

(V) (F) 17. La recta de regresión se deriva de una muestra y no de toda la población.

(V) (F) 18. Podemos interpretar el coeficiente de determinación de la muestra como la cantidad de la variación
en Y que explica la recta de regresión.

(V) (F) 19. La ecuación de estimación es válida sólo en el mismo intervalo que el dado por los datos originales
de la muestra para los cuales se desarrolló.

(V) (F) 20. En la ecuación Y'= a + bX para la variable dependiente Y  y  la variable independiente X, la ordenada
Y es b.

(V) (F) 21. Supongamos que la pendiente de una ecuación de estimación es positiva. Entonces el valor de r debe
ser la raíz cuadrada positiva de r2.

(V) (F) 22. Si r=0.8, entonces la ecuación de regresión explica el 80% de la variación total en la variable dependiente.

(V) (F) 23. El coeficiente de correlación es el porcentaje de la variación total de la variable dependiente explicada
por la regresión.

(V) (F) 24. El error estándar de la estimación se mide perpendicularmente desde la recta de regresión más que
sobre el eje Y.

(V) (F) 25. Una ecuación de regresión no puede ser válida al ampliarse fuera del intervalo de la muestra de la variable
independiente.

(V) (F) 26. Un valor r2 mide sólo la fuerza de una relación lineal entre las dos variables X  y  Y.

(V) (F) 27. Un valor pequeño de r2 implica que no existe una relación de causa-efecto significativa entre X  y  Y.

Richard I.L. David S.

martes, 1 de noviembre de 2011

10. Teorema del Límite Central

Si la población o el proceso del cual se extrae una muestra tienen una distribución normal, entonces la distribución de muestreo para la media también será una distribución normal, independientemente del tamaño de la muestra.

Sin embargo, ¿qué ocurre si una población NO tiene una distribución normal? Existe un teorema llamado Teorema del Límite Central.

El Teorema del Límite Central establece que a medida que el tamaño de la muestra aumenta, la forma de la distribución de muestreo para la media se aproxima a la de una distribución normal, independientemente de la forma de la distribución de la población de la cual se extrajo la muestra.

En el trabajo práctico podemos suponer que la distribución de muestreo para la media es una distribución aproximadamente normal siempre que el tamaño de la muestra sea n >= 30.

En poblaciones que son sólo ligeramente normales será suficiente una tamaño de muestra más pequeño. Pero un tamaño de muestra de por lo menos 30 será suficiente aún en la situación poblacional más adversa.

EN CONCLUSIÓN.
El Teorema del límite central indica que, independientemente de la forma de la distribución de población, la distribución muestral de medias se aproximará a la distribución de probabilidad normal. Cuanto mayor sea el número de observaciones en cada muestra, mayor será la convergencia.

9. Distribución Muestral de Medias

Las muestras se utilizan para estimar características de la población.
Sin embargo como la muestra es parte o porción representativa de la población, es poco probable que la media de la muestra sea exactamente igual a la media de la población.
Siempre hay una diferencia y esa diferencia se llama error de muestreo.

Error de muestreo.- La diferencia entre un estadístico de la muestra y el parámetro de la población.


Ejemplo: tenemos una población conformada por 79, 106, 99, 91, 115 la media será µ = 98
Si tomamos dos muestras por ejemplo de 79 + 115 la media muestral será µxbarra = 97
El error de muestreo entonces será: (97 - 98) = -1,0


Cara muestra tiene distinto error y esto ocurre por pura casualidad. Se debe además por la selección aleatoria de la muestra

Ahora, si organizamos mejor las medias de todas las muestras posibles en una distribución de probabilidad, obtenemos una distribución muestral de medias.

Distribución muestral de medias.- Es una distribución de todas las medias posibles de un determinado tamaño de muestra de la población.

8. Distribucion Normal

http://www.youtube.com/watch?v=woEjc5fvZx4&feature=colike

miércoles, 12 de octubre de 2011

7. ¿Cómo describir los datos? Distribución de Frecuencias

La primera forma para describir los datos no agrupados es la Distribución de Frecuencias.
Una DDF presenta los valores y la frecuencia con que se presentan. Al ser mostrados en una tabla los valores de los datos se presentan en orden y, por lo general el valor más bajo aparece en la parte inferior de la tabla.

La utilización de una DDF tiene como objetivo principal organizar y presentar los datos, de manera que facilite su comprensión e interpretación.

Se puede graficar utilizando Histograas, polígono de frecuencias, Ojiva.

A continuación un link importante para ampliar el tema.

http://webdelprofesor.ula.ve/economia/hmata/Notas/Tabla%20de%20Distribuci%F3n%20de%20Frecuencias.pdf