lunes, 19 de septiembre de 2011

Hipótesis
Una hipótesis es una proposición aceptable que ha sido formulada a través de la recolección de información y datos, aunque no esté confirmada, sirve para responder de forma tentativa a un problema con base científica.






Pasos de la hipótesis:


Los pasos de la Hipótesis son reunir información, compararla, dar posibles explicaciones, escoger la explicación más probable y formular una o más hipótesis. Después de hacer todos estos pasos (en la ciencia) se realiza una experimentación, en la que se confirma la hipótesis o no. Si la hipótesis es confirmada, entonces lo planteado como hipótesis es verdadero. En caso de que no sea confirmada, la Hipótesis es falsa.
Importancia de la hipótesis.
Las hipótesis son el punto de enlace entre la teoría y la observación. Su importancia en que dan rumbo a la investigación el sugerir los pasos y procedimientos que deben darse en la búsqueda del conocimiento.
Cuando la hipótesis de investigación ha sido bien elaborada, y en ella se observa claramente la relación o vínculo entre dos o más variables, es factible que el investigador pueda:
Elaborar el objetivo, o conjunto de objetivos que desea alcanzar en el desarrollo de la investigación.
Seleccionar el tipo de diseño de investigación factible con el problema planteado. Seleccionar el método, los instrumentos y las técnicas de investigación acordes con el problema que se desea resolver, y seleccionar los recursos, tanto humanos como materiales, que se emplearán para llevar a feliz término la investigación planteada.




Función de la Hipótesis:


Cuando se describe su importancia, se plantean algunas de las funciones que ellas cumplen, porque además de ser guías en el proceso de investigación, también pueden servir para indicar que observaciones son pertinentes y cuales no lo son con respecto al problema planteado.
La hipótesis puede señalar loas relaciones o vínculos existentes entre las variables y cuales de ellas se deben estudiar, sugieren una explicación en ciertos hechos y orientan la investigación en otros, sirve para establecer la forma en que debe organizarse eficientemente el análisis de los datos.






Tipos de Variables: 




 
Videos:


Tipos de Distribuciones




Chi-cuadrado 

En estadística y estadística aplicada se denomina prueba χ² (pronunciado como "ji-cuadrado" y a veces como "chi-cuadrado") a cualquier prueba en la que el estadístico utilizado sigue una distribución χ² si la hipótesis nula es cierta. Algunos ejemplos de pruebas χ² son:

      La prueba χ² de Pearson, la cual tiene numerosas aplicaciones:
      La prueba χ² de frecuencias
      La prueba χ² de independencia
      La prueba χ² de bondad de ajuste
      La prueba χ² de Pearson con corrección por continuidad o corrección de Yates
      La prueba de Bartlett de homogeneidad de varianzas

 La prueba χ² de Pearson es considerada como una prueba no paramétrica que mide la discrepancia entre una distribución observada y otra teórica (bondad de ajuste), indicando en qué medida las diferencias existentes entre ambas, de haberlas, se deben al azar en el contraste de hipótesis. También se utiliza para probar la independencia de dos variables entre sí, mediante la presentación de los datos en tablas de contingencia.
Los grados de libertad gl vienen dados por :

gl= (r-1)(k-1). Donde r es el número de filas y k el de columnas.
       Criterio de decisión:
 
Donde t representa el valor proporcionado por las tablas, según el nivel de significación estadística elegido.

La distribución χ² tiene muchas aplicaciones en inferencia estadística. La más conocida es la de la denominada prueba χ² utilizada como prueba de independencia y como prueba de bondad de ajuste y en la estimación de varianzas.
 
Prueba T de student


En probabilidad y estadística, la distribución t (de Student) es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida cuando el tamaño de la muestra es pequeño.

Aparece de manera natural al realizar la prueba t de Student para la determinación de las diferencias entre dos medias muestrales y para la construcción del intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando se desconoce la desviación típica de una población y ésta debe ser estimada a partir de los datos de una muestra.

La prueba estadística t de Student para muestras dependientes es una extensión de la utilizada para muestras independientes. De esta manera, los requisitos que deben satisfacerse son los mismos, excepto la independencia de las muestras; es decir, en esta prueba estadística se exige dependencia entre ambas, en las que hay dos momentos uno antes y otro después. Con ello se da a entender que en el primer período, las observaciones servirán de control o testigo, para conocer los cambios que se susciten después de aplicar una variable experimental.

Con la prueba t se comparan las medias y las desviaciones estándar de grupo de datos y se determina si entre esos parámetros las diferencias son estadísticamente significativas o si sólo son diferencias aleatorias.

Consideraciones para su uso
  • El nivel de medición, en su uso debe ser de intervalo o posterior.
  • El diseño debe ser relacionado.
  • Se deben cumplir las premisas paramétricas.

Pasos:
  1. Ordenar los datos en función de los momentos antes y después, y obtener las diferencias entre ambos.
  2. Calcular la media aritmética de las diferencias ( ).
  3. Calcular la desviación estándar de las diferencias (d).
  4. Calcular el valor de t por medio de la ecuación.
  5. Calcular los grados de libertad (gl) gl = N - 1.
  6. Comparar el valor de t calculado con respecto a grados de libertad en la tabla respectiva, a fin de obtener la probabilidad.
  7. Decidir si se acepta o rechaza la hipótesis.
http://www.youtube.com/watch?v=scIAcR42f_c


Distribución Normal


Esta distribución es frecuentemente utilizada en las aplicaciones estadísticas. Su propio nombre indica su extendida utilización, justificada por la frecuencia o normalidad con la que ciertos fenómenos tienden a parecerse en su comportamiento a esta distribución.

Muchas variables aleatorias continuas presentan una función de densidad cuya gráfica tiene forma de campana.

 En otras ocasiones, al considerar distribuciones binomiales, tipo B(n,p), para un mismo valor de p y valores de n cada vez mayores, se ve que sus polígonos de frecuencias se aproximan a una curva en "forma de campana".

En resumen, la importancia de la distribución normal se debe principalmente a que hay muchas variables asociadas a fenómenos naturales que siguen el modelo de la normal.
 
           Caracteres morfológicos de individuos (personas, animales, plantas,…) de una especie, p. ejm. Tallas, pesos, envergaduras, diámetros, perímetros…

           Caracteres fisiológicos, por ejemplo; efecto de una misma dosis de un fármaco, o de una misma cantidad de abono.

           Caracteres sociológicos, por ejemplo: consumo de cierto producto por un mismo grupo de individuos, puntuaciones de examen.

           Caracteres psicológicos, por ejemplo: cociente intelectual, grado de adaptación a un medio……

           Errores cometidos al medir ciertas magnitudes.

           Valores estadísticos maestrales, por ejemplo: la media.

           Otras distribuciones como la binomial o la de Poisson son aproximaciones normales…

 Y en general cualquier característica que se obtenga como suma de muchos factores.

3. Función De Densidad

Empleando cálculos bastante laboriosos, puede demostrarse que el modelo de la función de densidad que corresponde a tales distribuciones viene dando por la fórmula.

Función De Una Distribución

           Puede tomar cualquier valor (- ∞ ,+ ∞ )

           Son más probables los valores cercanos a uno central que llamados media

           Conforme nos separamos de ese valor µ , la probabilidad va decreciendo de igual forma a derecha e izquierda (es simétrica).

           Conforma nos separamos de ese valor µ , la probabilidad va decreciendo de forma más o menos rápida dependiendo de un parámetro s , que es la desviación típica



Ejercicios.

  Ejercicio1: Para comprobar la utilidad de una técnica de enriquecimiento intelectual un profesor realiza una prueba de rendimiento académico a una muestra de 16 estudiantes. Después aplica la técnica de enriquecimiento intelectual y luego de ello, vuelve a pasar la prueba de rendimiento. Los resultados obtenidos fueron:

 


10º
11º
12º
13º
14º
15º
16º
8
12
14
11
16
6
11
9
10
10
19
12
17
8
13
12
9
16
23
21
17
10
14
8
11
12
19
16
16
13
17
11

A un nivel de confianza del 95%, ¿Podemos rechazar que los rendimientos académicos son iguales antes que después frente a la alternativa de que se produce una mejora? Teniendo en cuenta que los sujetos en ambas muestras se trata de un contraste de igualdad de medias con datos emparejados.

Solución:
Ho = md = 0

H1 = md > 0

El estadístico de contraste en este caso es:


                                              
Procedemos a calcular las diferencias muestrales.

La media de las diferencias es 2,81 y la desviación típica 3,19, sustituyendo en el estadístico estos valores se obtiene:

Como el contraste es unilateral, buscamos en las tablas de la t de Student, con 15 grados de libertad, el valor que deja por debajo de sí una probabilidad de 0,95, que resulta ser 1,753.

El valor del estadístico es mayor que el valor crítico, por consiguiente se rechaza la hipótesis nula.
 La interpretación sería que el programa es efectivo e incrementa el rendimiento académico.
 

Ejercicio2: Las notas obtenidas en estadística de 5 individuos elegidos al azar de la sección 01 y de 6 individuos, elegidos también al azar de la sección 02 son las siguientes:


 


Sección 01
10
6
4
5
4

Sección 02
4
8
6
6
2
3


¿Puede concluirse a un nivel de confianza del 95% que las puntuaciones medias de ambas secciones son iguales, o por el contrario que hay diferencia entre ambas?

Solución:

Ho m1 = m2

H1 m1 > m2

 El estadístico de contraste en este caso es:

La muestra de la sección 01 tiene una media de 5,8 y una varianza de 4,96. En la muestra de la sección 02 la media es 4,83 y la varianza 4,14 sustituyendo en el estadístico estos valores se obtiene:



Como el contraste es bilateral, buscamos en las tablas de la t de Student, con 9 grados de libertad, el valor que deja por debajo de sí una probabilidad de 0,975, que resulta ser 2,262.

El valor del estadístico es menor que el valor crítico, por consiguiente se acepta la hipótesis nula.
La interpretación sería que no hay evidencia de diferencias significativas entre ambos grupos.



Ejercicio  3

Una muestra aleatoria de 100 muertes registradas en Estados Unidos el año pasado muestra una vida promedio de 71.8 años. Suponga una desviación estándar poblacional de 8.9 años. Queremos probar si la vida media hoy en día es mayor a 70 años con base en esa muestra. La muestra parecería indicar que es así pero ¿Cuál es la probabilidad de que la media de la muestra no refleje la verdadera media de la población?
 
Utilizar un nivel de significancia de 0.05.
 
Solución: Se trata de una distribución muestral de medias con desviación estándar conocida.

1.

Datos: μ =70 años   s = 8.9 años    x= 71.8 años   n = 100        α= 0.05

2. Establecemos la hipótesis

Ho; μ= 70 años.  H1; μ> 70 años.

 



3. Nivel de significancia  

α= 0.05, zα= 1.645                                                                   

4. Regla de decisión:
 Si z≤1.645 no se rechaza Ho.    

Si z> 1.645 se rechaza Ho.

5. Cálculos:

 





6. Decisión y justificación.

Como 2.02 >1.645 se rechaza Ho y se concluye con un nivel de significancia del 0.05 que la vida media hoy en día es mayor que 70 años.

Ejercicio 4.
Uso de la distribución t de student en pruebas de hipótesis.


Se desea saber si el gasto per cápita promedio en servicios de salud en estos países es significativamente menor que el gasto en los Estados Unidos.
La Hipótesis que se plantea es:
H0: μ= 3,633     Ha: μ< 3,633

Si H0 es cierta μ de EU de representa la media poblacional de los de gastos en en salud de los 20 de países.
 Premisas:
  • Varianza poblacional desconocida,  usamos entonces la varianza de muestra como aproximación s2 = 261,200.79 se calcula con la con fórmula:
  • los datos tienen una distribución normal.
  • los datos son son independientes.
  • el tamael tamaño de la muestra es < 30

Ejercicio 5.

 Ejercicio 6.

 Ejercicio 7.

Ejercicio 8.