Estadística Inferencial

Estadística Inferencial


Estadística Inferencial se refiere al proceso de lograr generalizaciones acerca de las propiedades del todo, población, partiendo de lo específico, muestra. las cuales llevan implícitos una serie de riesgos. Para que éstas generalizaciones sean válidas la muestra deben ser representativa de la población y la calidad de la información debe ser controlada, además puesto que las conclusiones así extraídas están sujetas a errores, se tendrá que especificar el riesgo o probabilidad que con que se pueden cometer esos errores. La estadística inferencial es el conjunto de técnicas que se utiliza para obtener conclusiones que sobrepasan los límites del conocimiento aportado por los datos, busca obtener información de un colectivo mediante un metódico procedimiento del manejo de datos de la muestra.

En sus particularidades la Inferencia distingue la Estimación y la Contrastación de Hipótesis. Es estimación cuando se usan las características de la muestra para hacer inferencias sobre las características de la población. Es contratación de hipótesis cuando se usa la información de la muestra para responder a interrogantes sobre la población.



Muestreo

La teoría del muestreo estudia la relación entre la población y las muestras tomadas de ella, es de gran utilidad en muchos campo por ejemplo para estimar magnitudes desconocidas de una población tales como la media y la varianza, llamadas a menudo parámetros de la población o simplemente parámetros a partir de conocimientos de estas magnitudes de muestra, que se llaman estadísticas de la muestra o simplemente estadísticas.

Tipos de muestreo:

Muestras aleatorias y números aleatorios

El análisis de los métodos de muestra y problemas relacionados se llama el diseño del experimento una forma para obtener una muestra respectiva es mediante el muestreo aleatoria de acuerdo con el cual miembro de la población tiene la misma probabilidad de ser incluido en la muestra. Al elegir una muestra se espera conseguir que sus propiedades sean extra probables a la población. Este proceso permite ahorrar recursos a la vez obtener resultados parecidos a los que se realizan de toda la población. Cabe mencionar que para el muestreo sea válido y se pueda realizar un estudio adecuado (que considere no solo hacer estimaciones de la población si no estimar del marginó). Si la población es infinita o si el muestreo es con reposición, los resultados anteriores se reducen a:

µx=µ y σx=σ/√n


Para valores grandes de N(N>30) la distribución de muestreo de medias es aproximadamente normal con media M desviación típica , independencia de la población. En caso de la población este normalmente distribuida la distribución de muestreo de medias también lo esta, incluso paran pequeños valores de N (o seas <30). Distribución de muestreo de proporciones Supongamos que una población es infinita y que la probabilidad de que ocurra es q=1-p.

por ejemplo:

la población puede ser la de todas las posibles tiradas de una moneda en la que la probabilidad del suceso <> es p=1/2 en el caso de una moneda. Distribución de muestreo para ser cuya media y desviación típica denotaremos por MS2 Y σS2 . De todas las posibles combinaciones de estas muestras de las dos poblaciones podemos obtener una distribución de las diferencias S1-S2 que se llama distribución de muestreo de las diferencias de las estadísticas. La media y la desviación típica de esta distribución de muestreo denotadas respectivamente por MS1-MS2 Y σS1-S2 viene después por:


MS1-S2=MS1-MS2 Y σ S1-S2=√ σ S2+ σ S2


Supuesto que muestras escogidas no dependan en absoluto una de otra. Si S1 Y S2 son las medidas muéstrales la distribución de muestreo de las diferencias de medias viene dada para poblaciones.

Ejemplo:

las alturas de 3000 estudiantes varones de una universidad están normalmente distribuidas con media 68.0 y desviación típica 3.0 si se tomo 80 muestras de estudiantes cada una ¿Cuáles será la media y la desviación típica esperado de la resultante distribución de muestreo?

Solución el numero de muestras de tamaño 25 podrán elegirse de un grupo de 3000 estudiantes con y sin reposición son (3000) 25 y (3000)25 que son muchos mayores que 80 por tanto obtenemos una verdadera distribución de muestro experimental.

No obstante como el número de muestras es grande debería haber un buen acuerdo entre ambos:

(a) µx=µ=68.0in y σ



Ejemplo:

500 bolsas de cojinete tiene un peso medio de 5.22gr y una depuración de 0.2gr hallada de una muestra al azar de 100 bolas de este conjunto tengan un peso total (A) entre 496 y 500 gr (B)¬¬ mas 510gr

Solución:

para la distribución muestreo de muestra de medidas



σx= σ /n (√ NP-N)/(NP-1)= 30/√100 (√500-100)/(500-1)=.027g



a) El peso total estará 4.96 y 500gr si el peso medio 100 bolas esta entre 4.96 y 5.02= -2.2 y 5.00 unidades estándar 2.22 5.00 unidades estándar=(500-5.02)/0.027=-.04



Propiedad perdida :

(A/Z=2.22 Y 2= .74= A /z=2.22 y z =o)- a/2=.74 y z=0



b) El paso total exaspera de 510gr y el peso si el peso mide de la (5.10) 100 bolas excede 5.10

5.10 en unidades estándar

(5.10-5.02)/0.02=2.99



Probabilidad perdida= (area ala derecha de Z= A 2.96)= Area de la derecha z =a 10 =area /Z=0 Y 2.96 Z 0.5-.4985=.0015.



Intervalo de confianza



En estadística a un par d números entre los cuales se estima que estará cierto valor desconocido con una determinada probabilidad de acierto formalmente este número determina un intervalo que se calcula a partir de datos de una muestra y el valor desconocido es un parámetro proporcional la probabilidad de éxito de estimación se representa por 1-A y se denomina nivel de confianza en circunstancia A es llamado error aleatorio o nivel de significación , esto es una medida de las posibilidades de falla en la estimación mediante tal intervalo.



Serian estimaciones del punto y estimaciones de intervalo su finalidad. Una estimación de parámetro de la población dado por dos números entre los cuales se pueden considerar al parámetro, se llama una estimación de intervalo del parámetro las estimaciones del parámetro indica la precisión de una estimación y son por tanto preferibles al as estimaciones del punto

Estimaciones de punto y estimaciones de intervalo; fungibilidad.

Una estimación de un parámetro de la población se pueden considerar encajado al parámetro . las estimaciones de intervalo indica la precisión de una estimación y son por lo tanto preferibles alas estimulaciones.

Ejemplo:

Si decimos que una distancia sean medido como: 5.28 metros, estamos dando una estimación y nos informa de su fiabilidad.



Estimación de intervalo de confianza para parámetros de población

Se han µs y σs la media desviación aplica ( error típico ) de la distribución de muestreo o de un estadístico S. entonces si las distribución de muestreo de S es aproximadamente normal.(que si el tamaño del muestreo N ≥30) podemos esperar a hallar un estadístico S es la media de la muestra real S que este en los intervalos µs-σs a µs,σs-2σs a µs+2σs; o µs+3σs. Alrededor del el 68.27%,95.45% y 99.73% por el tiempo respectivamente por el tiempo equivalentemente podemos esperar hallar µs en los intervalos s-σs a s+σ,s-2σs a s+2σs o s-3σs a 5+3σs alrededor de 67.8% 95.45% y 99.93% del tiempo respectivamente por esa razón llamamos a esos respectivos intervalos los intervalos de confianza 68.27%,95.45% 99.73% para estimar µs.

Intervalos de confianza para las medidas

Si el estadístico s es la media de la muestra entonces es el limites de confianza 95% y 99% para estimar la media µ la población viene dados por la media por 1.96 σx y +± ,espectivamente.los limites de confianza para estinar la media de población µ viene dados por la x± a σx, donde(que depende del nivel particular de confianza deseada.se puede usar los valores la σx vemos que los limites de confianza para la media de ala población que están dados por

Intervalos de confianza para proporciones

Si el estadístico s es la proporción de éxitos de una muestra de tamaño N sacada de una población binomial en la que P es laproporcion de éxitos en tonses los limites de confianza para que vienen dadod por P± Zc σp usando los valores de la varianza p obtenidos en donde vemos que los limetes de confianza para la proporción de la población bienene dados por

 
P±Zc x√Pa/N=P±Zc (√Np-n)/N


SI EL MUESTREO ES DE UNA POBLACION DE INFINITA ES

P±Zc x√Pa/N (√Np-n)/N


INTERVALOS DE CONFIANZA PARA DIFERENCIA Y SUMAS


Si s1 y s2 son dos estadísticos muestrales con distribuciones de muestreo aproximadamente normales los limites de confianza para la diferencia de los parámetros de ploblacion correspondientes a s1,s2 vienen dados por

S1-s2±Zcσs1-s2 =s1-s2±

INTERVALOS DE CONFIANZA PARA DESVIACION TIPICA

Los limites de confianza para la desviación típica de σ de una población distribuida estimados con una muestra con disuasión típica s, si vienen dados por


s±Zcσs=s±Zc σ/2n


Teorema de Límite Central

Si se obtiene una muestra de una población normal, entonces la media muestral tiene una distribución normal sin importar el tamaño de la muestra. Sin embargo, se puede demostrar que de hecho no importa el modelo de probabilidad del cual se obtenga la muestra; mientras la media y la varianza existan, la distribución de muestreo de X se aproximará a una distribución normal conforme n aumente. Lo anterior constituye uno de los más importantes teoremas en inferencia estadística y se conoce como



En muchos casos, puede concluirse en forma segura que la aproximación será buena mientras n > 30.


Para mostrar la validez del teorema del limite central veamos el siguiente ejemplo


Suponga que de una población consistente en los valores 0, 2, 4, 6 y 8, se toman muestras de tamaño 2 con remplazo.


X Frecuencia Frecuencia Relativa

0 1 1 /5 = .2

2 1 1/5 = .2

4 1 1/5 = .2

6 1 1/5 = .2

8 1 1/5 = .2


Solución:

Se calcula la media poblacional, la varianza y desviación estándar poblacional.



μ=∑X/n



μ= (+2+4+6+8)5 = 20/5 = 4



σ2=∑ (( X-μ2)/n)



σ2=((0-4)2+(2-4)2+(4+4)2+(6-4)2+(8-4)2)/5 = 40/5 =8



σ2=√8 =2.83



Se toman muestras de tamaño dos con remplazo.



Muestra X Muestra X Muestra X

0, 0 0 4, 0 2 8, 0 4

0, 2 1 4, 2 3 8, 2 5

0, 4 2 4, 4 4 8, 4 6

0, 6 3 4, 6 5 8, 6 7

0, 8 4 4, 8 6 8, 8 8

2, 0 1 6, 0 3

2, 2 2 6, 2 4

2. 4 3 6, 4 5

2, 6 4 6, 6 6

2, 8 5 6, 8 7


Se agrupa a las medias muéstrales en la tabla de frecuencia siguiente:


X F

0 1

1 2

2 3

3 4

4 5

5 4

6 3

7 2

8 1



Se calcula la media poblacional de medias , la varianza de la medias y desviación estándar de las medias ó error estándar de las medias.



μX=∑(ƒ(X))/N



μX=(1(0)+2(1)+3(2)+4(3)+5(4)+4(5)+3(6)+2(7)+1(8))/25 = 100/25 = 4



σ2x =∑ (ƒ(X- μX)2)/N



σ2x = (1(0-4)2+2(1-4)2+………….1(8-4)2)/25 = 100/25 = 4



σx =√4 = 2