miércoles, 10 de septiembre de 2008

Curva de Lorenz

La curva de Lorenz es un caso de una medidad de concentración. Estos estadísticos se aplican a variables socio-económicas que son susceptibles de ser repartidas, como puede ser el nivel de renta, los salarios, beneficios, etc. El reparto de las variables puede ser en función de zonas geográficas, ubicaciones o categorías.

El objetivo es observar y mediar como se reparte el total de la variable de interés:



entre los individuos de la población.


Curva de Lorenz

La curva de Lorenz es la curva que pasa por los pares de puntos donde:

  • con
Podemos observar que es la frecuencia relativa acumulada. También podemos ver que es la distribución de cada uno de los valores o el porcentaje del total acumulado por los individuos con un valor observado .
Otra característica que nos llama la atención es que ambas medidas toman valores entre 0 y 1.

Propiedades:

  1. La curva de Lorenz siempre empieza en el punto (0,0) y termina en el punto (1,1)
  2. Es un curva creciente.
  3. Siempres es inferior o igual que la diagonal que pasa por los puntos (0,0) y (1,1).

Por lo tanto para realizar la representación de la curva en primer lugar vamos a representar la recta (0,0) y (1,1) y después vamos representar cada par de puntos .

La curva de Lorenz tendrá la siguiente estructura:



Por lo tanto cuanto más cercana este la curva a la digonal implica una mayor equidistribución. Y cuando más lejana esté menor equidistribución en el reparto del total.



miércoles, 3 de septiembre de 2008

Muestreo Aleatorio Simple: Tamaño muestral


En primer problema con el que nos encontramos a la hora de poner en práctica un diseño muestral dado, es la elección del tamaño de muestra, ya que la mayoría de las veces estamos sujetos a restricciones de algún tipo, como pueden ser económicas o precisión. En el caso del muestreo aleatorio simple el tamaño muestral viene dado por:



donde el valor varía según el parámetro que se quiera estimar. En el caso que se quiera estimar la media viene dado por:



Cuando nos interesa estimar el total:



Y si lo que queremos estimar es una proporción tenemos que:




Donde:

  • k, es la abcisa que deja una probabilidad a su derecha, es un valor fijado de antemano por el investigador o por los requerimentos del estudio.
  • e, es el error máximo admisible que se quiere considerar, al igual que el valor k es un valor fijado de antemano por el investigador.
Puesto que n tiene que ser un número natural, tomaremos el valor entero más próximo por exceo al obtenido en la fórmula.

Como se puede observar al intentar obtener el un tamaño muestral nos encontramos con que en las fórmulas aparecen parámetros que son desconocidos antes de realizar el estudio como es el caso de la cuasivarianza o la proporción poblacional. Ante estos casos lo que debemos hacer es lo siguiente:

  • Si la muestra o el estudio ha sido realizado con aterioridad tendremos un valor que lo podremos utilizar para obtener un valor aproximado de n.
  • Si entonces calcularemos n por el peor valor de , con lo que tendremos el mayor tamaño muestral para esa varianza.
  • Si conocemos el rango de la variable entonces lo podremos estimar por



  • Si no disponemos de alguna de estas informaciones entonces cojeremos una muestra piloto para estimarla.

  • Para el caso de una proporción si no disponemos de información de un estudio anterior consideraremos P = Q = 0.5, que nos proporcionará el mayor tamaño muestral posible para una proporción.

==================================================

miércoles, 27 de agosto de 2008

Muestreo Aleatorio Simple: Estimadores y Varianzas



ESTIMADORES DE LOS PARÁMETROS


Nos vamos a restringir a tres tipos de parámetros: el total poblacional de una variable X:


la media poblacional de esta misma variable:



y la proporción de la población que pertenece a un grupo determinado:



donde es una variable indicadora que toma valor 1 si la unidad seleccionada posee la característica y toma el valor 0 si no la posee.

Los estimadores son los siguientes:

- TOTAL, es el total muestral:



- MEDIA, es la media meustral:



- PROPORCIÓN, es la proporción muestral:




Estos estimadores son insesgados para los parámetros poblacionales.

-------------------------------------------------------------------------------------------------------------------------------------------

ESTIMACIONES DE LAS VARIANZAS

A continuación vamos a mostrar la expresión de las varianzas para los parámetros antes mostrados.

Varianza de la media muestral:



donde es la fracción de muestreo, y es la cuasivarianza muestral.

Varianza del total muestral:



Varianza de la proporción:



Por lo tanto el error de muestreo para cada uno de los parámetros será la raiz cuadrada de las anteriores varianzas. Además los estimadores anteriores son estimadores insesgados para las varianzas poblacionales.

martes, 26 de agosto de 2008

Muestreo Aleatorio Simple




El muestreo aleatorio simple es el diseño muestral en el cual n unidades distintas son seleccionadas de entre las N unidades poblacionales, de forma que cada posible combinación de unidades tiene la misma probabilidad de ser elegida. Así llamamos U a la población, este diseño muestral viene definido por el par , donde el soporto del diseño está constituido por todas las muestras de tamaño n que se pueden obtener de U, y la distribución de probabilidad asociada es la uniforme.

Así pués el muestreo aleatorio simple que suele denotarse por , se puede definir como:



tal que

.

Por otra parte la probabilidad de que una unidad cualquiera pertenezca a la muestra es:



y la probabilidad que tienen dos unidades de pertenecer simultáneamente a la muestra viene dada por:


lunes, 25 de agosto de 2008

El Blog

Blog de actualización periódica dedicado a la estadística.