11/4/16

GLOSARIO ESTADÍSTICO

ESTIMADOR

Es el valor numérico extraído de las observaciones de una muestra que se aproxima en mayor o menor medida al parámetro de la población sobre el que se quiere investigar. Para cada parámetro pueden existir varios estimadores diferentes y elegiremos el estimador con mejores propiedades, como insesgadez, eficiencia, convergencia y robustez (consistencia). El valor de un estimador proporciona lo que se denomina en estadística una estimación puntual del valor del parámetro en estudio. En general, se suele preferir realizar una estimación mediante un intervalo, esto es, obtener un intervalo [a,b] dentro del cual se espera esté el valor real del parámetro con un cierto nivel de confianza. Utilizar un intervalo resulta más informativo, al proporcionar información sobre el posible error de estimación, asociado con la amplitud de dicho intervalo. El nivel de confianza es la probabilidad de que a priori el verdadero valor del parámetro quede contenido en el intervalo.
(Fuentes 1, Fuente 2)


HISTOGRAMA

Un histograma es un gráfico de rectángulos que tiene su base en el eje de las abscisas (eje horizontal o eje de las equis); con anchura igual cuando se trata de representar el comportamiento de una variable discreta y anchura proporcional a la longitud del intervalo cuando se desea representar una variable continua. En este último caso el punto central de la base de los rectángulos equivale al punto medio de cada clase. Las alturas de los rectángulos ubicadas en el eje de la ordenadas (de las Y o eje vertical) corresponden a las frecuencias de las clases. El área de los rectángulos así formados es proporcional a las frecuencias de las clases. Los histogramas de frecuencias pueden construirse no sólo con las frecuencias absolutas, sino también con las frecuencias acumuladas y las frecuencias relativas. En este último caso el histograma recibe el nombre de histograma de frecuencias relativas, histograma de porcentajes o histograma de proporciones, según el caso.
Los histogramas tienen como función mostrar no únicamente una representación visual de los datos sino fundamentalmente tres características de su comportamiento, éstas son: i) la forma que presenta el histograma, ii) si existe algún intervalo donde se acumulan los datos o aparece una tendencia posicional de los mismos, y, por último, iii) el grado de dispersión o variabilidad de los datos.
(Fuente 1, Fuente 2)


HOMOCEDASTICIDAD

En estadística se dice que un modelo predictivo presenta homocedasticidad cuando la varianza del error condicional a las variables explicativas es constante a lo largo de las observaciones. Se emplea para nombrar la propiedad de algunos modelos de regresión lineal en los que los errores de estimación son constantes a lo largo de las observaciones. Una varianza constante nos permite disponer de modelos más fiables. Además, si una varianza, aparte de ser constante es también más pequeña, nos dará como resultado una predicción del modelo más fiable. La palabra homocedasticidad se puede desglosar en dos partes, homo (igual) y cedasticidad (dispersión). De tal manera que, si unimos estas dos palabras adaptadas del griego, obtendríamos algo así como misma dispersión o igual dispersión.
(Fuente 1, Fuente 2)


HETEROCEDASTICIDAD

En estadística se denomina heterocedasticidad cuando los errores no son constantes a lo largo de toda la muestra. El término es contrario a homocedasticidad. En otras palabras, en los modelos de regresión lineales se dice que hay elasticidad cuando la varianza de los errores no es igual en todas las observaciones realizadas. En caso de que haya heterocedasticidad no se cumple uno de los requisitos básicos de las hipótesis de los modelos lineales. Existen diferentes razones o situaciones en las que cabe encontrarse con perturbaciones heteroscedásticas. La situación más frecuente es en el análisis de datos de corte transversal, ya que los individuos o empresas o unidades económicas no suelen tener un comportamiento homogéneo. Otra situación en la que se presenta heteroscedasticidad es en muestras cuyos datos son valores que se han obtenido agregando o promediando datos individuales. La palabra heterocedasticidad se puede desglosar en dos partes, hetero (diferente) y cedasticidad (dispersión). De tal manera que, si unimos estas dos palabras adaptadas del griego, obtendríamos algo así como diferente dispersión.
(Fuente 1, fuente 2)


PARÁMETRO

Es una cantidad numérica calculada sobre una población y resumen los valores que esta toma en algún atributo. En estadística, un parámetro es un número que resume la gran cantidad de datos que pueden derivarse del estudio de una variable estadística. El cálculo de este número está bien definido, usualmente mediante una fórmula aritmética obtenida a partir de datos de la población. Los parámetros estadísticos son una consecuencia inevitable del propósito esencial de la estadística: crear un modelo de la realidad.
El estudio de una gran cantidad de datos individuales de una población puede ser farragoso e inoperativo, por lo que se hace necesario realizar un resumen que permita tener una idea global de la población, compararla con otras, comprobar su ajuste a un modelo ideal, realizar estimaciones sobre datos desconocidos de la misma y, en definitiva, tomar decisiones. A estas tareas contribuyen de modo esencial los parámetros estadísticos. Los parámetros generalmente se representan con letras griegas para distinguirlos de los estadísticos de muestra. Por ejemplo, la media de la población se representa con la letra griega mu (μ) y la desviación estándar de la población, con la letra griega sigma (σ). Los parámetros son constantes fijas, es decir, no varían como las variables. Sin embargo, sus valores por lo general se desconocen, porque es poco factible medir una población entera. Hay tres tipos parámetros estadísticos: de centralización, de posición y de dispersión.
(Fuente 1, fuente 2, fuente 3)

No hay comentarios:

Publicar un comentario