6/6/15

GLOSARIO ESTADÍSTICO

COHORTE

Cohorte es cualquier grupo humano definido por haber experimentado cierto acontecimiento en un mismo periodo de tiempo. El acontecimiento puede ser de muy diverso tipo, como el haberse casado, haber seguido un curso docente, haber publicado un libro, etc. (cohortes de casamientos, cohorte escolar, cohorte literaria, etc.) Un caso específico de cohorte es la de nacimientos, es decir, la que constituyen las personas nacidas durante un mismo intervalo de tiempo (generalmente un año). A este tipo de cohorte se la llama, en demografía, "generación". Sin embargo, en muchas otras disciplinas se confunden ambos términos, y se habla de la "generación del 27", o de la "generación X" cuando, en estricta lógica demográfica, debería hablarse de cohortes. También es frecuente hablar de generaciones para referirse a los ascendientes y descendientes familiares dentro de una misma línea de filiación. Aunque este es, de hecho, el uso más antiguo y extendido, resulta menos unívoco y peor definido que el uso demográfico. (Fuente)

En epidemiología, el cohorte es un Conjunto de individuos de una población que han vivido una misma experiencia o que presentan un conjunto de criterios comunes y que forman parte de una observación epidemiológica. Los estudios de cohorte se inician con la identificación de individuos con y sin el factor que se va a investigar (un factor de riesgo), posteriormente se realiza un seguimiento de los individuos y se estima cómo se distribuye la enfermedad entre los que poseen y no poseen dicha característica. Los estudios de cohortes pueden ser prospectivos o retrospectivos. (Fuente)


DISPERSIÓN

Es la distribución estadística de un conjunto de valores, mide cuán lejos están éstos a su media aritmética. Así cuanto menos disperso es el conjunto más cerca del valor medio están sus valores. Para reconocer cómo están distribuidos los datos se utilizan las medidas de dispersión, entre las que se encuentran el rango o recorrido estadístico que es la diferencia entre el valor máximo y el mínimo en un grupo de números aleatorios, y que se obtiene dividiendo el número mayor con el menor de los datos estadísticos. En segundo lugar está el medio rango o rango medio que es la media del mayor y menor valor, o la tercera parte entre el dato de menor valor y el dato de mayor valor. En tercero, la varianza que mide la propagación de los valores respecto al valor central. Debido a que esta última no se comprende muchas veces, se define otra medida denominada desviación típica o desviación. (Fuente)


MEDIDAS DE DISPERSIÓN

Las medias de tendencia central o posición nos indican donde se sitúa un dato dentro de una distribución de datos. Las medidas de dispersión, variabilidad o variación nos indican si esos datos están próximos entre sí o sí están dispersos, es decir, nos indican cuán esparcidos se encuentran los datos. Estas medidas de dispersión nos permiten apreciar la distancia que existe entre los datos a un cierto valor central e identificar la concentración de los mismos en un cierto sector de la distribución, es decir, permiten estimar cuán dispersas están dos o más distribuciones de datos. Estas medidas permiten evaluar la confiabilidad del valor del dato central de un conjunto de datos, siendo la media aritmética el dato central más utilizado. Cuando existe una dispersión pequeña se dice que los datos están dispersos o acumulados cercanamente respecto a un valor central, en este caso el dato central es un valor muy representativo. En el caso que la dispersión sea grande el valor central no es muy confiable. Cuando una distribución de datos tiene poca dispersión toma el nombre de distribución homogénea y si su dispersión es alta se llama heterogénea. (Fuente)

Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la variabilidad de una distribución, indicando por medio de un número si las diferentes puntuaciones de una variable están muy alejadas de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, y cuanto menor sea, más homogénea será a la media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos. Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmética. Pero la suma de las desviaciones es siempre cero, así que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (desviación media) y otra es tomando las desviaciones al cuadrado (varianza). (Fuente)


HOMOGENEIDAD

La noción de homogeneidad define a la igualdad mayor o menor de los valores de una variable o de una combinación de características en un conjunto geográfico. Los parámetros de dispersión estadística, en particular la varianza, miden su inversa, la heterogeneidad. La región homogénea es un tipo de región que presenta mayor semejanza entre las unidades que la componen que con las unidades que pertenecen a otras regiones. Criterios muy diferentes y desigualmente complejos pueden utilizarse para localizar regiones homogéneas. Los ejemplos más frecuentes corresponden a una identidad de condiciones físicas fuertes (zonas climáticas, regiones botánicas), a similitudes sociales desarrolladas al abrigo de fronteras territoriales (regiones históricas, regiones culturales), o a combinaciones de estos dos tipos de procesos (homogeneidad del paisaje). La homogeneidad se define siempre en relación con un cierto nivel de resolución o de generalización de las unidades geográficas, y sólo tiene en cuenta las variaciones observadas a una cierta escala, y según un número limitado de criterios. (Fuente)

Homogéneo significa, en el contexto de la estratificación, que no hay mucha variabilidad. Los estratos funcionan mejor cuanto más homogéneos son cada uno de ellos respecto a la característica a medir. Por ejemplo, si se estudia la estatura de una población, es bueno distinguir entre los estratos mujeres y hombres porque se espera que, dentro de ellos, haya menos variabilidad, es decir, sean menos heterogéneos. Dicho de otro modo, no hay tantas diferencias entre unas estaturas y otras dentro del estrato que en la población total. (Fuente)


PONDERACIÓN

La ponderación es una medida de tendencia central que es conveniente cuando un conjunto de datos tiene una valor correspondiente con respecto a los demás datos, esto se obtiene multiplicando cada uno de los datos por su ponderación o peso para luego poderlo sumar, logrando así una suma equilibrada, después que se realiza este procedimiento se divide con el resultado que dio la suma de los pesos dando así el resultado de la media ponderada.
Los sistema de ponderación de las calificaciones de los centros estudiantiles se basan en el parámetro de ponderación para así poder asignarles un peso particular a cada uno de los exámenes que influye en la calificación media, estos resultados se suman y se divide para así poder tener todas las notas. El vocablo ponderación deriva del latín “ponderatĭo, -ōnis” que en la real academia lo definen como “la atención, apreciación, peso y cuidado con lo que se dice o se hace algo”, Esto quiere decir que la ponderación es algo usual que utilizan en los mercados bancarios, financiero, cotizables, crediticios, debido a que se habla de la ponderación de las empresas o de las acciones con respecto al índice que se establece como una comparación con el volumen negociado, ya sea positivo o negativo de acuerdo a como se exprese. La ponderación también ayuda para calcular o evaluar algo teniendo como referencia distintos tipos de parámetros de acuerdo a aquellos que se vaya a ponderar que no solo se le asigna un valor o aprecio a nivel moral o subjetivo que puede a desencadenar un valor monetario y económico. (Fuente)


VEROSIMILITUD

Es una función de los parámetros de un modelo estadístico que permite realizar inferencias acerca de su valor a partir de un conjunto de observaciones. La noción de verosimilitud procede del término inglés likelihood que, desde sus orígenes estuvo vinculado al concepto de probabilidad, probability, aunque denotando un vínculo de causalidad más débil. (Fuente)

Cuando la población es discreta, la función de verosimilitud es la probabilidad de que ocurra la realización que efectivamente ha ocurrido. Cuando la población es continua, la función de verosimilitud es una densidad y no una probabilidad. De hecho, la probabilidad de que ocurra una realización concreta de la muestra es siempre igual a cero, sea cual sea el valor del parámetro. Pero la densidad de la muestra para una realización representa la probabilidad alrededor de esa realización, por lo que básicamente los razonamientos anteriores, que han sido desarrollados para variables discretas, se mantienen aunque la población sea continua. (Fuente)

No hay comentarios:

Publicar un comentario