Mostrando entradas con la etiqueta Gráficos y Diagramas. Mostrar todas las entradas
Mostrando entradas con la etiqueta Gráficos y Diagramas. Mostrar todas las entradas

27/4/24

GRÁFICO DE RADAR

 


El gráfico de radar, también llamado gráfico radial, gráfico de araña, gráfico de telaraña, gráfico polar, gráfico web, polígono irregular o diagrama de Kiviat, es una herramienta gráfica que permite visualizar datos multivariados en un plano bidimensional; las variable cuantitativas son representadas por ejes que parten desde un punto central y se distribuyen radialmente, manteniendo escalas iguales; los valores de las variables se unen formando un polígono, entonces la forma y extensión de este polígono permiten comparar diferentes dimensiones del conjunto de datos.

El gráfico de radar tiene un origen incierto, pero se le atribuye su desarrollo a Georg von Mayr, un estadístico alemán que en 1877 lo utilizó para representar ciertos tipos de datos; cabe indicar sin embargo, que en 1856, Florence Nightingale había usado ya, diagramas polares para ver estadísticas médicas. Este gráfico es ideal para identificar patrones, valores atípicos o similitudes entre variables; además, representa fortalezas y debilidades del rendimiento de productos, de equipos o de personas, utilizando un análisis sobre comparación de entidades y toma de decisiones; su aplicación puede darse en sectores como marketing, análisis de ventas, investigación, educación, etc. 

 

ELEMENTOS DE UN GRÁFICO DE RADAR

 - Ejes: Representan cada una de las variables o categorías que se evalúan, situándose cada eje desde el centro hacia el exterior de la gráfica de manera equidistante.

- Centro: Es el origen de todos los ejes de la gráfica, representa el valor mínimo (por lo general 0).

- Escala: Se utiliza para medir los valores de cada variable en cada eje; las escalas generalmente son uniformes en todos los ejes.

- Puntos de datos: Son las ubicaciones específicas de cada eje y representan el valor de una variable.

- Polígono de datos: Es el polígono que resulta de conectar los puntos de los datos de cada variable y que permite ver patrones, similitudes o diferencias existentes entre las variables; el área que se forma puede tener relleno de color o ser transparente.

- Variables o Dimensiones: Cada eje de la gráfica representa una variable, dimensión o indicador a evaluar, analizar o comparar.

- Líneas de referencia: Pueden formar círculos o polígonos que están unidos a los ejes de la gráfica radial, las que nos reflejan más claridad a la visualización o lectura de los valores (su uso es opcional).

- Leyenda: Se usa para poder identificar las categorías o series, sobre todo, cuando hay varios polígonos en la gráfica.



 

CONSTRUCCIÓN E INTERPRETACIÓN

- Definir las variables, categorías o dimensiones que se desea comparar, éstas deben ser cuantitativas y comparar entre 3 y 7 variables para mantener la claridad.
- Definir la escala estableciendo un rango uniforme de valores para todas las variables.
- Trazar los ejes radiales desde el centro y marcar los valores correspondientes a la escala.
- Escribir el nombre de cada variables al final de cada eje.
- Marcar el valor correspondiente al eje de cada variable y conectar los puntos con líneas para formar un polígono de datos.
- Personalizar usando colores o patrones para diferenciar las series de datos.
- Añadir etiquetas de leyenda.
- En la interpretación, para comparar variables se debe considerar que los valores cercanos al centro suelen ser más bajos y los valores alejados, indican mayor puntuación.  
- Identificar patrones, diferencias y similitudes observando la forma y extensión del polígono.  
- Buscar áreas del gráfico donde los valores sobresalgan o queden rezagados respecto al resto.  
- Relacionar las formas del polígono con el propósito del análisis, como rendimiento, calidad, comparaciones, entre otros.
 

10/6/23

PIRÁMIDE POBLACIONAL

 


 

DEMOGRAFÍA Y CARACTERÍSTICAS DEMOGRÁFICAS DE LA POBLACIÓN

La demografía es la ciencia que estudia estadísticamente las poblaciones humanas en un momento específico, analiza variables fundamentales como el tamaño, la estructura por género y la edad, también el crecimiento, la distribución geográfica, la movilidad de las poblaciones, etc., características que dependen de factores sociales, económicos y ambientales.
 
La demografía mide y analiza indicadores como natalidad, mortalidad y migración, permitiendo estudiar las dinámicas poblacionales y sus interacciones con el entorno; el desarrollo de la demografía está ligado con la aparición de los censos, cuyo propósito inicial, era el de contar a la población para recaudar impuestos, actualmente, constituye una fuente de información confiable, aportando datos para caracterizar el volumen, la composición y la dinámica poblacional en distintos territorios y a lo largo del tiempo.

Dentro de las herramientas más destacadas de la demografía está la pirámide poblacional, que se forma mediante histogramas de barras horizontales, representando la estructura de la población según sexo y edad para identificar los cambios demográficos, como los que tienen que ver con la natalidad, la mortalidad o la migración.

La demografía no solo estudia a la población en términos cuantitativos, sino también analiza su relación respecto al espacio físico y social donde habitan, crecen y se reproducen las personas; permitiéndonos observar aspectos que afectan directamente su estado de salud y bienestar, por lo tanto, es un recurso a la hora de planificar y diseñar Políticas Públicas vinculadas al desarrollo sostenible.


¿QUÉ ES PIRÁMIDE POBLACIONAL?

La pirámide poblacional, conocida también como pirámide de edad y género, es un gráfico diseñado para representar la estructura de una población en términos de edad y género de una determinada población y en un momento dado; es un histograma de barras horizontales que no sólo permite crear la composición demográfica, sino también, representar diversos fenómenos sociales, como las migraciones, la natalidad, mortalidad, epidemias, etc.

Más allá de ser una herramienta visual, la pirámide poblacional muestra información sobre las dinámicas sociales, políticas y económicas que explican la población; en un contexto histórico, en función de las edades, períodos o cohortes, permite comprender más claramente, los cambios estructurales y proyectar tendencias futuras; entonces, la pirámide poblacional es un instrumento fundamental en el estudio y la planificación demográfica.


CARACTERÍSTICAS DE UNA PIRÁMIDE POBLACIONAL

La pirámide de población está constituida por barras horizontales, representando cada una de ellas a un grupo de edad; los hombres ocupan la parte izquierda de la pirámide y las mujeres la parte derecha. La forma que adquiere la pirámide de población indica el comportamiento de las variables demográficas más relevantes como fecundidad, mortalidad y migración; que permiten analizar la dinámica poblacional. Su estructura conforma un medio para comparar la evolución de las poblaciones a lo largo del tiempo, mostrando las diferencias demográficas según el contexto de cada país; por ejemplo, en países de baja fecundidad y mortalidad, la pirámide adopta una forma rectangular, mientras que en poblaciones con un alto grado de envejecimiento (donde las tasas de fecundidad han disminuido porque la mayor parte de la población está conformada por personas mayores) la pirámide puede tener una forma de una "pirámide invertida".


CONSTRUCCIÓN DE UNA PIRÁMIDE POBLACIONAL

Para construir una pirámide poblacional, se sigue una serie de pasos y pautas organizadas en una estructura gráfica, recordando que esta herramienta es fundamental para analizar dinámicas poblacionales, realizar comparaciones entre territorios y comprender fenómenos demográficos como la fecundidad, la mortalidad, el envejecimiento, las epidemias, las guerras, las migraciones, entre otros.


 

Pasos para la Construcción de una Pirámide Poblacional

1. Recolección de Datos.

- Obtener tablas de población desglosadas por edad y sexo, utilizando datos confiables, como censos o estadísticas oficiales, organizados en intervalos quinquenales (0-4, 5-9, etc.), a fin de minimizar los errores de una mala declaración de edades; aunque suelen ser quinquenales, los intervalos pueden ajustarse según los objetivos del análisis.

- Representar los datos en números absolutos (cantidad de personas) o en relativos (porcentaje con respecto al total); en caso de representar a la población en porcentajes, se divide cada grupo entre el total poblacional y se multiplica por 100, esta información también nos permite comparar poblaciones de diferentes países o de diferentes periodos de la historia.


2. Crear el Marco del Gráfico

- Dibujar el eje vertical que representa a los grupos de edad en intervalos regulares (0-4, 5-9, etc.); donde las edades más jóvenes están en la parte inferior (base) y las más avanzadas, en la parte superior (cima o cúspide).

- Dibujar el eje horizontal que indica la cantidad o porcentaje de población; se divide en dos mitades: izquierda para hombres y derecha para mujeres.

- Definir las escalas manteniendo proporciones iguales a ambos lados del eje central, para garantizar precisión


3. Construcción de Barras Horizontales

- Representar los grupos etarios en barras horizontales, donde la longitud de las barras es proporcional a la cantidad de personas de un determinado grupo de edad y género, facilitando la identificación de tendencias sobre tasas de nacimientos, mortalidad y envejecimiento de la población.

- Ubicar las barras para hombres hacia la izquierda y las barras para mujeres hacia la derecha.

- Ordenar de forma ascendente, comenzando desde la base con el grupo más joven (0 - 4 años) y avanzar hacia la cima con los grupos de mayor edad.


4. Agregar detalles

Agregar etiquetas de valores absolutos o porcentajes a las barras, de ser necesario, se pueden usar colores diferentes en las barras para distinguir entre hombres y mujeres; también se pueden incluir títulos y leyendas que expliquen colores o símbolos adicionales.


5. Ajustes y Consideraciones Importantes

- Respecto a la proporcionalidad y a la escala, garantizar que todas las barras sean de la misma amplitud y se encuentren contiguas para reflejar continuidad.

- Respecto a los grupos de 80 años o más, será necesario aplicar ajustes para evitar distorsiones en la representación.

- La base de la pirámide refleja la población joven, mientras que la cima muestra las edades mayores, permitiendo analizar la estructura demográfica.


5/6/21

DIAGRAMA DE DISPERSIÓN

 

 

El gráfico de dispersión, también conocido como diagrama de dispersión, gráfico de correlación, nube de puntos, diagrama XY, scatter plot, scatter chart o scattergram; es una herramienta gráfica estadística que se usa para visualizar la relación que existe entre dos variables cuantitativas, representadas mediante puntos de datos distribuidos en un plano cartesiano; este gráfico es muy útil para detectar patrones, tendencias y correlaciones, ya sean positivas, negativas o inexistentes, que pueden producirse entre dos variables. El gráfico de dispersión en combinación con el coeficiente de correlación de Pearson, aportan información muy útil al análisis de datos, explica cómo afecta una variable a la otra y permite identificar problemas para tomar ciertas acciones y mejorar los procesos.


Elementos del Diagrama de Dispersión:

1. Ejes X y Y. Representan las 2 variables cuantitativas que se comparan; el eje X suele representar la variable independiente; en tanto que el eje Y representa la variable dependiente.
2. Puntos de datos. Cada punto del gráfico representa un par de valores (x, y) de las variables que se están analizando; cada punto es una observación individual del conjunto de datos.
3. Título y etiquetas. Incluyen el título del gráfico y las etiquetas de los ejes para describir las variables representadas.
4. Escala de los ejes. Los ejes X y Y deben incluir rangos de valores que permitan interpretar adecuadamente los puntos de datos.
5. Puntos atípicos (outliers). Son puntos que se alejan o que se desvían significativamente del patrón general que sigue el resto de los datos.
6. Línea o curva de tendencia (opcional). Para mejorar la visualización de la relación entre las variables a veces incluimos una línea o una curva de tendencia que muestre la dirección los datos (p.e. una línea de regresión).



 

Objetivos del diagrama de dispersión:

- Determinar la relación existente entre las dos variables; la relación puede ser positiva (a medida que una variable crece la otra también crece), negativa (a medida que una variable crece la otra disminuye) o inexistente (no se observa una tendencia o patrón claro de relación).
- Detectar patrones y tendencias en los datos, que pueden ser lineales o no lineales, lo que resulta útil para anticipar comportamientos futuros o bien, para modelar relaciones matemáticas.
- Representar visualmente grandes conjuntos de datos de forma sencilla y comprensible, de manera que analistas y científicos puedan comunicar hallazgos complejos de forma clara y efectiva.
- Identificar valores atípicos (outliers), es decir, aquellos valores que se desvían significativamente del patrón general y entonces examinarlos en el conjunto de datos para realizar análisis posteriores
- Evaluar la intensidad y la dirección de una relación entre las dos variables, con la finalidad de validar hipótesis y teorías.


Limitaciones del diagrama de dispersión:

- Los gráficos de dispersión sólo pueden mostrar la relación entre dos variables a la vez, lo que resulta limitante cuando se quiere analizar la interacción entre más de dos variables.
- En conjuntos de datos muy grandes, los gráficos de dispersión pueden quedar desbordados o abarrotados y ser difíciles de leer ya que los puntos pueden superponerse unos a otros, dificultando la identificación de patrones y tendencias claras.
- Es sensible a escalas y rangos de los ejes, si las escalas no son las adecuadas, puede alterar la interpretación visual de los datos, llevando a conclusiones erróneas sobre la relación entre las variables.
- Los gráficos de dispersión muestran correlaciones entre las variables, pero no establecen causalidad; las variables pueden estar correlacionadas sin que una cause a la otra.
- Influencia de valores atípicos u outliers, unos cuantos puntos de datos extremos podrían influir significativamente en la percepción de la tendencia general.


Pasos para la creación de un Diagrama de Dispersión:

1. Definir la situación y determinar las variables a estudiar (de las cuales queremos saber la relación).
2. Recolectar los datos de las variables, entonces, las dos variables deben estar dados en el mismo periodo de tiempo y deben tener la misma cantidad de datos muestrales.
3. Preparar los datos en un formato adecuado generalmente en una hoja de cálculo con una columna para cada variable, limpiar los datos eliminando valores faltantes o incorrectos
4. Seleccionar un software o herramienta que se utilizará para la creación del gráfico, podría ser Excel, R, Python, SPPS, etc.
5. Crear el diagrama de dispersión en el software elegido (en R usar la función plot() y en Python plt.scatter() con mathplotlib).
6. Personalizar el diagrama etiquetando ejes, agregando títulos, ajustando escalas, añadiendo línea de tendencia, o cualquier ajuste según la necesidad.
7. Analizar los puntos de datos para identificar patrones, tendencias o correlaciones, además de los valores atípicos.
8. Determinar el coeficiente de correlación, puede existir una correlación positiva, negativa o ninguna relación entre las variables.
9. Y finalmente documentar los hallazgos y tomar las decisiones pertinentes.


15/6/19

BOXPLOT – DIAGRAMA DE CAJAS


Concepto

El diagrama de cajas y bigotes (boxplots o box and whiskers), es un gráfico utilizado para representar de manera simplificada y visual la distribución de puntuaciones dentro de una variable cuantitativa. Permite visualizar los datos a través de cuartiles, distribución, grado de asimetría, valores extremos, posición de la mediana, etc., para evaluar y comparar la forma, la tendencia central y la variabilidad de las distribuciones de la muestra así como para buscar valores atípicos o casos extremos de la variable. Además es útil para comparar distribuciones entre diferentes grupos o categorías.


Historia

El diagrama de Caja y bigotes, fue publicado en el libro “Exploratory Data Analysis” de John Tuckey (1977), basado en las primeras formulaciones del estudio de las barras de rango de Kenneth W. Haemer (1948) y Mary Eleanor Spear (1952). Actualmente, el diagrama de caja es uno de los gráficos estadísticos más utilizados gracias a su practicidad y fácil entendimiento.


Partes del Boxplot



1. Rango Intercuartil (IQR) – Box. Es la diferencia o la distancia que hay entre los valores del Cuartil 1 (Q1) y del Cuartil 3 (Q3).

2. Bigotes – whisker. Líneas verticales que se extienden desde la caja hasta los valores máximo y mínimo de la serie o hasta 1,5 veces el IQR.

3. Mediana (Me). Coincide con el segundo cuartil, divide a la distribución en dos partes iguales. De este modo, el 50% de las observaciones están por debajo de la mediana y 50% está por encima. 

4. Primer cuartil. (Q1). Por debajo de este valor se encuentra como máximo el 25%

5. Tercer cuartil (Q3). Por debajo de este valor se encentran como máximo el 75%

6. Límite inferior. Es el extremo inferior del bigote

7. Límite superior. Es el extremo superior del bigote

8. Valores atípicos - Outliers. Son valores que se encuentran por debajo del límite inferior y por encima de límite superior, son los valores distintos que no cumplen ciertos requisitos de heterogeneidad de los datos. Están apartadas del cuerpo principal de datos, representan efectos de causas extrañas, opiniones extremas o en el caso de la tabulación manual, errores de medición o registro. Los valores atípicos pueden ser leves (°) o extremos (*).

9. Media. Es el promedio, aunque no forma parte del boxplot, es considerada para dar una idea del puntaje general.


Pasos para la construcción del diagrama de caja

1. Ordenar los datos.

2. Calcular los tres cuartiles (Q1, Q2 y Q3), dibujar la caja entre el primer y tercer cuartil. 
- Cuartil 1 (Q1): valor X a partir del que se tiene 25% de los datos por debajo y el 75% por arriba. 
- Cuartil 2 (Q2) o Mediana (Me): valor X a partir del que se tiene 50% de los datos están por debajo y por arriba. 
- Cuartil 3 (Q3): valor X a partir del que se tiene 75% de los datos por debajo y el 25% por arriba. 
3. Dibujar una línea representando a la mediana o segundo cuartil Q2

4. Calcular el rango intercuartil. 

5. Calcular los límites admisibles inferior y superior (LI y LS). Dibujar los bigotes que es la extensión entre los límites Superior e Inferior y el Cuartil 1 y Cuartil 2, respectivamente.

6. Identificar los valores atípicos leves y calcular los valores atípicos extremos
- Los valores atípicos leves menores (x < LI) están entre el límite inferior y límite atípico inferior extremo y los valores atípicos leves mayores están entre el límite superior (x > LS) y límite atípico superior extremo. Son representados por puntos o círculos (°)
- Los valores atípicos extremos menores son inferiores al límite atípico inferior extremo (x < LIx) y los valores atípicos extremos mayores son superiores al límite atípico superior extremo (x > LIx). Son representados por asteriscos (*)


Correspondencia entre el gráfico de caja y la curva normal



Distribución simétrica

En el siguiente gráfico se observa la correspondencia entre la simetría de la distribución de los datos y el gráfico de cajas. Si los bigotes son cortos y simétricos, diremos que la distribución es simétrica.



Comparación entre categorías

El diagrama de caja permite realizar la comparación entre categorías de una variable, por ejemplo se tienen a continuación dos ejemplos, la primera se refiere a la distribución de la tasa de poblaciones encarceladas por continente (1), y la segunda a la distribución del contenido de azúcar por marca (2).

 
Fuente (1) (2)


Variaciones:

Los diagramas de caja de anchura variable (variable width), utilizan el ancho de la caja para representar el tamaño de los datos dentro de cada grupo, entonces, un grupo con un total mayor en los datos tendrá un ancho mayor. Los diagramas de caja con muescas (notched), tienen un estrechamiento de la caja alrededor de la mediana, esta es una forma útil de comparar las diferencias entre los valores medios, ya que las "muescas" actúan como una guía visual. Los gráficos de violín (violin plot), son un par de gráficos de densidad de Kernel unidos y los gráficos de florero (vase plot) y frijol (beans plot) son otras variaciones de un diagrama de caja. (3) 

Ejemplos:

Calculadoras:


Referencias: (1), (2), (3), (4), (5), (6), (7), (8), (9), (10), (11), (12), (13), (14), (15).

4/6/17

DIAGRAMA DE SECTORES



El diagrama de sectores también denominado diagrama circular (circle chart), gráfico del pastel, gráfico de torta (pie chart), gráfico de 360°, etc., es un gráfico que se divide en sectores de amplitud proporcional a la frecuencia de las categorías tanto para datos cualitativos y cuantitativos discretos, se utiliza para representar la comparación de proporciones o porcentajes entre diferentes categorías. 


Historia 

El diagrama de sectores circulares fue usado y publicado por primera vez en el libro Statistical Breviary (brevario estadístico) en el año 1801 por el escocés William Playfair. En el prefacio de la obra, el autor explica que los gráficos son herramientas de comunicación efectivas para los datos estadísticos porque “atraen la vista cuando se trata de proporción y magnitud, es el mejor y más fácil método de transmitir una idea distinta ". Incluía algunos gráficos circulares como se muestra la división de la superficie terrestre del Imperio turco. 



Consideraciones para el diseño de un diagrama de sectores: 

- Los datos deben representar partes de un todo y sumar el 100% 
- En gran medida, pero no exclusivamente, los gráficos circulares son útiles para mostrar datos clasificados en categorías nominales u ordinales. Se clasifican en orden de tamaño (ya sea de menor a mayor, de muy insatisfecho a satisfecho, etc.); en el sentido de las agujas del reloj a partir de las 12 en punto. 
- Es una buena práctica no tener más de 5 o 6 categorías, ya que puede comenzar a ser más difícil para el ojo distinguir el tamaño entre algunas de las secciones. 
- No puede usar valores negativos o cero, ya que no se pueden representar. 
- Es recomendable usar un gráfico circular, cuando una de las categorías es mucho más grande que las otras 
- Si las categorías son bastante similares, es mejor usar un gráfico de barras para facilitar la comparación de los valores. 
- Tratar de etiquetar directamente los segmentos, de no ser posible (debido a restricciones de espacio), etiquetar fuera del gráfico y use líneas para señalar segmentos estrechos si es necesario. 
- El color juega un papel importante en la identificación de diferentes segmentos, por lo que si un gráfico circular usa colores similares, posiblemente porque hay demasiados segmentos, se vuelve muy difícil para los usuarios identificar correctamente los diferentes segmentos del gráfico circular.




Cálculo de los sectores y los porcentajes 

Fórmula para calcular la amplitud de cada sector
Un círculo completo son 360º (o 2π radianes). El ángulo de cada porción debe ser proporcional a la frecuencia de cada valor. Sea (X1,X2,…,XN) un conjunto de elementos. La fórmula para calcular el ángulo de cada sector es la siguiente: 


Donde:
α: ángulo del sector i 
N: número total de datos 
ni: frecuencia absoluta 
fi: frecuencia relativa 
La suma de los ángulos de todos los sectores es igual a 360º. 


Fórmula para calcular el porcentaje de cada sector 


Donde:
%: porcentaje en el sector i 
N: número total de datos 
ni: frecuencia absoluta 
fi: frecuencia relativa 
La suma de todos los porcentajes es igual a 100% 






Algunas estadísticas usuales…







Referencias: 1, 2, 3, 4, 5, 6, 7.


6/6/15

DIAGRAMA DE PARETO

El diagrama de pareto consiste en una representación particular del gráfico de barras, dichas barras representan los datos que están ordenados en forma descendente, enlazado a una curva de tipo creciente. Este gráfico resulta útil para identificar los aspectos prioritarios que se deben enfrentar respecto a los problemas, causas, servicios, etc.

Por lo tanto, el diagrama de Pareto es una herramienta de análisis que ayuda a tomar decisiones dentro de una organización en función de prioridades para evaluar todas las fallas y si se pueden resolver o mejor evitarlas. Su base se debe al principio de Pareto, también conocido como la ley de los muchos triviales y pocos vitales, la regla del 80-20, distribución ABC o principio de escasez del factor.

Principio de Pareto

Fue enunciado por primera vez por Wilfried Pareto (Paris 1848 – Turín 1923), basándose en el conocimiento empírico, indica que aproximadamente el 80% de los problemas se explica por aproximadamente el 20% de las causas. En otras palabras: un 20% de los errores vitales, causan el 80% de los problemas, o lo que es lo mismo; en el origen de un problema, siempre se encuentran un 20% de causas vitales y un 80% de triviales.


Procedimiento para diseñar un diagrama de Pareto



Propósitos del diagrama de Pareto

- Conocer cuál es el factor o factores más importantes en un problema.
- Determinar las causas raíz del problema.
- Decidir el objetivo de mejora y los elementos que se deben mejorar.
- Conocer se ha conseguido el efecto deseado (por comparación con los Paretos iniciales).

Generación del diagrama de Pareto

El diagrama contiene un eje horizontal de categorías y dos ejes verticales, el de la izquierda con una escala proporcional a la magnitud medida (valor total de los datos) y el de la derecha con una escala porcentual del mismo tamaño (porcentaje acumulado).
Se colocan las barras de mayor a menor y de izquierda a derecha, pero poniendo en último lugar la barra correspondiente a otros (aunque no sea la menor).
Se marcan en el gráfico con un punto cada uno de los porcentajes acumulados (los puntos se pueden situar en el centro de cada una de las categorías o en la zona dónde se juntan una con otra) y se unen los puntos mediante líneas rectas.
Se separan (por medio de una línea recta discontinua, por ejemplo) las pocas categorías que contribuyen a la mayor parte del problema. Esto se hará en el punto en el que el porcentaje acumulado sume entre el 70% y el 90% del total (generalmente en este punto la recta sufre un cambio importante de inclinación).

Partes del diagrama de Pareto:


Interpretación

La interpretación de un Diagrama de Pareto se puede definir completando, por ejemplo, las siguientes oraciones: “Existen (número de categorías) contribuyentes relacionados con (efecto). Pero estos (número de pocos vitales) corresponden al (número) % del total (efecto). Debemos procurar estas (número) categorías pocos vitales, ya que representan la mayor ganancia potencial para nuestros esfuerzos.”

Usos del diagrama

- Al identificar un producto o servicio para el análisis para mejorar la calidad.
- Cuando existe la necesidad de llamar la atención a los problema o causas de una forma sistemática.
- Al identificar oportunidades para mejorar
- Al analizar las diferentes agrupaciones de datos (ej: por producto, por segmento, del mercado, área geográfica, etc.)
- Al buscar las causas principales de los problemas y establecer la prioridad de las soluciones
- Al evaluar los resultados de los cambios efectuados a un proceso (antes y después)
- Cuando los datos puedan clasificarse en categorías
- Cuando el rango de cada categoría es importante
- En casos típicos, los pocos vitales (pasos, servicios, ítems, problemas, causas) son responsables por la mayor parte en el impacto negativo sobre la calidad

Ejemplos: 1, 2, 3, 4, 5.



Fuentes: 1, 2, 3, 4, 5, 6, 7.

20/4/14

GRÁFICO DE BARRAS



Un gráfico de barras es aquella representación gráfica bidimensional en que los objetos gráficos elementales son un conjunto de rectángulos dispuestos paralelamente de manera que la extensión de los mismos es proporcional a la magnitud que se quiere representar.

Los gráficos de barras son utilizados para variables de tipo discreto y permiten representar la frecuencia en cada uno de los niveles de las variables de interés. Particularmente, la altura de cada barra es proporcional a la frecuencia o cantidad de elementos que pertenecen a la categoría en particular. Se recomienda utilizar este tipo de gráfico, cuando la información corresponda a una serie de eventos (escala nominal) y cuando se quiera comparar dos o más grupos entre sí.

Tipos y variantes:

- Sencillo. Contiene solamente una serie de datos (por ejemplo, las ventas en distintos meses en un mismo país)

- Agrupados. Contiene varias series de datos, por ejemplo las ventas mensuales en varios países. En este caso el eje secuencial contendría los meses y el cuantitativo la cifra de ventas. Cada serie de datos se representa mediante un conjunto de rectángulos que comparten color o textura. En cada categoría o secuencia los rectángulos suelen estar juntos, formando un grupo, mientras que entre grupos se deja un espacio. Así en el ejemplo de las ventas, los resultados obtenidos por Francia, Inglaterra e Italia en el mes de noviembre se representarían como tres rectángulos de alturas proporcionales a su valor colocados lado a lado en el espacio dejado en el eje secuencial para el mes de noviembre.

- Solapado. Es un gráfico de barras agrupado en el que los elementos de un grupo en vez de yacer adosados se solapan parcialmente. Si el solapamiento es del 100% pueden fácilmente confundirse con los gráficos de barras apilados.

- Apilados. También llamado segmentado o extendido, es similar al agrupado pero cada uno de los segmentos en que está dividida la barra pertenece a una serie de datos diferente. Muestra de qué forma una entidad total está subdividida en partes. Si el eje no cuantitativo es temporal permite mostrar cómo cambian estas proporciones con el tiempo. Por ejemplo se puede hacer un gráfico apilado con las ventas mensuales de cada país, una encima de otra, de forma que la altura de la barra representa las ventas totales y las proporciones de los segmentos dan idea de su participación en el todo. Este tipo de gráfico puede ser también, apilado enlazado (Si se añaden líneas que enlazan los lugares donde se cambia de segmento se llama apilado enlazado o conectado) y cien por cien (gráfico apilado en el que la altura del total cubre todo el eje cuantitativo de forma que lo que muestran los segmentos es el porcentaje con que contribuyen al total, que representa el 100%).

- Flotantes, bi-direccionales o aparejados. En este caso la línea de valor cero actúa como separador de dos gráficos de barra que comparten el 0 como línea de base pero en el que cada uno muestra su barra en dirección contraria. Un caso típico son los gráficos de la pirámide demográfica, en el que hacia la derecha del 0 se representa la cantidad de personas de un sexo supervivientes a una edad determinada y hacia la izquierda el equivalente del sexo opuesto.

- Pictóricos. Se denomina así cuando las barras están constituidas por la repetición de una serie de símbolos que típicamente representa la naturaleza de los datos. Por ejemplo una serie de motocicletas o coches uno detrás de otro para representar las ventas comparativas de motos y coches. Los símbolos pueden ser todos del mismo tamaño o estar distorsionados para ajustarse a la longitud requerida de la barra.

- De rangos. En este tipo de gráficos la extensión máxima y mínima de las barras indicada los rangos superior e inferior de validez de los datos considerados. En ocasiones se designan valores internos al rango, aparte del máximo y el mínimo, con una línea que cruza la barra, que puede corresponder a conceptos estadísticos como la media, la mediana o la moda.

Componentes:

- Eje cuantitativo, con una escala lineal que sirve de referencia a la magnitud de la variable en cuestión (en un gráfico de columnas éste es el eje de ordenadas [Y] y en uno de barras es el eje de abscisas [X]). Este eje puede contener valores negativos.

- Eje categórico u ordinal, en el que se disponen las categorías o los elementos de la secuencia (el eje de abscisas [X] en un gráfico de columnas o el de ordenadas [Y] en un gráfico de barras). Este eje es perpendicular al cuantitativo.

- Conjunto de rectángulos, cuya extensión paralela al eje cuantitativo es proporcional a la magnitud de la categoría o secuencia representada en el eje

Elaboración:

1. Dibujar los ejes vertical (y) y horizontal (x).
2. En el eje vertical crear una escala que mida las frecuencias de la variable, (por ejemplo número de medicamentos, número de usuarios, etc.)
3. En el eje horizontal, poner la escala nominal, que se refiere a las diferentes características o cualidades de la variable (por ejemplo, sexo femenino, sexo masculino, tipos de medicamentos, etc.)
4. Dibujar un rectángulo para cada característica o cualidad de la variable. La altura de la barra representará la frecuencia en la que la característica fue observada.




Fuentes: (1, 2, 3)