Dato
Un dato se puede definir como una representación simbólica de una característica o atributo de una entidad; es la unidad más elemental de la información y puede ser cualquier observación, medida, descripción o resumen de algo, que se registra y se almacena para su posterior análisis o tratamiento. Los datos pueden ser cualitativos (descripciones) o cuantitativos (números), y pueden tener diversas formas de presentación (textos, números, imágenes, sonido, video, etc.). Los datos son la materia prima para la generación de información y para la toma de decisiones.
Tipos de datos:
- Datos numéricos (cuantitativos). Representan cantidades que se miden o se cuentan, pueden ser discretos o continuos: por ejemplo: la edad de una persona, el peso de un objeto, la temperatura del aire, etc.
- Datos categóricos (cualitativos). Representan categorías o grupos y no se pueden medir numéricamente, pueden ser nominales u ordinales; por ejemplo: el color de un automóvil (rojo, azul, verde,...), el nivel de educación (primaria, secundaria, universitaria), etc.
- Datos binarios. Solo pueden tener dos valores posibles (verdadero o falso, 1 o 0); por ejemplo: el estado civil de una persona (soltero o casado), el lanzamiento de como de moneda (cara o cruz), etc.
- Datos temporales. Representan fechas, horas o intervalos de tiempo; por ejemplo: la fecha de nacimiento de una persona, la hora de salida de un vuelo, la duración de un evento, etc.
- Datos ordinales. Representan valores que poseen un orden inherente, aunque la diferencia entre sus valores es irrelevante; por ejemplo: la clasificación de productos en una escala de satisfacción (bueno, regular, malo), la clasificación de películas por su popularidad (alta, media, baja), etc.
- Datos de frecuencia. Representan la frecuencia con la que ocurre un evento; por ejemplo: número de veces que una persona visita una web en un mes, número de videos subidos a Tiktok en una región, etc.
- Datos textuales. Representan información en forma de texto o palabras, por ejemplo: el nombre de una persona, el título de un libro, el contenido de un correo electrónico, etc.
- Datos financieros. Representan valores monetarios o datos financieros; por ejemplo, los ingresos mensuales de una empresa, el precio de las acciones de una empresa en la bolsa de valores, el saldo de una cuenta bancaria, etc.
- Datos multimedia. Representan contenidos de multimedia; por ejemplo: los pixeles de una imagen digital, la frecuencia de audio de un archivo de música, los fotogramas por segundo en un video determinado, etc.
Referencias: (1), (2), (3), (4), (5).
Sesgo
El sesgo estadístico es una desviación o tendencia sistemática que ocurre cuando los resultados de un estudio o de un análisis de datos se desvían hacia una determinada dirección, ya sea por errores o por ciertas influencias, haciendo que los datos no sean totalmente imparciales o representativos de la realidad. Entonces el sesgo podría mostrar una visión distorsionada de la realidad; en términos estadísticos, el sesgo implica una sobreestimación o subestimación sistemática de un parámetro o medida de interés; por otro lado, el sesgo también puede plantearse como una "preferencia" hacia determinadas ideas o grupos, afectando la objetividad a la hora de tomar decisiones o de presentar la información.
El sesgo puede surgir por diversos motivos como por errores de muestreo, por defectos en el diseño de la investigación, por sesgos de selección, por disponer de información incompleta, etc., por lo general, implica una falta de neutralidad o imparcialidad. Identificar y controlar el sesgo es muy importante para garantizar la validez y la fiabilidad de los resultados.
Tipos de Sesgos
- Sesgo de selección: Se presenta cuando la muestra no es aleatoria o cuando ciertos grupos están menos o más representados en comparación con toda la población.
- Sesgo de información: Se observa cuando hay inconsistencias o contradicciones entre los datos o cuando la información parece a favor de ciertas respuestas o resultados.
- Sesgo de confusión: Se manifiesta cuando hay una tercera variable que influye tanto en la variable independiente como en la dependiente, alternado la relación entre ambas.
- Sesgo de supervivencia: Se presenta en estudios donde la atención se centra sólo en los casos o elementos que superaron alguna prueba, más no en aquellos que no la superaron.
- Sesgo de recuerdo: Se produce cuando los participantes en un estudio informan o recuerdan sucesos pasados de forma inexacta.
- Sesgo de no respuesta. Cuando los participantes en un estudio, no informan sus respuestas a una o más preguntas.
- Sesgo de respuesta socialmente deseable: Se observan cuando los participantes reportan información falsa debido a la presión social (para que sean socialmente aceptados). .
Causas del sesgo
- Errores en la fase de diseño del estudio, cuando la muestra no es representativa de la población o surgen dificultades en la recolección de la información
- Errores de selección, cuando ciertos grupos tienen más probabilidad de ser incluidos en la muestra y otros tienen menos.
- Sesgos de respuesta, cuando los participantes responden de maneras diferentes según sus propias creencias, experiencias o deseos.
- Sesgos de información, cuando la información recopilada en el estudio resulta estar incorrecta, incompleta o sesgada.
Consecuencias:
- Resultados incorrectos
- Pérdida de credibilidad
- Políticas y prácticas ineficaces o perjudiciales
- Desigualdad y discriminación
Es importante identificar y mitigar los sesgos siempre que se pueda, para así poder garantizar la veracidad y la representatividad de los resultados obtenidos.
Referencias: (1), (2), (3), (4).
Variable
Una variable es la característica de un elemento que puede variar, cambiar o tomar diferentes valores, puede ser observado, medido o controlado en un estudio y/o experimento. Las variables son muy importantes en la investigación científica para entender cómo influyen en los resultados del estudio; pueden ser cualitativas, como el color de pelo o el estado civil; o cuantitativas como la edad, el peso o la temperatura.
En un experimento, las variables pueden ser independientes (manipuladas) o dependientes (observadas en respuesta a las independientes) y dentro del análisis de datos permiten comprender fenómenos y relaciones en diversos contextos; por ejemplo, la cantidad de lluvia que cae en cierta región puede ser diferente de un mes a otro, puede llover más en febrero que en marzo; entonces la cantidad de lluvia seria la variable porque varía según el tiempo.
Tipos de variables
- Variables independientes. Son aquellas que el investigador manipula o controla en un experimento para observar su efecto sobre otras variables; también se les conoce como variables predictoras o explicativas.
- Variables dependientes. Son aquellas cuyos valores son observados o medidos como respuesta a la manipulación de las variables independientes (representan los resultados o los efectos que se están estudiando).
- Variables intervinientes. Son aquellas que intervienen en la relación entre una variable independiente y otra dependiente, ya sea para explicar cómo se produce esa relación (variables mediadoras) o para modificar la fuerza o dirección de dicha relación (variables moderadoras).
- Variables categóricas. Son aquellas que representan categorías o grupos y no pueden ser medidas en una escala continua; pueden ser nominales (cuando no hay un orden particular entre las categorías) u ordinales (cuando existe un orden entre ellas).
- Variables continuas. Son aquellas que pueden tomar cualquier valor dentro de un rango determinado y se pueden medir en una escala numérica; por ejemplo, la altura, el peso, la temperatura, etc.
- Variables dicotómicas. Son variables que tienen sólo dos categorías mutuamente excluyentes; por ejemplo, sí/no, verdadero/falso, presente/ausente, etc.
- Variables cualitativas. Son aquellas que representan cualidades o características que no pueden ser medidas numéricamente, pueden ser nominales u ordinales.
- Variables cuantitativas. Son aquellas que representan cantidades o magnitudes y pueden ser medidas numéricamente; son discretas, cuando solo toman valores enteros; o continuas, cuando toman cualquier valor dentro de un rango.
- Variables de interés. Son aquellas que el investigador está estudiando para comprender su efecto o relación con otras variables.
- Variables de control. Son aquellas que se mantienen constantes o se controlan para evitar que afecten los resultados.
- Entre otros tipos.
Indicador
Los indicadores son características o señales que nos muestran cómo va algo, si mejora, empeora o se mantiene igual; son herramientas que nos permiten comparar datos y ayudan a entender el progreso o desempeño de un fenómeno o proceso, en otros términos, los indicadores son como una medida que nos ayudan a entender qué tan bien o mal está funcionando algo, o qué tan bien estamos progresando hacia un objetivo; un ejemplo sería la temperatura, pues es un indicador del clima que nos indica frío o calor.
Los indicadores pueden ser simples, como una tasa de crecimiento, o más complejos, como un índice que combina múltiples variables para evaluar una situación o fenómeno. Estas herramientas se utilizan en diversos contextos, como economía, medio ambiente, salud, educación, entre otros; ayudándonos a tomar decisiones y formular políticas o evaluar programas.
Algunos ejemplos de indicadores son:
- Indicadores económicos: Tasa de desempleo, Producto Interno Bruto (PIB), Índice de Precios al Consumidor (IPC), Ingreso per cápita, entre otros.
- Indicadores de salud: Esperanza de vida, tasa de mortalidad infantil, Índice de Masa Corporal (IMC), número de casos de alguna enfermedad, etc.
- Indicadores educativos: Tasa de alfabetización, resultados de exámenes estandarizados, gasto per cápita en educación, etc.
- Indicadores ambientales: Índice de calidad del aire, cantidad de residuos sólidos generados por persona, extensión de áreas protegidas, entre otros.
- Indicadores sociales: Índice de desarrollo humano (IDH), tasa de criminalidad, porcentaje de población viviendo en pobreza, etc.
No hay comentarios:
Publicar un comentario