BIOESTADISTICA.pptx

LMartinMoreno 66 views 43 slides Jun 27, 2023
Slide 1
Slide 1 of 121
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15
Slide 16
16
Slide 17
17
Slide 18
18
Slide 19
19
Slide 20
20
Slide 21
21
Slide 22
22
Slide 23
23
Slide 24
24
Slide 25
25
Slide 26
26
Slide 27
27
Slide 28
28
Slide 29
29
Slide 30
30
Slide 31
31
Slide 32
32
Slide 33
33
Slide 34
34
Slide 35
35
Slide 36
36
Slide 37
37
Slide 38
38
Slide 39
39
Slide 40
40
Slide 41
41
Slide 42
42
Slide 43
43
Slide 44
44
Slide 45
45
Slide 46
46
Slide 47
47
Slide 48
48
Slide 49
49
Slide 50
50
Slide 51
51
Slide 52
52
Slide 53
53
Slide 54
54
Slide 55
55
Slide 56
56
Slide 57
57
Slide 58
58
Slide 59
59
Slide 60
60
Slide 61
61
Slide 62
62
Slide 63
63
Slide 64
64
Slide 65
65
Slide 66
66
Slide 67
67
Slide 68
68
Slide 69
69
Slide 70
70
Slide 71
71
Slide 72
72
Slide 73
73
Slide 74
74
Slide 75
75
Slide 76
76
Slide 77
77
Slide 78
78
Slide 79
79
Slide 80
80
Slide 81
81
Slide 82
82
Slide 83
83
Slide 84
84
Slide 85
85
Slide 86
86
Slide 87
87
Slide 88
88
Slide 89
89
Slide 90
90
Slide 91
91
Slide 92
92
Slide 93
93
Slide 94
94
Slide 95
95
Slide 96
96
Slide 97
97
Slide 98
98
Slide 99
99
Slide 100
100
Slide 101
101
Slide 102
102
Slide 103
103
Slide 104
104
Slide 105
105
Slide 106
106
Slide 107
107
Slide 108
108
Slide 109
109
Slide 110
110
Slide 111
111
Slide 112
112
Slide 113
113
Slide 114
114
Slide 115
115
Slide 116
116
Slide 117
117
Slide 118
118
Slide 119
119
Slide 120
120
Slide 121
121

About This Presentation

FUNDAMENTOS BÁSICOS DE BIOESTADÍSTICA PARA LA CARRERA DE MEDICINA


Slide Content

BIOESTADÍSTICA I Juan José Villacís Barrazueta

INDICACIONES DE LA CLASE Materia teórico - práctica. Lunes de 7 - 9 am. 4 módulos Todas las clases se realizarán ejercicios. Se usará Excel para resolver los mismos. Materiales sugeridos: Computadora y calculadora.

INDICACIONES DE LA CLASE ACTIVIDADES Cuestionarios: De forma individual, con plazo de UNA semana. Deberán ser entregados hasta el domingo 23:59. Cuestionarios atrasados únicamente con justificación. TODO trabajo atrasado será calificado con una nota menor. Se califica: conocimiento, análisis y tiempo. Por ende, los cuestionarios contienen ejercicios prácticos con límite de tiempo. Las diapositivas de cada clase se subirán a la plataforma cada lunes. Cada semana se subirá a la plataforma la resolución de los cuestionarios.

INDICACIONES DE LA CLASE EXÁMENES Por parcial: DOS evaluaciones y UN examen parcial. Examen final.

SÍLABO Unidad 1: Bases de la Investigación . Introducción a la Investigación . Ciencia, conocimiento e investigación científica . Metodo cientifico . Relación entre ciencia, investigación y método científico - Idea de defender. Hipótesis. y pregunta científica . Planteamiento del problema de investigación Unidad 2: Diseño de estudio . Elementos fundamentales de la investigación . Clasificación de la investigación . Variables de la Investigación - Población y muestra . Tablas de frecuencia estadística Unidad 3: Recoleccion de la información . Generalidades de la recolección . Medidas de tendencia central . Medidas de dispersión . Indicadores básicos para el análisis estadístico del estado de salud Unidad 4: Estructura del proyecto de Investigación

SÍLABO Fecha Actividades Mayo 15, 2023 UNIDAD 1: Introducción a la Bioestadística descriptiva. Tipos de variables. Frecuencias absolutas, relativas y acumuladas. Tipos y usos de gráficos. Mayo 22, 2023 UNIDAD 1: Medidas de tendencia central. Medidas de dispersión. Medidas de posición y forma. Mayo 29, 2023 Refuerzo Unidad 1 Junio 5, 2023 Evaluación Unidad 1 Junio 12, 2023 UNIDAD 2: Distribución normal. Muestreo y Probabilidades. Teorema de Bayes Junio 19, 2023 UNIDAD 2: Regresión lineal Junio 26, 2023 Refuerzo Unidad 2 Julio 3, 2023 Evaluación Unidad 2 Julio 10, 2023 Examen 1° Parcial Julio 17, 2023 UNIDAD 3 : Introducción a la Bioestadística inferencial. Hipótesis y valores p. Julio 24, 2023 UNIDAD 3: Pruebas - KS. Distribución binomial. Julio 31, 2023 Evaluación Unidad 3 Agosto 7, 2023 UNIDAD 4: Pruebas paramétricas. Distribución t Agosto 14, 2023 UNIDAD 4: Distribución F. Correlación de Pearson. Agosto 21, 2023 Evaluación Unidad 4 Agosto 28, 2023 Examen 2° Parcial Septiembre 4, 2023 Tutorías académicas Septiembre 11, 2023 Examen Final Septiembre 18, 2023 Examen de Recuperación

ETIMOLOGÍA DE LA ESTADÍSTICA Latín: statisticum collegium (“consejo de Estado”) Italiano: statista (“hombre de Estado” o “político”) Alemán: statistik (“hombre de Estado” o “político”)

¿POR QUÉ LA CIENCIA DEL ESTADO? Por razones de organización: C R R P Conocer las características de su población para gestionar el pago de impuestos. Reclutamiento de soldados Reparto de tierras o bienes Prestación de servicios públicos

VARIOS AUTORES LA DEFINEN: Croxton y Cowen: “La estadística es el método científico que e utiliza para recolectar, elaborar, analizar e interpretar datos sobre características susceptibles de ser expresadas numéricamente de un conjunto de hechos, personas o cosas”. Clifford y Taylor: “La estadística es la disciplina interesada en la organización y resumen de datos, para obtención de conclusiones acerca de características de un conjunto de personas u objetos cuando solo una porción está disponible para su estudio”

BIOESTADÍSTICA Castro (2019): “Es la rama de la estadística que se ocupa de los problemas planteados dentro de las ciencias de la vida, como la biología o la medicina. Médicos, enfermeras, especialistas en salud pública, epidemiólogos necesitan conocer los principios que guían la aplicación de los métodos estadísticos a so temas propios de sus respectivas áreas de conocimiento (…). Permitirá elaborar modelos, predicciones, estrategias y priorización de presupuesto.”

PARÉNTESIS

JUEGO: Actividad fuera de la realidad Reglas distintas de la vida real Improductivo SISTEMA DE ENSEÑANZA Reglas de la vida real Productivo Sin motivación inmediata Motivación inmediata Información compleja Todo igual Utilidad antropométrica Momentos significativos Narrativa organiza la información

FIN DEL PARÉNTESIS

COMPONENTES DE LA BIOESTADÍSTICA DATOS Son la materia prima, nacen de las mediciones o también llamadas observaciones ANÁLISIS Permite que los datos se conviertan en información útil La estadística en salud depende de los datos y de su análisis, por tanto, es esencial conocer la metodología para la correcta recolección de los datos y comprender la estadística para un correcto análisis de éstos.

CONCEPTOS BÁSICOS P M V MUESTRA Subconjunto sobre el cual se realizarán mediciones y obtención de conclusiones. POBLACIÓN Todos los individuos sobre los cuáles se realizará el análisis. VARIABLE Característica que se desea investigar

MEDIDAS Parámetro Estadístico Estimación numérica en relación a una variable de la POBLACIÓN Media: µ Desviación estándar: σ Estimación numérica en relación a una variable de la MUESTRA Media: X Desviación estándar: S

VARIABLES Característica que deseo investigar. Una variable es un atributo que describe a una persona, lugar, cosa o idea. Existen dos tipos de variables.

¿POR QUÉ IMPORTA EL TIPO DE VARIABLE? Los tipos de variables se relacionan directamente con los métodos estadísticos e inferenciales disponibles.

TIPOS DE VARIABLES 1 2 CUALITATIVAS No numéricas CUANTITATIVAS Numéricas

Variables Cualitativas Categóricas Dicotómicas/Binarias: En estas variables solo existen dos posibilidades de respuesta Politómicas: >2 categorías NIVELES DE MEDICIÓN 1. Nominal (sin orden jerárquico) 2. Escala de razón (tienen un orden)

Variables Cuantitativas Discretas Continuas Surgen de un proceso de conteo y toman solo ciertos valores correspondientes al conjunto de números enteros positivos Días de hospitalización N° de hijos N° de muertes Surgen de un proceso de medición en el que pueden tomar cualquier valor dentro del conjunto de los números racionales (decimales o negativos). Peso Talla Presión NIVELES DE MEDICIÓN 1. Escala de intervalo 2. Escala de razón

DEL TIPO DE VARIABLE DEPENDE Test a usar Hipótesis Gráficos

ESTADÍSTICA DESCRIPTIVA Clasifica, agrupa y ordena los datos de la muestra. Tabula y representa gráficamente los datos de acuerdo a sus frecuencias. Calcula medidas que resumen la información que contiene la muestra. No tiene poder inferencial. No deben sacarse conclusiones sobre la población.

DISTRIBUCIÓN DE FRECUENCIAS Clasifica: SIN AGRUPAR: Ordena todos los valores obtenidos en la muestra de menor a mayos AGRUPADOS : Ordena los valores en clases (intervalos) y de menor a mayor

FRECUENCIAS ABSOLUTA RELATIVA Es el número de veces que se observa cada categoría en un conjunto de observaciones fi Es el cociente entre la frecuencia absoluta de una determinada categoría y el número total de observaciones. La sumatoria de frecuencias: Razón=1 o %=100 ni

FRECUENCIAS ACUMULADAS ABSOLUTA RELATIVA Sumatoria de las fi. Es el resultado de sumar el Fi correspondiente y el siguiente fi. Fi Se obtiene de ir sumando las frecuencias relativas de una clase o grupo de la muestra con la anterior. Ni

REGLA DE STURGES Es un criterio utilizado para determinar el número de clases o intervalos que son necesarios para agrupar los datos. Rango: Max - Xmin K = intervalos (número de casillas que generó la tabla) 1 + 3,322 log(n) Amplitud = tamaño del intervalo. R/K

REGLA DE STURGES Es un criterio utilizado para determinar el número de clases o intervalos que son necesarios para agrupar los datos. Rango: Max - Xmin K = intervalos (número de casillas que generó la tabla) 1 + 3,322 log(n) Amplitud = tamaño del intervalo. R/K

ESTADÍSTICA DESCRIPTIVA Permiten presentarlos de forma significativa y comprensible, lo que a su vez da pie a una interpretación simplificada del conjunto de datos en cuestión. Los datos brutos serían difíciles de analizar, y la determinación de tendencias y patrones pueden ser un reto. Además, los datos en bruto dificultan la visualización de lo que realmente muestran El uso de la estadística descriptiva permite resumir y presentar un conjunto de datos mediante combinación de descripciones tabuladas y gráficas. La estadística descriptiva se utiliza para resumir datos cuantitativos complejos.

VARIABLES CUANTITATIVAS DATOS AGRUPADOS

Medidas de posición Percentiles, cuártales, quintiles, deciles Medidas de posición NO central Percentiles son las medidas más utilizadas para propósitos de ubicación o clasificación de las personas en características tales como peso, estatura, etc.

A TENER EN CUENTA La preferencia para elegir cuartiles, deciles o percentiles está condicionada al grado de detalle con que se contextualiza la posición de una observación en el conjunto de datos referenciados. Pero, también la elección entre las distintas medidas de posición no central está asociada a la heterogeneidad de las distribuciones. Mientras más dispersión presentan los datos de una variable, se aconseja incrementar las unidades divisionales.

La preferencia para elegir cuartiles, deciles o percentiles está condicionada al grado de detalle con que se contextualiza la posición de una observación en el conjunto de datos referenciados. Pero, también la elección entre las distintas medidas de posición no central está asociada a la heterogeneidad de las distribuciones. Mientras más dispersión presentan los datos de una variable, se aconseja incrementar las unidades divisionales.

Recién nacidos - peso demasiado bajo. ¿Qué peso se considera “demasiado bajo”? Consultas de emergencia en hospitales según causa. Fecundidad adolescente según países.

PERCENTILES Cada uno de los 99 valores que dividen a la distribución de datos en 100 partes iguales. P k

L k-1 es el límite inferior del intervalo h (cuya frecuencia acumulada es la primera mayor o igual a nk es la frecuencia absoluta del intervalo h. N k-1 es la frecuencia acumulada hasta L k-1 A es la longitud del intervalo h.

EJEMPLO Calcular el percentil de orden 86 de los ingresos mensuales de algunos médicos en EEUU. INGRESO MENSUAL NÚMERO DE PERSONAS (ni) FRECUENCIA ACUMULADA (Ni) 2400-3000 3 3 3000-4200 20 23 4200-5400 35 58 5400-7250 25 83 7250-9000 15 98 9000-12000 2 100

INGRESO MENSUAL NÚMERO DE PERSONAS (ni) FRECUENCIA ACUMULADA (Ni) 2400-3000 3 3 3000-4200 20 23 4200-5400 35 58 5400-7250 25 83 7250-9000 15 98 9000-12000 2 100 L k-1 es el límite inferior del intervalo h (cuya frecuencia acumulada es la primera mayor o igual a P 86 es (7250, 9000) L k-1 = 7250

INGRESO MENSUAL NÚMERO DE PERSONAS (ni) FRECUENCIA ACUMULADA (Ni) 2400-3000 3 3 3000-4200 20 23 4200-5400 35 58 5400-7250 25 83 7250-9000 15 98 9000-12000 2 100 N k-1 es la frecuencia acumulada hasta L k-1 N k-1 = 83 nk es la frecuencia absoluta del intervalo h. nk= 15 A es la longitud del intervalo h A=9000-7250 = 1750

Con esos datos, reemplazo: P 86 P 86 El 86% de los sueldos mensuales de los médicos están ubicados en $7.600 o menos

CUARTILES Son 3 valores o elementos que dividen a la distribución o conjunto de datos en 4 partes iguale, es decir, cada una engloba el 25% de los mismos Cuartil inferior (Q1) Cuartil medio (Q2) Cuartil superior (Q3) Deja a su izquierda el 25% de los datos (es el menor valor pero, a su vez, el mayor de una cuarta parte de los datos) y se cumple que Q1 = P 25 Deja a su izquierda el 50% de los datos y coincide exactamente con la mediana y se cumple que Q2 = P 50 Deja a su izquierda el 75% de los datos (tres cuartas partes) y se cumple que Q3 = P 75

DATOS AGRUPADOS Q 1 = Q 2 = Q 3 = N de obs de las posiciones de los cuartiles

EJEMPLO La distribución de edades de personas con COVID-19 en un Hospital público de la ciudad de Ambato Edad Frecuencia absoluta Frecuencia absoluta acumulada 30-35 3 3 36-40 3 6 41-45 6 12 46-50 14 26 51-55 9 35 56-60 8 43 61-65 7 50 66-70 6 56 71-75 4 60

Q 1 = Q 2 = Q 3 = Edad Frecuencia absoluta Frecuencia absoluta acumulada 30-35 3 3 36-40 3 6 41-45 6 12 46-50 14 26 51-55 9 35 56-60 8 43 61-65 7 50 66-70 6 56 71-75 4 60 Q 1 =15 Q 2 =30 Q 3 =45

Q 1 = Q 2 = Q 3 =

Q 1 = años Q 2 = años Q 3 = años

75 30 46,86 54,78 62,14 Q3 Q2 Q1

DECILES Son valores que dividen los datos ordenados en diez partes iguales (9 divisiones). Datos clasificados en orden ascendente. Li D1 D2 D3 D4 D5 D6 D7 D8 D9. Ls Los deciles dan los valores correspondientes al 10%, 20%…90% de los datos. El decir 5 es la mediana o Q2

EJEMPLO La distribución de edades de personas con Zika, en un hospital público de Esmeraldas. Calcular el decil 4 Edad Número de personas (ni) Frecuencia acumulada (NI) 10-19 5 5 20-29 11 16 30-39 8 24 40-49 5 29 50-59 8 37 60-69 6 43 70-79 7 50

Medidas de tendencia central Ubicados en el centro de la distribución Media Mediana Moda µ X

DATOS AGRUPADOS POR INTERVALOS LSC LSC Punto medio Frecuencia absoluta l1 s1 x1 n1 l2 s2 x2 n2 . . . . . . . . lk sk xk nk Punto medio xi = x=

EJEMPLO El MSP realizó una tabla de frecuencias del presupuesto destinado a 10 pequeños proyectos de salud. Calcular el promedio Min Max Punto medio Frecuencia absoluta 100 12 100 200 28 200 300 46 300 400 71 400 500 186 500 600 224 600 700 209 700 800 122 800 900 53 900 1000 19

RESULTADO x = El promedio del presupuesto destinado a pequeños proyectos de salud es de $555.15

MEDIANA: Es el valor medio Donde: L i : Límite inferior del intervalo en el cual se encuentra la mediana. n: Número de datos del estudio. F i-1 : Frecuencia absoluta del intervalo anterior al que se encuentra la mediana. A i : Amplitud del intervalo en el que se encuentra la mediana. f i : Frecuencia absoluta del intervalo en el que se encuentra la mediana.

RECORDAR Si los datos están agrupados en una tabla de distribución de frecuencias, se debe establecer el intervalo donde se encuentra la mediana. Para ello se determina el intervalo cuya frecuencia acumulada sea >

EJEMPLO Presupuesto anual Número de programas de salud Frecuencia acumulada 2400 - 3000 3 3 3000 - 4200 20 23 4200 - 5400 35 58 5400 - 7250 25 83 7250 - 9000 15 98 9000 - 12000 2 100

Donde: L i : Límite inferior del intervalo en el cual se encuentra la mediana. n: Número de datos del estudio. F i-1 : Frecuencia absoluta del intervalo anterior al que se encuentra la mediana. A i : Amplitud del intervalo en el que se encuentra la mediana. f i : Frecuencia absoluta del intervalo en el que se encuentra la mediana.

MODA: Es el valor que tiene la mayor frecuencia absoluta Donde: L i : Límite inferior del intervalo en el cual se encuentra la moda. f i-1 : Frecuencia absoluta del intervalo anterior en el que se encuentra la moda. f i : Frecuencia absoluta del intervalo en el que se encuentra la moda. f i+1 : Frecuencia absoluta del intervalo siguiente en el que se encuentra la moda. A i : Amplitud del intervalo en el que se encuentra la moda.

EJEMPLO Edad Punto medio Frecuencia absoluta Frecuencia acumulada 0 - 4 2 3 3 4 - 8 6 5 8 8 - 12 10 6 14 12 - 16 14 4 18 16 - 20 18 3 21

Medidas de tendencia dispersión Mide el grado de dispersión de los datos comparados con el centro Una medida de variabilidad Mientras que una medida de tendencia central describe el valor típico; las medidas de variabilidad definen cuán lejos tienen a caer los datos del centro

DESVIACIÓN ESTÁNDAR Raíz cuadrada de la varianza. Si el valor de la misma es grande, la dispersión de los valores también los será. σ = Desviación estándar de la población s = Desviación estándar de la muestra

VARIANZA Y DESVIACIÓN ESTÁNDAR PARA DATOS AGRUPADOS

EJEMPLO Minutos Número de mujeres (ni) 0 - 10 2 11- 20 3 21 - 30 3 31 - 40 7 41 - 50 5 Minutos de traslado en automóvil, al centro de salud mas cercano, en mujeres dela Joya de los Sachas Punto medio

Minutos Número de mujeres (ni) Punto medio X i x X i - X (X i - X) 2 fi * (X i - X) 2 0 - 10 2 11- 20 3 21 - 30 3 31 - 40 7 41 - 50 5

Minutos Número de mujeres (ni) Punto medio X i x X i - X (X i - X) 2 fi * (X i - X) 2 0 - 10 2 5 10 -25.45 647.7025 1295.405 11- 20 3 15.5 46.5 -14.95 223.5025 670.5075 21 - 30 3 25.5 76.5 -4.95 24.5025 73.5075 31 - 40 7 35.5 248.5 5.05 25.5025 178.5175 41 - 50 5 45.5 227.5 15.05 226.5025 1132.5125

INTERPRETACIÓN EN RELACIÓN A LA MEDIA La desviación estándar toma las unidades de medida del ejercicio: cm, dólares, años, kg, etc. La desviación estándar de los minutos de traslado, con respecto a su promedio es 13.28 minutos

¿QUÉ TAN DISPERSOS ESTÁN LOS DATOS? Coeficiente de variación: = 43.61%

MEDIDAS DE FORMA Y DISTRIBUCIÓN NORMAL

Permiten conocer qué forma tiene la curva que representa la serie de datos de la muestra Se clasifican en: asimetría y curtosis Asimetría: mide si la curva tiene o no, una forma simétrica - dispersión Curtosis: Mide si los valores de la distribución están más o menos concentrados alrededor de los valores medios de la muestra MEDIDAS DE FORMA

Mide el grado de asimetría de la distribución de sus datos en torno a su media ASIMETRÍA Las colas de la variable están constituidas por los valores alejados de la media (valores extremos). Una variable es asimétrica si su cola tiene una lado más largo que otro, y simétrica si ambas colas son iguales

Si As < 0 : izquierda / la cola izquierda es más larga / - Si As = 0 : simétrica / ambas colas son iguales Si As > 0 : derecha / la cola derecha es más larga /+

CURTOSIS O APUNTAMIENTO Mide el grado de concentración de los valores que toma en torno a la media

Leptocúrtica. K > 0: los valores están muy concentrados en torno a la media, hay pocos valores extremos (apuntamiento pronunciado). Mesocúrtica. K = 0: los valores son simétricos - distribución normal. Platicúrtica. K < 0: hay muchos valores extremos (dispersión).

¿Qué sucede si la distribución de datos es perfectamente simétrica?

DISTRIBUCIÓN NORMAL INTRODUCTORY BIOSTATISTICS / CHAP T. LE CAPITULO 3

¿PARA QUÉ NOS SIRVE? Se puede calcular la probabilidad de que ciertos valores ocurran dentro de ciertos rangos o intervalos

La distribución normal o distribución de Gauss representa la forma en la que se distribuyen los diversos valores numéricos de las variables cuantitativas.

PROPIEDADES DE LA CURVA NORMAL Toma en cuenta la media y desviación estándar. El área bajo la curva es igual a 1 Es simétrica respecto al centro, o a la media. El 50% de los valores son mayores que la media, y el 50% de los valores son menores que la media. La media es igual a la mediana y la moda

EXISTEN MILES DE PROBABILIDADES PARA ARMAR UNA DISTRIBUCIÓN NORMAL Se estandariza la distribución de la variable “x” a “z”, la cual tiene una media = “0”; y desviación estándar = “1” Media 7 - Desviación estándar 1,5 Media 3 - Desviación estándar 2,4

Las puntuaciones “z” transformadas se pueden utilizar para determinar áreas bajo la curva para cualquier distribución normal.

PROPIEDADES PARA RESOLVER LA CURVA NORMAL

SIMÉTRICOS RESPECTO A “0”

EJERCICIOS

Supongamos que se sabe el peso que el peso de los sujetos de una determinada población sigue una distribución aproximadamente normal, con una media de 80kg y una desviación estándar de 10kg. ¿Cuál es la probabilidad de que una persona elegida al azar, tengo un peso superior a 100kg? ¿Cuál es la probabilidad de que el peso de un sujeto esté entre 60 y 100kg?

PROBABILIDADES

PROBABILIDADES Es un valor entre 0 y 1 que indica la posibilidad relativa de que ocurra un evento. El valor de la probabilidad es 0 cuando es imposible que ocurra dicho evento. Mientras más cerca al 0, menos posibilidades hay.

FÓRMULA ESTÁNDAR DE PROBABILIDAD

PROBABILIDADES La salud pública está dirigida por probabilidades, y al mismo tiempo manejan incertidumbre.

VALIDEZ La validez parte de una prueba dicotómica, que clasifica a cada persona como sano o enfermo en función de que el resultado de la prueba sea positiva o negativa. Generalmente, un resultado positivo se asocia con presencia de la enfermedad y un resultado negativo con la ausencia. Cuando se estudia una muestra de personas, los datos obtenidos permiten clasificar a los sujetos en cuatro grupos; en una tabla 2x2.

RELACIÓN ENTRE EL RESULTADO DE UNA PRUEBA DIAGNÓSTICA Y LA PRESENCIA/AUSENCIA DE UNA ENFERMEDAD Verdadero diagnóstico ENFERMO SANO Reactivo (Positivo) Verdaderos Positivos (VP)
(a) Falsos Positivos (FP)
(b) No reactivo (Negativo) Falsos Negativos (FN)
(c) Verdaderos Negativos (VN)
(d)

SENSIBILIDAD Probabilidad de clasificar correctamente a un individuo enfermo. Es decir, la probabilidad de que para un sujeto enfermo se obtenga en la prueba de tamizaje un resultado positivo. La sensibilidad es la capacidad del test para detectar la enfermedad.

ESPECIFICIDAD Probabilidad de clasificar correctamente a un individuo sano. Es decir, la probabilidad de que para un sujeto sano se obtenga en la prueba de tamizaje un resultado negativo. La especificidad es la capacidad del test para detectar a los sanos.

SEGURIDAD: VALOR PREDICTIVO La sensibilidad y la especificidad informan acerca de la probabilidad de obtener un resultado correcto (positivo o negativo) en función de la verdadera condición de la persona respecto a la enfermedad.

VALOR PREDICTIVO POSITIVO (VPP) Probabilidad de padecer la enfermedad si se obtiene un restallado positivo en la prueba. El VPP se puede estimar a partir de la proporción de pacientes con un resultado positivo en la prueba que finalmente resultaron estar enfermos

VALOR PREDICTIVO POSITIVO (VPN) Es la probabilidad de que un sujeto con un resultado negativo en la prueba, esté realmente sano. Se estima dividiendo el número de verdaderos negativos entre el total de pacientes con un resultado negativo en la prueba.

La siguiente tabla muestra el número de mujeres que recibieron y no recibieron un diagnóstico de cáncer en el último año, y el resultado de su mamografía. Cáncer No cáncer Total Mamografía + 15 135 150 Mamografía - 45 470 515 Total 60 605 665

PROBABILIDAD CONDICIONAL

PROBABILIDAD CONDICIONAL Es la probabilidad de que ocurra un evento, dado que ha ocurrido otro evento. P (A|B) : se lee “dado que” La probabilidad de que ocurra el evento A, dado que ha ocurrido el evento B.

FÓRMULA PARA LA PROBABILIDAD CONDICIONAL P(A|B) = P(B&A) / P(B) P(A|B) = P(B ∩ A) / P(B) Los eventos son independientes

La siguiente tabla muestra el número de mujeres que recibieron y no recibieron un diagnóstico de cáncer en el último año, y el resultado de su mamografía. Encuentra la probabilidad de que una mujer elegida al azar: Tiene cáncer dado que tiene una mamografía con resultado positivo. Tiene una mamografía con resultado positivo dado que tiene cáncer Cáncer No cáncer Total Mamografía + 15 135 150 Mamografía - 45 470 515 Total 60 605 665

P(A|B) no es igual a P(B|A) Creemos que el orden de los factores no altera el producto. Esta ley sirve para la multiplicación, aquí no. “Dado que” es una condición que no funciona con la propiedad conmutativa

Las probabilidades condicionales son utilizadas por las compañías de seguros privados para determinar sus tarifas. Analizan la probabilidad condicional de que tenga un accidente dada la edad, enfermedades preexistentes, etc. Y fijan el precio de su póliza en función de esa probabilidad.

TEOREMA DE BAYES

TEOREMA DE BAYES Se aplica en bioestadística para calcular probabilidades para detección de enfermedades. No obstante, no se evalúa el test diagnóstico; solo un evento con otro.

PRIMER PASO Colocar el esqueleto del teorema P(A|B) = P(A) x P(B|A) P(B) NOTA: La probabilidad de B nunca debe ser “0”

Calcular la probabilidad de una persona que tiene fiebre (F) dado que tiene gripe (G) P( | ) = P( ) x P( | ) P( ) NOTA: La probabilidad de B nunca debe ser “0”

EJEMPLO En el consultorio de Ma. Alejandra, el 40% de los pacientes fingen tener gastroenteritis para obtener un descanso médico. El 10% de los pacientes del consultorio, son hombres. La probabilidad de que el paciente finja una enfermedad dado que es hombre, es del 50%. Calcular la probabilidad de que un paciente sea hombre, dado que finge una enfermedad.

Y, ¿SI TENGO MÁS ELEMENTOS? 1. Mapa de árbol. 2. Las probabilidades deben siempre sumar “1”

EJEMPLO Una clínica de Quito, cuanta solo con dos especialidades médicas. El 40% de los médicos son internistas, y el 60% son gastroenterólogos. De los internistas, el 30% son hombres. Mientras que de los gastroenterólogos el 40% son mujeres. Se reporta un accidente cerca de la clínica. En ese caso, si se selecciona una médica para colaborar con los accidentados, cuál es la probabilidad de que sea internista.

¿Cuál es la probabilidad de que sea internista dado que sea mujer?

¿Cuál es la probabilidad de que sea internista dado que sea hombre?

Probabilidad condicional Teorema de Bayes La probabilidad condicional es la probabilidad de un evento A, que se basa en la aparición de otro evento B. El teorema de Bayes se deriva utilizando la definición de probabilidad condicional. La fórmula del teorema de bases incluye dos probabilidades condicionales.