8  Análisis estadístico

1 Definición variables

Cuadro de variables
Nombre Código Definición Unidades Valores posibles Tipo
Concentración cromo cr Nivel de cromo presente en la muestra de orina, medido por espectrometra de absorción atómica. μg/L 0 a 1000 Continua
Concentración níquel ni Nivel de níquel presente en la muestra de orina, medido por espectrometra de absorción atómica. μg/L 0 a 1000 Continua
Puntaje MoCA moca Puntaje obtenido en la prueba Montreal Cognitive A ssessment Puntos 0 a 30 Continua
Tipo de usuario tip Clasificación del consumidor de cigarrillo el ectrónico según su patrón de uso NA

1 = Usuario de CigE

2 = No usuario

Dicotómica
Tabaquismo tab Consumo activo de cigarrillo con vencional NA

1 = Si

2 = No

Dicotómica
Edad ed Edad cronológica del participante en el momento de la evaluación Años 18 a 40 Continua
Sexo sx Sexo biológico del part icipante, reportado por el propio individuo NA

1 = Femenino

2 = Masculino

Dicotómica
Puntaje Flanker flk Valor en mi liegundos obtenido en la prueba Flanker Miliegundos 0-2000 Continua
Puntaje digit span test dst Valor Z obtenido mediante la realización de la prueba Z score -3 a 3 Continua

2 Tipo de muestreo

No probabilístico por conveniencia.

3 Cálculo del tamaño de la muestra

3.1 Tamizaje

Para la primera etapa de tamizaje, se realizó un cálculo de tamaño de muestra para poblaciones finitas, tomando como N total el número de alumnos inscritos 26568 en los planteles de la capital de San Luis Potosí. Tomando en cuenta el estudio realizado por Mejía y Fonseca en el cual se encontró una prevalencia de consumo de cigarrillos electrónicos de 39%, con un error máximo tolerado de 0.05, se obtuvo un total de 366 participantes necesarios para la realización de la primera etapa (tamizaje inicial).

n <- 26568 # Tamaño de la población

p <- 0.39 # Porcentaje esperado (39%)

e <- 0.05 # Error máximo tolerado (5%)

n0 <- (qnorm(1 - e/2)^2 * p * (1 - p)) / e^2

ceiling(n0)
[1] 366

3.2 Estadística inferencial

Para la estadística inferencial, el cálculo se realizó utilizando el tamaño de efecto reportado por Cai y Bidulescu, mismos que reportaron un OR para deterioro cognitivo de 2.591.

Para el odds ratio mencionado, la conversión al estadístico de correlación r obtuvo un valor de 2.5375, por lo que empleando este valor en la función de poder para un estudio de correlación, con nivel de significancia de 95%, un poder de 80% y una alternativa de dos colas, se obtuvo un mínimo de 119 participantes2,3.

reff <- effectsize::oddsratio_to_r(2.59)

reff
[1] 0.2537517
pwr::pwr.r.test(r = reff, power = 0.8)

     approximate correlation power calculation (arctangh transformation) 

              n = 118.7605
              r = 0.2537517
      sig.level = 0.05
          power = 0.8
    alternative = two.sided

3.3 Covariable (Grupo control)

Debido a que se planea evaluar los puntajes de MoCA en un grupo control, se planea incluir un modelo de control de variables de confusión mediante un análisis de regresión lineal múltiple, para el cual se proponen 8 grados de libertad, por lo que la población necesaria para realizarlo de acuerdo con lo propuesto por Peduzzi y Julious (se requerirían 10 a 20 eventos por grado de libertad) serían entre 80 a 160 participantes, por lo que se planea reclutar 119 usuarios de CigE y por lo menos 41 participantes no usuarios ni fumadores46.

BiVariAn::ss_multreg(df = 8, logistic = F, verbose = T)

Sample Size Calculation for a multiple linear regression with 8 degrees of freedom
 
Minimum recommended sample size: 80 
Recommended sample size: 120 
Maximum recommended sample size: 160 

Se planea realizar una prueba de concordancia mediante el coeficiente de correlación intraclase tipo 3 entre 4 evaluadores, por lo que además, se realizó un cálculo de tamaño de muestra para dicha prueba mediante simulación montecarlo7.

4 Análisis de las variables

4.1 Estadística descriptiva

Para el análisis descriptivo, las variables continuas se presentarán como media y desviación estándar si muestran una distribución normal y como mediana y rangos intercuartílicos si muestran una distribución diferente de la normal. La normalidad se evaluará mediante la elaboración de q-q plots de forma gráfica y mediante la prueba estadística de Shapiro-Wilk. Las variables categóricas se presentarán como frecuencia y porcentaje.

4.2 Estadística inferencial

Para la estadística inferencial se realizará un análisis bivariado entre las concentraciones de níquel y cromo, y los puntajes de la evaluación MoCA mediante el análisis de correlación de Pearson si los datos siguen una distribución normal, y mediante un análisis de correlación de Spearman si los datos siguen una distribución diferente de la normal. Inicialmente el análisis de correlación únicamente incluirá a los grupos de usuarios exclusivos de CigE y usuarios duales.

Se realizará además de forma exploratoria un análisis de regresión lineal múltiple tomando en cuenta las variables de control para determinar el efecto de cada una sobre el puntaje MoCA. En dicho análisis serán incluidos todos los participantes. Se utilizará el método de pasos hacia atrás “Stepwise backward” para la selección de predictores con un umbral de 0.05. Se reportará el criterio de información de Akaike y Bayesiano, así como el valor de R2 ajustado. Para el análisis se utilizará el software estadístico R versión 4.4.2 y Rstudio server.