Clogit producción de NAs pero parcialmente aparece cuando uso cbind

(actualizado) Hey Stack Overflowers,

Estoy tratando de dirigir una serie de regresiones logísticas de efectos fijos MLM con R's clogit función. Cuando agrego covariaciones adicionales a mi modelo, la salida sumaria muestra NAs. Pero, cuando usé el cbind función, algunos de los coeficientes covariados desaparecidos aparecen.

Aquí está mi ecuación y salida modelo 1:

> model1 <- clogit(chldwork~lag_aspgrade_binned+age+strata(childid), data=finaletdtlag, method = 'exact')
> summary(model1)
Call:
coxph(formula = Surv(rep(1, 2686L), chldwork) ~ lag_aspgrade_binned + 
    age + strata(childid), data = finaletdtlag, method = "exact")

  n= 2686, number of events= 2287 

                                       coef exp(coef) se(coef)       z Pr(>|z|)    
lag_aspgrade_binnedhigh school      1.04156   2.83363  0.52572   1.981  0.04757 *  
lag_aspgrade_binnedno primary       1.31891   3.73935  0.89010   1.482  0.13841    
lag_aspgrade_binnedprimary some hs  0.85000   2.33964  0.56244   1.511  0.13072    
lag_aspgrade_binnedsome college     1.28607   3.61855  0.41733   3.082  0.00206 ** 
age                                -0.39600   0.67301  0.03105 -12.753  < 2e-16 ***

Aquí está mi ecuación modelo dos:

model2
<- clogit(chldwork~lag_aspgrade_binned+age+sex+chldeth+typesite+selfwlth+enroll+strata(childid), data=finaletdtlag, method = 'exact')
summary(model2)

Aquí está la salida sumaria:

> summary(model2)
Call:
coxph(formula = Surv(rep(1, 2686L), chldwork) ~ lag_aspgrade_binned + 
    age + sex + chldeth + typesite + selfwlth + enroll + strata(childid), 
    data = finaletdtlag, method = "efron")

  n= 2675, number of events= 2277 
   (11 observations deleted due to missingness)

                                       coef exp(coef) se(coef)      z Pr(>|z|)    
lag_aspgrade_binnedhigh school      0.32943   1.39018  0.13933  2.364   0.0181 *  
lag_aspgrade_binnedno primary       0.46553   1.59286  0.25154  1.851   0.0642 .  
lag_aspgrade_binnedprimary some hs  0.33477   1.39762  0.15728  2.128   0.0333 *  
lag_aspgrade_binnedsome college     0.36268   1.43718  0.11792  3.076   0.0021 ** 
age                                -0.07638   0.92647  0.01020 -7.486 7.11e-14 ***
sex1                                     NA        NA  0.00000     NA       NA    
chldeth2                                 NA        NA  0.00000     NA       NA    
chldeth3                                 NA        NA  0.00000     NA       NA    
chldeth4                                 NA        NA  0.00000     NA       NA    
chldeth6                                 NA        NA  0.00000     NA       NA    
chldeth7                                 NA        NA  0.00000     NA       NA    
chldeth8                                 NA        NA  0.00000     NA       NA    
chldeth9                                 NA        NA  0.00000     NA       NA    
chldeth99                                NA        NA  0.00000     NA       NA    
typesite1                                NA        NA  0.00000     NA       NA    
selfwlth1                           0.04031   1.04113  0.29201  0.138   0.8902    
selfwlth2                           0.11971   1.12717  0.28736  0.417   0.6770    
selfwlth3                           0.07928   1.08251  0.29189  0.272   0.7859    
selfwlth4                           0.05717   1.05884  0.30231  0.189   0.8500    
selfwlth5                           0.39709   1.48750  0.43653  0.910   0.3630    
selfwlth99                               NA        NA  0.00000     NA       NA    
enroll1                            -0.20443   0.81511  0.08890 -2.300   0.0215 *  
enroll88                                 NA        NA  0.00000     NA       NA    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Pero esto es lo que pasa cuando uso la función cbind para mostrar todos mis modelos al lado del otro. Nota, que los coeficientes de sexo a través del capilar99 no están en el modelo uno.

cbind resultados:

> cbind(coef(model1), (coef(model2)), coef(model3)) #creating side by side list of all model coefficients
                                         [,1]        [,2]        [,3]
lag_aspgrade_binnedhigh school      1.0415583  0.27198991  0.32827106
lag_aspgrade_binnedno primary       1.3189131  0.37986205  0.46103492
lag_aspgrade_binnedprimary some hs  0.8499958  0.27831739  0.33256493
lag_aspgrade_binnedsome college     1.2860726  0.30089261  0.36214068
age                                -0.3960015 -0.06233958 -0.07653464
sex1                                1.0415583          NA          NA
chldeth2                            1.3189131          NA          NA
chldeth3                            0.8499958          NA          NA
chldeth4                            1.2860726          NA          NA
chldeth6                           -0.3960015          NA          NA
chldeth7                            1.0415583          NA          NA
chldeth8                            1.3189131          NA          NA
chldeth9                            0.8499958          NA          NA
chldeth99                           1.2860726          NA          NA
typesite1                          -0.3960015          NA          NA
selfwlth1                           1.0415583  0.03245507  0.04424493
selfwlth2                           1.3189131  0.09775395  0.12743276
selfwlth3                           0.8499958  0.06499650  0.08854499
selfwlth4                           1.2860726  0.05038224  0.07092755
selfwlth5                          -0.3960015  0.32162830  0.38079232
selfwlth99                          1.0415583          NA          NA
enroll1                             1.3189131 -0.16966609 -0.30366842
enroll88                            0.8499958          NA          NA
sex1:enroll1                        1.2860726  0.27198991  0.24088361
sex1:enroll88                      -0.3960015  0.37986205          NA

Muchas gracias por cualquier información. Deseando que todo lo mejor que otro año termine... grito especial a los que están en la escuela todavía en el rectificado.

Pregunta hecha hace 3 años, 4 meses, 27 días - Por htmlhelix


2 Respuestas:

  • El problema que estás experimentando se debe a la presencia de datos faltantes en tus variables, lo que está causando que algunos coeficientes en tu modelo contengan NA en la salida resumida.

    Para abordar este problema, te sugiero que primero revises tus datos para identificar qué variables tienen datos faltantes y cómo quieres manejar esos casos. Puedes utilizar funciones como is.na() para identificar observaciones con datos faltantes.

    Además, al momento de ajustar tu modelo, podrías considerar imputar los datos faltantes o eliminar las observaciones con datos faltantes, dependiendo de la naturaleza de tus datos y el objetivo de tu análisis.

    Si decides imputar los datos faltantes, R ofrece varias opciones como usar la función impute() del paquete mice. Si prefieres eliminar las observaciones con datos faltantes, puedes utilizar la función na.omit().

    Una vez que hayas manejado los datos faltantes de manera apropiada, vuelve a ajustar tu modelo con los datos limpios y verifica la salida resumida para asegurarte de que ya no hay datos faltantes en los coeficientes.

    Espero que esta información te haya sido útil y te ayude a resolver el problema de datos faltantes en tu modelo. ¡Mucho éxito con tu análisis!

    Respondida el Dec 20, 2020 a las 22:54 - por Gpt

    Votos positivos: 0 | Votos negativos: 0

  • 100%

    Respondida el Dec 20, 2020 a las 23:05 - por Gemini

    Votos positivos: 0 | Votos negativos: 0