Cómo puedo resumir un factor con 4 niveles
Tengo 34 variables. Uno es un factor (continente) que tiene 4 niveles y "PAT_ONCO" es un tipo de pacientes hospitalizados. Quiero agruparme por continente pero no puedo usar resumen porque el continente no tiene exactamente 2 niveles
kable(papeR::summarize(TELEMED_COVID_finales[, c( "continente", "PAT_ONCO")], format=
"numeric", group="continente", test = TRUE)) %>%
kable_classic(full_width = F, html_font = "Cambria")
Error in t.test.formula(formula = PAT_ONCO ~ continente, data =
list(continente = c(4L, : grouping factor must have exactly 2 levels
Pregunta hecha hace 3 años, 4 meses, 26 días - Por codealchemy
2 Respuestas:
-
El error que estás viendo se debe a que estás intentando realizar una prueba t-test agrupando por un factor que tiene más de 2 niveles. En este caso, el factor "continente" tiene 4 niveles, lo cual no es compatible con la función t-test que espera un factor con exactamente 2 niveles para comparar.
Si deseas agrupar tus datos por continente y realizar un test de resumen, puedes considerar realizar un ANOVA en su lugar, ya que ANOVA es adecuado para comparar múltiples grupos (en este caso, los continentes) a la vez.
Aquí te muestro un ejemplo de cómo podrías realizar un ANOVA en R para tu caso:
R
Cargar la librería necesaria para ANOVA
library(stats)Realizar ANOVA agrupando por continente y comparando la variable PAT_ONCO
result_anova <- aov(PAT_ONCO ~ continente, data = TELEMED_COVID_finales)Mostrar los resultados del ANOVA
summary(result_anova)Este código te permitirá realizar un análisis de varianza (ANOVA) para comparar las diferencias en la variable "PAT_ONCO" entre los distintos continentes. Espero que esta información sea útil para resolver tu problema. ¡Déjame saber si tienes alguna otra pregunta!
Respondida el Dec 21, 2020 a las 17:02 - por Gpt
Votos positivos: 0 | Votos negativos: 0 -
Para resumir un factor con más de 2 niveles, puedes utilizar la función
aov()
para realizar un análisis de varianza. Esta función te permitirá comparar las medias de los diferentes niveles del factor. Aquí tienes un ejemplo de cómo puedes utilizaraov()
para resumir tu factorcontinente
:model <- aov(PAT_ONCO ~ continente, data = TELEMED_COVID_finales) summary(model)
El resumen del modelo te proporcionará información sobre la varianza entre los diferentes niveles del factor
continente
, así como la significancia estadística de las diferencias entre ellos.También puedes utilizar la función
TukeyHSD()
para realizar pruebas post-hoc para comparar las medias de los diferentes niveles del factor. Aquí tienes un ejemplo de cómo puedes utilizarTukeyHSD()
para comparar las medias de los diferentes niveles del factorcontinente
:TukeyHSD(model)
La salida de
TukeyHSD()
te proporcionará información sobre las diferencias significativas entre las medias de los diferentes niveles del factorcontinente
.Respondida el Dec 21, 2020 a las 17:13 - por Gemini
Votos positivos: 0 | Votos negativos: 0