Preguntas con Tag: dplyr
para preguntas relacionadas con funciones del paquete dplyr, tales como group_by, sintetizar, filtrar y seleccionar.
Error en calcular la desviación estándar combinada en R usando el paquete dplyr
Tengo los siguientes datos de población sin solapamiento, que he resumido para comprobar media, mediana, sd, conteos, etc como se menciona en la columna abajo
structure(list(Productio
r
dplyr
statistics
3 años, 4 meses, 13 días
Cómo probar el valor p con grupos/filtros en dplyr
Mis datos parecen el siguiente ejemplo. (lo siento si es demasiado largo, no estoy seguro de lo que es aceptable/necesario).
He utilizado el siguiente código para calcular la mediana e IQR de
r
dplyr
3 años, 4 meses, 11 días
¿Problema con left_join o Cómo convertir el personaje (en forma científica) al personaje (en forma numérica)?
Quiero unir dos DFs por un par de variables. Todas las variables deben permanecer as.character.
Sin embargo, uno se convierte en notación científica.
La pregunta es, cómo me transformo
r
dplyr
type-conversion
left-join
scientific-notation
3 años, 4 meses, 12 días
Cómo agrupar por una columna y pivotar más ancho en R
Tengo un marco de datos que estoy tratando de agrupar por una columna y pivot_wider. Aquí está mi marco de datos
df = structure(list(Date = structure(c(1608238800, 1608238800, 1608238
r
dplyr
tidyverse
3 años, 4 meses, 12 días
`group_by` y mantener los niveles de agrupación como el nombre del marco de datos anidado
Esta pregunta está relacionada e inspirada en no puede utilizar emmeans dentro del mapa
Estoy haciendo v
r
dplyr
purrr
3 años, 4 meses, 13 días
Factor Columnas de conversión a números en R DataFrame después de mutar
Mi código R funcionaba perfectamente bien en R Studio pero cuando pegaba el mismo código en Kaggle Notebook comenzó a dar errores. Convirtió mis factores a los números cuando se aplica si se usa co
r
dplyr
r-markdown
tidyverse
kaggle
3 años, 4 meses, 12 días
Calcular relación cada dos filas con partidos de cadena parcial
Estoy tratando de calcular una relación usando esta fórmula: log2(_5p/3p).
Tengo un marco de datos en R y las entradas tienen el mismo nombre excepto su última parte que será _3p
r
dataframe
dplyr
3 años, 4 meses, 12 días
Cómo construir un índice único de orden inverso por grupo en R
Mis datos parecen así.
#My data
df <- structure(list(G1 = c("k", "i", "g", "r", "d", "l", "q", "q",
"g", "g", "u", "c", "q", "m", "x"), Val = c(-0.451975472583735,
-0.19872979175927
r
dplyr
3 años, 4 meses, 11 días
R - resumir /colapsing observaciones seleccionando el valor máximo de una estreca
Estoy trabajando en la siguiente idea. Espero que puedas ayudar.
UPDATED
He añadido un tercer tema que altera el problema
DATOS
r
dplyr
3 años, 4 meses, 14 días
R: Número de observaciones dentro de un grupo
Usando el lenguaje de programación R, estoy tratando de seguir este tutorial aquí: Nú
r
dplyr
group-by
count
aggregate
3 años, 4 meses, 11 días
¿Cómo acortar el código en la escoba mientras se ejecutan múltiples regresiones en R?
Estoy corriendo múltiples regresiones por diferentes grupos. Quiero automatizar las cosas un poco más. Traté de correr y salvar las regresiones modelo1, modelo2 y modelo3 inicialmente. Luego intent
r
dplyr
tidyr
broom
3 años, 4 meses, 12 días
¿Hay una manera de hacer un bucle repetir a lo largo de elementos de una lista?
Soy nuevo en R. Tengo un marco de datos que contiene valores de inicio y final para 45 tipos de elementos, y usé dplyr para subconfigurar esos datos en 45 marcos de datos separados. He escrito un b
r
dataframe
loops
for-loop
dplyr
3 años, 4 meses, 12 días
Intervalos de tiempo superpuestos
Estoy tratando de crear estadísticas resumidas para un conjunto de filtros que operan en forma de plomo/lag.
Una breve descripción sobre el plomo/lag:
Cuando un nuevo filtr
r
dplyr
lubridate
3 años, 4 meses, 12 días
¿Por qué rev(factor) no funciona como una manera de revertir el argumento wt de dplyr::top_n()?
Objetivo: devolver la fila con la cosa1=F y la cosa2=MeFirst
¿Por qué esto no funciona?
tibble(
row = 1:10,
thing1 = c(rep("F",5),rep("L",5)),
thing2 = c(rep("MeSeco
r
dplyr
tidyverse
top-n
3 años, 4 meses, 14 días
Filtro agrupado fila por mayor ocurrencia de cadena con dplyr
Estoy trabajando en la colapsación de un conjunto de datos transcripcionómicos de nivel de transcripción a gen para un análisis aguas abajo. Dentro de este conjunto de datos, cada fila tiene un ide
r
dplyr
3 años, 4 meses, 13 días
R: Variables de sumo basadas en alguna condición
Dada una tabla, estoy tratando de aprender a usar R para resumir variables basadas en cuando se cumple una determinada condición (basado en otras variables en la misma tabla).
Usando la bibli
r
dplyr
group-by
count
data-manipulation
3 años, 4 meses, 14 días
Traducir la función dplyr cut_sample en base R
Sólo una pregunta rápida: cómo traducir la función dplyr slice_sample ¿En la base R? Aquí hay un conjunto de datos de juguete:
y <- rnorm(20)
x <- rnorm(20)
z <- rep(1:4,
r
dplyr
sampling
3 años, 4 meses, 14 días
Ajuste del valor fijo al contar las observaciones
Objetivo: Para crear una variable llamada 'duración'--para contar el número de meses el valor del mes anterior (0 o 1) era consistente, a) sólo cuando hay
r
dplyr
tidyverse
shift
rle
3 años, 4 meses, 12 días
Clasificación de intervalos de tiempo superpuestos basados en el factor
Estoy viendo datos de producción de una planta de fabricación y necesito clasificar la producción del día para todas las líneas de producción basadas en el tamaño de botella producida en una línea.
r
dplyr
lubridate
3 años, 4 meses, 12 días
¿Cuál es la mejor manera de aprovechar los argumentos de la función?
Esto se siente como una operación muy simple - computar el medio por grupo de un marco de datos y combinarlo a otro marco de datos preformato - mi UDF hace esto y eso no es realmente la parte con l
r
function
dataframe
dplyr
sapply
3 años, 4 meses, 13 días
Renaming column in tidyeval in dplyr 1.0
Deseo generar nuevas columnas basadas en la recepción de variables en la evaluación ordenada. Por ejemplo,
library(dplyr)
some_custom_measure <- f
r
dplyr
tidyverse
rlang
tidyeval
3 años, 4 meses, 13 días
r: cómo cambiar simultáneamente varios nombres de columna basados en el sufijo individual de cada nombre de columna
He recibido y hoja de datos p autogenerado de un registro y conteniendo metabolitos 1855. La autogeneración añade _vX Automáticamente cada nombre de atributo donde X
r
function
dataframe
dplyr
3 años, 4 meses, 13 días
guardar un marco de datos con una columna de lista a tsv
Quiero guardar un marco de datos con una columna de lista a tsv
> group_file
# A tibble: 2,233 x 2
gene_name marker
1 A3GALT2
2 AAD
r
dataframe
csv
dplyr
tibble
3 años, 4 meses, 11 días
parse hierarchical json into table in R
Tengo muchos arrays json que no siguen el formato "atributo": "valor" que estoy acostumbrado. Quiero leerlos uno a uno y meterlos en tablas. Entonces quiero combinar las mesas. Me quedé atrapado co
r
json
dplyr
3 años, 4 meses, 11 días
Contando observaciones en cada año desde un rango de fecha en dplyr
Digamos que tengo un data.frame consistente en tipo de industria y fechas de inicio y finalización (por ejemplo, para un empleado).
mydf <- data.frame(industry = c("Government", "Educ
r
dplyr
3 años, 4 meses, 14 días
`emmeans` for a gls model does not run inside `map`
Esta pregunta se inspira en no puede utilizar emmeans dentro del mapa, y relacionados con <a
r
dplyr
purrr
emmeans
3 años, 4 meses, 13 días
¿Cómo puedo convertir 120/80 en dos columnas (120 y 80)?
Tengo una columna de presiones sanguíneas que se lee como ##/##, todo lo que quiero hacer esfilir el numerador en una columna y el denominador en otra columna.
¿Por favor ayuda?
r
dplyr
3 años, 4 meses, 11 días
Grouping and Summing Data by Irregular Time Intervals (R language)
Estoy viendo un poste de reflujo por aquí: R: Número de observaciones dentro de un grupo
r
dplyr
group-by
sum
aggregate
3 años, 4 meses, 11 días
¿Cómo comparar valores dentro del subgrupo?
Tengo porcentajes de votos para dos candidatos para varios distritos. Me gustaría ver si los porcentajes de votos son muy cercanos, donde defino muy cerca como una diferencia del 0,5%. El objetivo
r
dplyr
3 años, 4 meses, 13 días
Cómo 'ungroup' un marco de datos pre-grupado
Estoy usando los datos 'esof' en R. Es un marco de datos con registros para 88 combinaciones de edad/alcohol/tobacco. Aquí está un extracto de sus datos:
r
dataframe
dplyr
3 años, 4 meses, 11 días
R dataframe crear nuevas columnas mulitple de las columnas existentes utilizando a través / all_of / mutate_if
Tengo un marco de datos (ejemplo abajo) que tiene respuestas a un cuestionario en varios días.
> df %>%
mutate (Sigma_Bucket_Q1 = if_else(Sigma_Q1 >= Median_Sigm
r
dplyr
3 años, 4 meses, 9 días
r: combinar filtro con n_distinct en el marco de datos
Una pregunta simple. Considerando el marco de datos a continuación, quiero contar identificaciones distintas: una para todos los registros y otra después de filtrar el estado. Sin embargo, el <code
r
dplyr
3 años, 4 meses, 13 días
Cómo atraer una red desde un vector de cadena
Estoy tratando de crear un igraph objeto dividiendo un vector de cadenas en un personaje especial ("cada").
Uso un for-loop para crear un vector y convertirlo en un gráfico de red.
El
r
for-loop
networking
dplyr
igraph
3 años, 4 meses, 11 días
R equivalente a `table ,contents( )` Stata comando for summary statistics
Estoy tratando de imitar a la table Comando Stata en R, que realiza tablas de estadísticas sumarias. El comando le permite crear tablas transversales con diversas estadísticas dentro d
r
dplyr
statistics
data.table
stata
3 años, 4 meses, 12 días