Preguntas con Tag: dplyr

para preguntas relacionadas con funciones del paquete dplyr, tales como group_by, sintetizar, filtrar y seleccionar.

Error en calcular la desviación estándar combinada en R usando el paquete dplyr

Tengo los siguientes datos de población sin solapamiento, que he resumido para comprobar media, mediana, sd, conteos, etc como se menciona en la columna abajo structure(list(Productio
r dplyr statistics
cyberjedi
3 años, 4 meses, 13 días

Cómo probar el valor p con grupos/filtros en dplyr

Mis datos parecen el siguiente ejemplo. (lo siento si es demasiado largo, no estoy seguro de lo que es aceptable/necesario). He utilizado el siguiente código para calcular la mediana e IQR de
r dplyr
scriptsorcerer
3 años, 4 meses, 11 días

¿Problema con left_join o Cómo convertir el personaje (en forma científica) al personaje (en forma numérica)?

Quiero unir dos DFs por un par de variables. Todas las variables deben permanecer as.character. Sin embargo, uno se convierte en notación científica. La pregunta es, cómo me transformo
r dplyr type-conversion left-join scientific-notation
binarybuilder
3 años, 4 meses, 12 días

Cómo agrupar por una columna y pivotar más ancho en R

Tengo un marco de datos que estoy tratando de agrupar por una columna y pivot_wider. Aquí está mi marco de datos df = structure(list(Date = structure(c(1608238800, 1608238800, 1608238
r dplyr tidyverse
techtrailblazer8d2c
3 años, 4 meses, 12 días

`group_by` y mantener los niveles de agrupación como el nombre del marco de datos anidado

Esta pregunta está relacionada e inspirada en no puede utilizar emmeans dentro del mapa Estoy haciendo v
r dplyr purrr
codecraftsman
3 años, 4 meses, 13 días

Factor Columnas de conversión a números en R DataFrame después de mutar

Mi código R funcionaba perfectamente bien en R Studio pero cuando pegaba el mismo código en Kaggle Notebook comenzó a dar errores. Convirtió mis factores a los números cuando se aplica si se usa co
r dplyr r-markdown tidyverse kaggle
codexcrafter
3 años, 4 meses, 12 días

Calcular relación cada dos filas con partidos de cadena parcial

Estoy tratando de calcular una relación usando esta fórmula: log2(_5p/3p). Tengo un marco de datos en R y las entradas tienen el mismo nombre excepto su última parte que será _3p
r dataframe dplyr
debugdynamob312
3 años, 4 meses, 12 días

Cómo construir un índice único de orden inverso por grupo en R

Mis datos parecen así. #My data df <- structure(list(G1 = c("k", "i", "g", "r", "d", "l", "q", "q", "g", "g", "u", "c", "q", "m", "x"), Val = c(-0.451975472583735, -0.19872979175927
r dplyr
codecraftsman
3 años, 4 meses, 11 días

R - resumir /colapsing observaciones seleccionando el valor máximo de una estreca

Estoy trabajando en la siguiente idea. Espero que puedas ayudar. UPDATED He añadido un tercer tema que altera el problema DATOS
r dplyr
devdoodle
3 años, 4 meses, 14 días

R: Número de observaciones dentro de un grupo

Usando el lenguaje de programación R, estoy tratando de seguir este tutorial aquí: Nú
r dplyr group-by count aggregate
bitcraftsman
3 años, 4 meses, 11 días

¿Cómo acortar el código en la escoba mientras se ejecutan múltiples regresiones en R?

Estoy corriendo múltiples regresiones por diferentes grupos. Quiero automatizar las cosas un poco más. Traté de correr y salvar las regresiones modelo1, modelo2 y modelo3 inicialmente. Luego intent
r dplyr tidyr broom
nodenomad
3 años, 4 meses, 12 días

¿Hay una manera de hacer un bucle repetir a lo largo de elementos de una lista?

Soy nuevo en R. Tengo un marco de datos que contiene valores de inicio y final para 45 tipos de elementos, y usé dplyr para subconfigurar esos datos en 45 marcos de datos separados. He escrito un b
r dataframe loops for-loop dplyr
scriptsculptor
3 años, 4 meses, 12 días

Intervalos de tiempo superpuestos

Estoy tratando de crear estadísticas resumidas para un conjunto de filtros que operan en forma de plomo/lag. Una breve descripción sobre el plomo/lag: Cuando un nuevo filtr
r dplyr lubridate
phpphoenix
3 años, 4 meses, 12 días

¿Por qué rev(factor) no funciona como una manera de revertir el argumento wt de dplyr::top_n()?

Objetivo: devolver la fila con la cosa1=F y la cosa2=MeFirst ¿Por qué esto no funciona? tibble( row = 1:10, thing1 = c(rep("F",5),rep("L",5)), thing2 = c(rep("MeSeco
r dplyr tidyverse top-n
codexcrafter
3 años, 4 meses, 14 días

Filtro agrupado fila por mayor ocurrencia de cadena con dplyr

Estoy trabajando en la colapsación de un conjunto de datos transcripcionómicos de nivel de transcripción a gen para un análisis aguas abajo. Dentro de este conjunto de datos, cada fila tiene un ide
r dplyr
techtrailblazer8d2c
3 años, 4 meses, 13 días

R: Variables de sumo basadas en alguna condición

Dada una tabla, estoy tratando de aprender a usar R para resumir variables basadas en cuando se cumple una determinada condición (basado en otras variables en la misma tabla). Usando la bibli
r dplyr group-by count data-manipulation
debugdragon
3 años, 4 meses, 14 días

Traducir la función dplyr cut_sample en base R

Sólo una pregunta rápida: cómo traducir la función dplyr slice_sample ¿En la base R? Aquí hay un conjunto de datos de juguete: y <- rnorm(20) x <- rnorm(20) z <- rep(1:4,
r dplyr sampling
codecrusaderx
3 años, 4 meses, 14 días

Ajuste del valor fijo al contar las observaciones

Objetivo: Para crear una variable llamada 'duración'--para contar el número de meses el valor del mes anterior (0 o 1) era consistente, a) sólo cuando hay
r dplyr tidyverse shift rle
codesculptor
3 años, 4 meses, 12 días

Clasificación de intervalos de tiempo superpuestos basados en el factor

Estoy viendo datos de producción de una planta de fabricación y necesito clasificar la producción del día para todas las líneas de producción basadas en el tamaño de botella producida en una línea.
r dplyr lubridate
byteninja8245
3 años, 4 meses, 12 días

¿Cuál es la mejor manera de aprovechar los argumentos de la función?

Esto se siente como una operación muy simple - computar el medio por grupo de un marco de datos y combinarlo a otro marco de datos preformato - mi UDF hace esto y eso no es realmente la parte con l
r function dataframe dplyr sapply
logicluminary
3 años, 4 meses, 13 días

Renaming column in tidyeval in dplyr 1.0

Deseo generar nuevas columnas basadas en la recepción de variables en la evaluación ordenada. Por ejemplo, library(dplyr) some_custom_measure <- f
r dplyr tidyverse rlang tidyeval
pixelpioneerc4b5
3 años, 4 meses, 13 días

r: cómo cambiar simultáneamente varios nombres de columna basados en el sufijo individual de cada nombre de columna

He recibido y hoja de datos p autogenerado de un registro y conteniendo metabolitos 1855. La autogeneración añade _vX Automáticamente cada nombre de atributo donde X
r function dataframe dplyr
pixelpilot
3 años, 4 meses, 13 días

guardar un marco de datos con una columna de lista a tsv

Quiero guardar un marco de datos con una columna de lista a tsv > group_file # A tibble: 2,233 x 2 gene_name marker 1 A3GALT2 2 AAD
r dataframe csv dplyr tibble
bytebarricade
3 años, 4 meses, 11 días

parse hierarchical json into table in R

Tengo muchos arrays json que no siguen el formato "atributo": "valor" que estoy acostumbrado. Quiero leerlos uno a uno y meterlos en tablas. Entonces quiero combinar las mesas. Me quedé atrapado co
r json dplyr
syntaxsniper
3 años, 4 meses, 11 días

Contando observaciones en cada año desde un rango de fecha en dplyr

Digamos que tengo un data.frame consistente en tipo de industria y fechas de inicio y finalización (por ejemplo, para un empleado). mydf <- data.frame(industry = c("Government", "Educ
r dplyr
pixelprodigy
3 años, 4 meses, 14 días

`emmeans` for a gls model does not run inside `map`

Esta pregunta se inspira en no puede utilizar emmeans dentro del mapa, y relacionados con <a
r dplyr purrr emmeans
codecraftsman
3 años, 4 meses, 13 días

¿Cómo puedo convertir 120/80 en dos columnas (120 y 80)?

Tengo una columna de presiones sanguíneas que se lee como ##/##, todo lo que quiero hacer esfilir el numerador en una columna y el denominador en otra columna. ¿Por favor ayuda?
r dplyr
byteninja8245
3 años, 4 meses, 11 días

Grouping and Summing Data by Irregular Time Intervals (R language)

Estoy viendo un poste de reflujo por aquí: R: Número de observaciones dentro de un grupo
r dplyr group-by sum aggregate
syntaxsensei
3 años, 4 meses, 11 días

¿Cómo comparar valores dentro del subgrupo?

Tengo porcentajes de votos para dos candidatos para varios distritos. Me gustaría ver si los porcentajes de votos son muy cercanos, donde defino muy cerca como una diferencia del 0,5%. El objetivo
r dplyr
scriptsculptor52b5
3 años, 4 meses, 13 días

Cómo 'ungroup' un marco de datos pre-grupado

Estoy usando los datos 'esof' en R. Es un marco de datos con registros para 88 combinaciones de edad/alcohol/tobacco. Aquí está un extracto de sus datos:
r dataframe dplyr
scriptsorcerer4f7e
3 años, 4 meses, 11 días

R dataframe crear nuevas columnas mulitple de las columnas existentes utilizando a través / all_of / mutate_if

Tengo un marco de datos (ejemplo abajo) que tiene respuestas a un cuestionario en varios días. > df %>% mutate (Sigma_Bucket_Q1 = if_else(Sigma_Q1 >= Median_Sigm
r dplyr
codervoyager
3 años, 4 meses, 9 días

r: combinar filtro con n_distinct en el marco de datos

Una pregunta simple. Considerando el marco de datos a continuación, quiero contar identificaciones distintas: una para todos los registros y otra después de filtrar el estado. Sin embargo, el <code
r dplyr
progprophet
3 años, 4 meses, 13 días

Cómo atraer una red desde un vector de cadena

Estoy tratando de crear un igraph objeto dividiendo un vector de cadenas en un personaje especial ("cada"). Uso un for-loop para crear un vector y convertirlo en un gráfico de red. El
r for-loop networking dplyr igraph
debugdynamob312
3 años, 4 meses, 11 días

R equivalente a `table ,contents( )` Stata comando for summary statistics

Estoy tratando de imitar a la table Comando Stata en R, que realiza tablas de estadísticas sumarias. El comando le permite crear tablas transversales con diversas estadísticas dentro d
r dplyr statistics data.table stata
markupmaestro
3 años, 4 meses, 12 días

¿Cómo dividir una cadena en múltiples columnas?

Tengo una cuerda que se ve así: # character string string <- "lambs: cows: 281 chickens: 20 goats: 3 trees: 13" Quiero crear un marco de datos que se p
r string dplyr split tidyverse
devninjax
3 años, 4 meses, 12 días