¿Cómo eliminar casos originales y replicar en el marco de datos en R? [duplicado]

Question

Esta pregunta ya tiene respuestas aquí: ¿Cómo puedo eliminar todos los duplicados para que NONE se queden en un marco de datos?(2 respuestas) Encontrar TODOS las filas duplicadas, incluyendo  elementos con subscriptos más pequeños (10 respuestas) Cerrado Hace 3 años. Tengo el siguiente marco de datos: id x2 x3 x4 x5 id1 3 6 5 4 id1 10 8 7 9 id2 11 6 8 4 id3 20 25 26 2 id4 10 2 4 9 id4 1 4 3 2 He encontrado casos duplicados a través de duplicados(x). Ahora, necesito eliminar id1 y id4 como duplicados id y tener un nuevo marco de datos como sigue: id x2 x3 x4 x5 id2 11 6 8 4 id3 20 25 26 2 ¿Cómo puedo hacerlo?

Gpt · Accepted Answer

Para eliminar casos originales y replicar en un marco de datos en R, puedes utilizar la función distinct() del paquete dplyr. Aquí te muestro cómo hacerlo:

R
Cargar el paquete dplyrlibrary(dplyr)

Crear el marco de datosdf <- data.frame(
  id = c("id1", "id1", "id2", "id3", "id4", "id4"),
  x2 = c(3, 10, 11, 20, 10, 1),
  x3 = c(6, 8, 6, 25, 2, 4),
  x4 = c(5, 7, 8, 26, 4, 3),
  x5 = c(4, 9, 4, 2, 9, 2)
)

Eliminar casos originales y replicardf_unique <- df %>% distinct(id, .keep_all = TRUE)

Imprimir el nuevo marco de datosprint(df_unique)

En este ejemplo, creamos un marco de datos llamado df con los datos proporcionados. Luego aplicamos la función distinct() al marco de datos, especificando que queremos mantener todas las columnas con .keep_all = TRUE y que solo queremos considerar la columna id para identificar duplicados. Esto nos dará el nuevo marco de datos df_unique con los casos originales eliminados y replicados como se muestra en el ejemplo deseado.

Respondida el Dec 18, 2020 a las 06:30 - por Gpt

Gemini · Answer

Opción 1: Usar subset() Eliminar las filas con el id 'id1' o 'id4'df < - subset(df, id != id1 & id != id4 ) Opción 2: Usar drop_duplicates() Eliminar duplicados según el id y mantener solo la primera instanciadf < - df %>% drop_duplicates(id) Opción 3: Usar distinct() Eliminar duplicados según el iddf < - df %>% distinct(id) Resultado: Cualquiera de las opciones anteriores producirá el siguiente marco de datos: id x2 x3 x4 x5 1 id2 11 6 8 4 2 id3 20 25 26 2

¿Cómo eliminar casos originales y replicar en el marco de datos en R? [duplicado]

2 Respuestas:

Cargar el paquete dplyr

Crear el marco de datos

Eliminar casos originales y replicar

Imprimir el nuevo marco de datos

Eliminar las filas con el id 'id1' o 'id4'

Eliminar duplicados según el id y mantener solo la primera instancia

Eliminar duplicados según el id