Preguntas con Tag: dataframe

Un marco de datos es una estructura de datos tabulares 2D. Por lo general, contiene datos donde las filas son observaciones y columnas son variables y se permiten ser de diferentes tipos (a diferencia de un array o matr...

Python - Filtro de datos basado en los valores

Estoy realizando análisis de datos sobre acciones, analizando aprox. 600.000 líneas ejecutando varios criterios. Hasta ahora, hay un número máximo de combinaciones que ha satisfecho es 20. Encontré

python pandas dataframe filter combinations

quantumquill

3 años, 5 meses, 3 días

Prevenir pandas read_excel() dividir todos los valores por ciento en cien?

Estaba cargando un archivo xlsx con pandas (1.0.5) y noté que los valores con un signo por ciento (por ejemplo, 0,3%) se dividen automáticamente por 100. Sé cómo cargar esa columna como una S

python pandas dataframe xlsx

techscribe

3 años, 5 meses, 6 días

Aplicar una distribución del valor perdido de un Dataframe a un subconjunto del Dataframe: Necesita ser más rápido

Tengo un panel grande Dataframe (20k filas). Mocking up some data: columns = [chr(i) for i in range(ord('a'),ord('z')+1)] df = pd.DataFrame(np.random.randint(0,100,size=(20000, 26)),

python pandas performance dataframe

pixelpioneerbbb5

3 años, 5 meses, 6 días

Plotting usando pitón para grandes conjuntos de datos

Tengo un gran conjunto de datos de alrededor de 1000 valores en 2 columnas. Estos valores están separados por espacios por ejemplo 500 en el primer set y los próximos 500 en otro conjunto (imagen s

python excel dataframe loops data-analysis

codecraftsman32c9

3 años, 5 meses, 6 días

¿Este DynamicFrame se une al comportamiento intencional? ¿O es un bicho?

El comportamiento de unión para un marco dinámico es diferente de lo que esperaba. Ofrecemos dos listas de columnas al método de unión, y parece que si las columnas de la primera coinciden con cual

dataframe join pyspark aws-glue

devdynamo

3 años, 5 meses, 4 días

Pyspark - operación de filtro equivalente de dataframe da diferente salida

Estoy enfrentando un problema particularmente extraño mientras disparando consultas de filtros en un marco de datos de chispa. Aquí hay una captura del comando de filtro que estoy tratando de ejecu

dataframe hadoop pyspark

bytebard30f9

3 años, 5 meses, 4 días

Busque un valor en pandas con marcos de datos de longitudes desiguales

Sigo trabajando en mi proyecto de análisis webscraper/data y estoy atrapado en un artículo. Quiero determinar cuánto tiempo ha estado una mascota en el refugio. Para hacer esto, tengo un contador p

python-3.x pandas dataframe

pixelpioneerx

3 años, 5 meses, 4 días

Postgres de Columno Indefinido Python

Tengo un marco de datos a continuación. Los nombres de las columnas son iguales tanto en el marco de datos como en la base de datos. al insertar estos datos en la base de datos me dio un error<

python python-3.x pandas postgresql dataframe

techwizkid

3 años, 5 meses, 4 días

merge_asof da valores NaN en columnas agregadas

Le pregunté a un cuestión antes, sobre la fusión de marcos de da

python pandas dataframe

gitguru

3 años, 5 meses, 2 días

match() unable to find indexes of values from a dataframe in R

En una función con tres argumentos (es decir, estado, resultado y nums) y el marco de datos se llama df. Aquí está el snippet con el tema: else if (num == "worst"){ da <- as.n

r function dataframe indexing

codecrusaderx

3 años, 5 meses, 4 días

Python Pandas: ValueError: no puede establecer una fila con columnas desajustadas

Relativamente nuevo a Pandas y corriendo en el error mencionado anteriormente. El siguiente código pseudo describe lo que estoy tratando de obtener al fusionar dos DataFrames. En filas de Dat

python pandas dataframe

bytebard30f9

3 años, 5 meses, 4 días

Después de pd.read_csv(nombre de archivo) mis números de fila son NaN, ¿por qué?

Imagen de mi DataFrame y el registro de errores cuando intento acceder a cualquier valor He estado trabajando en re

python pandas dataframe

logiclinguist

3 años, 5 meses, 5 días

Para Pandas cuál es la diferencia entre .loc y no loc [duplicar]

python python-3.x pandas dataframe

codesculptor3f6e

3 años, 5 meses, 6 días

Asunto raro con el patrón de nombre de archivo emparejando

Estoy tratando de bucle a través de varios archivos en una carpeta, fusionar los archivos similares en un solo marco de datos, y luego empujar ese objeto a una tabla en SQL Server. Tengo el código

python sql-server python-3.x dataframe

techinnovator

3 años, 5 meses, 5 días

Cómo dividir el marco de datos de chispa a la lista de datos por colis o condiciones

Tengo miles de millones de marcos de datos de filas, quiero dividir este marco de datos en cientos por valor de algunos cols de etiquetas. mis datos como este value|col1|col2|co

scala dataframe apache-spark apache-spark-sql

bitwisewizard

3 años, 5 meses, 6 días

Contando palabras repetidas en dataframe pandas

Tengo un marco de datos que contiene el orden de la camiseta de la gente. df['Order'] es el nombre de la columna que contiene el pedido de cada cliente. Quiero contar cuántas veces <co

python pandas dataframe count jupyter

quantumcoder403a

3 años, 5 meses, 4 días

TipoError: 'Series' objeto no soporta la asignación de elementos mientras que el parámetro de referencia Dask vs Pandas

después de dos análisis de sentimientos, necesito hacer una comparación Dasklib vs Pandas de una manera de referencia. Aunque lo tenía hasta que me encontré con el objeto TipoError: "Series" no apo

python pandas dataframe machine-learning dask

codergeek24

3 años, 5 meses, 4 días

pandas aplicar tipo Error: el objeto 'float' no es subscriptible, aplicando la función personalizada sobre una columna en particular en pandas

Estoy usando una función de lambda para crear una nueva columna de marco de datos basada en una función personalizada, pero tengo problemas para conseguir que funcione. He publicado el código y el

python dataframe lambda typeerror apply

coderconqueror

3 años, 5 meses, 4 días

Para el bucle que me tira para un bucle [duplicado]

python pandas dataframe

logicluminary

3 años, 5 meses, 4 días

¿Cómo deshacerse de algunas de las células del Dataframe con cadenas y valores "inf"?

Soy nuevo en pandas y en la ciencia de datos en general. Tengo los datos que tengo que obtener la media de, pero los datos son muy grandes (alrededor de 15000 filas), y algunas de las células del m

python pandas dataframe data-science data-extraction

scriptwarrior

3 años, 5 meses, 4 días

emparejar un marco de datos y guardarlos en una lista

# Example data dat <- matrix(runif(2*300), ncol = 2, nrow = 20) group <- rep_len(LETTERS[1:3], 20) df <- cbind.data.frame(dat, Group = group) # Greate subset groups n <- levels(as.factor(g

r list dataframe subset

codeglitch

3 años, 5 meses, 5 días

Cómo eliminar filas de un marco de datos basado en una condición de grupo, sin perder algunas columnas [duplicar]

r dataframe subset

byteninja

3 años, 5 meses, 3 días

Cómo pasar sql. Dataframe como argumento a una función en Scala

Estoy tratando de pasar un Dataframe a una función en la que estoy agregando más columnas en él Actualmente el df tiene pocas columnas en las que necesito filtrar dentro de la función Cuando

dataframe apache-spark-sql

compilerhero1251

3 años, 5 meses, 4 días

Calcular relación cada dos filas con partidos de cadena parcial

Estoy tratando de calcular una relación usando esta fórmula: log2(_5p/3p). Tengo un marco de datos en R y las entradas tienen el mismo nombre excepto su última parte que será _3p

r dataframe dplyr

debugdynamob312

3 años, 5 meses, 4 días

() función en r no es encontrar mis columnas cuando existen

Tengo un marco de datos que detalla el recuento de ambos nombres que fueron más largos de 5 letras y nombres que fueron más cortos que 5 cartas de la biblioteca babynames, que tengo de

r dataframe

codemaster89

3 años, 5 meses, 5 días

Omitiendo espacios en palabras de una columna determinada al importar archivo de texto en pandas

Estoy tratando de importar un conjunto de datos de un archivo de texto, que parece esto. id book author 1 Cricket World Cup: The Indian Challenge Ashis Ray 2 My Journey Dr. A

python pandas dataframe txt

compilerczar

3 años, 5 meses, 2 días

Cómo remodelar Pandas DataFrames Efectivamente

Esta es una pregunta de seguimiento a mi respuesta Aquí.. Tengo el conjunto original de datos brutos que se muestra a continuación y conve

python pandas dataframe

compilerchieftain

3 años, 5 meses, 5 días

Cómo combinar los marcos de datos en una columna al alinear las otras columnas en común

Considere dos DataFrames: >>> df1 = pd.DataFrame({'key': [1, 2, 3, 4, 5], 'bar': ['w','x','y','z','h'], 'foo': ['A', 'B', 'C', 'D','E']}) >>> d

python pandas dataframe

logicluminary

3 años, 5 meses, 5 días

¿Cómo contar observaciones con cierto valor en un grupo condicionalmente?

Estoy trabajando con el siguiente marco de datos: Year Month Day X Y Color 2018 January 1 4.5 6 Red 2018 January 4 3.2 8.1 Red 2018

r dataframe

quantumquill62b1

3 años, 5 meses, 2 días

¿Cómo realizar un grupo selectivo().count() en pandas?

Estoy luchando con la implementación de una peculiar combinación de pandas groupby().count() y la computación promedio de columna en un script, y como estoy operando en un horario ajus

python pandas dataframe group-by count

algorithmwhiz

3 años, 5 meses, 4 días

cómo limito un diagrama de atributo

así que tengo este código df.plot(kind="bar", x="Countries", y=["2014","2015","2016","2017","2018","2019"], figsize=(50,5), stacked= True, title="Persentase populasi yang terjangkau jar

python pandas dataframe matplotlib

devgeek

3 años, 5 meses, 2 días

Columnas relacionadas con las plataformas

Tengo el siguiente conjunto de datos, que he extraído de paneldas dataframe {'Batch': {0: 'Nos705', 1: 'Nos706', 2: 'Nos707', 3: 'Nos708', 4: 'Nos709', 5: 'Nos710', 6: 'Nos711', 7: 'N

python pandas dataframe numpy

markupmaestro

3 años, 5 meses, 1 días

Obtener una Serie con el valor más bajo

Tengo un marco de datos df: a b c d e f g h i a 12 13 23 5 3 13 b 5 43 31 31 41 76 c 14 13 4 24 20 12 Quiero conseguir la

python pandas dataframe

debugdynamo

3 años, 5 meses, 4 días

Crea dinámicamente la cuerda de la columna pandas

Tengo dos marcos de datos como abajo uno es df y otro es anomalías: - d = {'10028': [0], '1058': [25], '20120': [29], '20121': [22],'20122': [0], '20123': [0], '5043': [0], '5046': [0

python python-3.x pandas dataframe numpy

techwizkid

3 años, 5 meses, 4 días

Cambiar el nombre específico de fila en una columna específica [cerrada]

r dataframe row

nasean

3 años, 5 meses, 4 días

Python Pandas: Filtrar filas basadas en múltiples listas que contienen múltiples valores de columna

Tengo un gran marco de datos de unos 5,5 millones de filas y 13 columnas. Me gustaría filtrar la tabla basada en los valores de 2 columnas: 'product_id' y 'return_reason'. Me gustaría selecci

python pandas dataframe filter

syntaxsorcerer

3 años, 5 meses, 6 días

Cómo crear Pandas DataFrame con valores únicos de otro DataFrame? [duplicado]

python pandas dataframe

codesculptor

3 años, 5 meses, 4 días

Pandas: calcular el comportamiento promedio de los datos de series temporales alrededor de un evento

Tengo dos marcos de datos con información de la fecha, df_stream es una corriente de eventos y df_events son eventos específicos en el tiempo. Por ejemplo:

python pandas dataframe pandas-groupby datetimeindex

bitwisewizard

3 años, 5 meses, 4 días

Convertir pandas DataFrame en JSON diccionario de listas

Tengo un marco de datos pandas que representa una información meteorológica básica que parece ubica

python json pandas dataframe c3.js

techtrailblazer8d2c

3 años, 5 meses, 2 días

¿Cómo puedo convertir cadenas en una columna en números que puedo usar más tarde, en un marco de datos? [duplicado]

python python-3.x pandas dataframe

byteninja

3 años, 5 meses, 3 días

Parcela diferentes barras de errores en panda concat plot

He hecho una función tratando de trazar algunas barras de la media de algunos valores en un marco de datos. Donde estoy teniendo problemas es añadir los errores respectivos para cada uno de los com

python pandas dataframe matplotlib errorbar

codecatalyst

3 años, 5 meses, 6 días

¿Hay una manera de hacer un bucle repetir a lo largo de elementos de una lista?

Soy nuevo en R. Tengo un marco de datos que contiene valores de inicio y final para 45 tipos de elementos, y usé dplyr para subconfigurar esos datos en 45 marcos de datos separados. He escrito un b

r dataframe loops for-loop dplyr

scriptsculptor

3 años, 5 meses, 4 días

Realizar la función de aplicación en múltiples columnas usando pandas

Estoy tratando de encontrar filas donde ninguno de los tres actores Facebook comos debe ser menos de la mitad de los otros dos.

python pandas dataframe apply

logicloom

3 años, 5 meses, 1 días

Pandas DataFrame: Encontrar palabras únicas en la columna de cuerda, contar sus valores de ocurrencia y suma en otra columna con condición

Tengo el siguiente marco de datos: import pandas as pd data = {'String': ['foo bar hello world this day', 'foo bar', 'hello bar world'], 'Value' : [

python pandas dataframe series

algorithmwizard

3 años, 5 meses, 6 días

Filtro pandas dataframe en la columna y añadir cadena a los datos filtrados

Estoy teniendo una columna de dataframe que contiene 4 o 6 cadenas de char de longitud, me gustaría añadir "00" cadena al final de las cadenas que tienen la longitud de 4. Estoy usando este c

python pandas dataframe

techsavvypro

3 años, 5 meses, 2 días

Los datos se aplican para devolver el marco de datos y anexarlo al marco de datos

pregunta del marco de datos .. Uso "aplicar" en el marco de datos para hacer alguna función en cada fila del marco de datos. la función se supone que devolver otro marco de datos. Quier

python pandas dataframe

codechampion

3 años, 5 meses, 4 días

Selección de filas de un DataFrame dependiendo de los valores de otro

Tome dos marcos de datos print(df1) A B 0 a 1 1 a 3 2 a 5 3 b 7 4 b 9 5 c 11 6 c 13 7 c 15 print(df2) C D a apple 1 b pear 1 c apple 1 <

python pandas dataframe

scriptsculptor52b5

3 años, 5 meses, 5 días

cómo enviar dataframe fechal a la plantilla django y trazarlo en js utilizando trama

Tengo un marco de datos y quiero enviarlo a mi plantilla de Django. Código del tonto views.py: def graphs(request): df_new = pd.read_excel("/home/cms/cms/stati

javascript django dataframe datetime-format python-datetime

webweaverx

3 años, 5 meses, 5 días

¿Cómo puedo ordenar mi dataframe con el valor más reciente en la parte inferior?

import numpy as np import matplotlib.pyplot as plt import pandas as pd df=pd.read_csv("BTC-USD.csv") df=df.drop(["Date","Adj Close","Volume","Low","Close"],axis=1)

pandas dataframe

bitcraftsman

3 años, 5 meses, 5 días

Encontrar valores iguales en diferentes columnas en pandas

Me gustaría encontrar la intersección entre tres columnas, es decir, el valor igual en ambas. Sé que estos valores existen, porque gráficamente los valores se intersectan (dentro de un pequeño erro

python pandas dataframe numpy

csscraftsman

3 años, 5 meses, 4 días