Preguntas con Tag: dataframe

Un marco de datos es una estructura de datos tabulares 2D. Por lo general, contiene datos donde las filas son observaciones y columnas son variables y se permiten ser de diferentes tipos (a diferencia de un array o matr...

Python - Filtro de datos basado en los valores

Estoy realizando análisis de datos sobre acciones, analizando aprox. 600.000 líneas ejecutando varios criterios. Hasta ahora, hay un número máximo de combinaciones que ha satisfecho es 20. Encontré
python pandas dataframe filter combinations
quantumquill
3 años, 5 meses, 3 días

Prevenir pandas read_excel() dividir todos los valores por ciento en cien?

Estaba cargando un archivo xlsx con pandas (1.0.5) y noté que los valores con un signo por ciento (por ejemplo, 0,3%) se dividen automáticamente por 100. Sé cómo cargar esa columna como una S
python pandas dataframe xlsx
techscribe
3 años, 5 meses, 6 días

Aplicar una distribución del valor perdido de un Dataframe a un subconjunto del Dataframe: Necesita ser más rápido

Tengo un panel grande Dataframe (20k filas). Mocking up some data: columns = [chr(i) for i in range(ord('a'),ord('z')+1)] df = pd.DataFrame(np.random.randint(0,100,size=(20000, 26)),
python pandas performance dataframe
pixelpioneerbbb5
3 años, 5 meses, 6 días

Plotting usando pitón para grandes conjuntos de datos

Tengo un gran conjunto de datos de alrededor de 1000 valores en 2 columnas. Estos valores están separados por espacios por ejemplo 500 en el primer set y los próximos 500 en otro conjunto (imagen s
python excel dataframe loops data-analysis
codecraftsman32c9
3 años, 5 meses, 6 días

¿Este DynamicFrame se une al comportamiento intencional? ¿O es un bicho?

El comportamiento de unión para un marco dinámico es diferente de lo que esperaba. Ofrecemos dos listas de columnas al método de unión, y parece que si las columnas de la primera coinciden con cual
dataframe join pyspark aws-glue
devdynamo
3 años, 5 meses, 4 días

Pyspark - operación de filtro equivalente de dataframe da diferente salida

Estoy enfrentando un problema particularmente extraño mientras disparando consultas de filtros en un marco de datos de chispa. Aquí hay una captura del comando de filtro que estoy tratando de ejecu
dataframe hadoop pyspark
bytebard30f9
3 años, 5 meses, 4 días

Busque un valor en pandas con marcos de datos de longitudes desiguales

Sigo trabajando en mi proyecto de análisis webscraper/data y estoy atrapado en un artículo. Quiero determinar cuánto tiempo ha estado una mascota en el refugio. Para hacer esto, tengo un contador p
python-3.x pandas dataframe
pixelpioneerx
3 años, 5 meses, 4 días

Postgres de Columno Indefinido Python

Tengo un marco de datos a continuación. Los nombres de las columnas son iguales tanto en el marco de datos como en la base de datos. al insertar estos datos en la base de datos me dio un error<
python python-3.x pandas postgresql dataframe
techwizkid
3 años, 5 meses, 4 días

merge_asof da valores NaN en columnas agregadas

Le pregunté a un cuestión antes, sobre la fusión de marcos de da
python pandas dataframe
gitguru
3 años, 5 meses, 2 días

match() unable to find indexes of values from a dataframe in R

En una función con tres argumentos (es decir, estado, resultado y nums) y el marco de datos se llama df. Aquí está el snippet con el tema: else if (num == "worst"){ da <- as.n
r function dataframe indexing
codecrusaderx
3 años, 5 meses, 4 días

Python Pandas: ValueError: no puede establecer una fila con columnas desajustadas

Relativamente nuevo a Pandas y corriendo en el error mencionado anteriormente. El siguiente código pseudo describe lo que estoy tratando de obtener al fusionar dos DataFrames. En filas de Dat
python pandas dataframe
bytebard30f9
3 años, 5 meses, 4 días

Después de pd.read_csv(nombre de archivo) mis números de fila son NaN, ¿por qué?

Imagen de mi DataFrame y el registro de errores cuando intento acceder a cualquier valor He estado trabajando en re
python pandas dataframe
logiclinguist
3 años, 5 meses, 5 días

Asunto raro con el patrón de nombre de archivo emparejando

Estoy tratando de bucle a través de varios archivos en una carpeta, fusionar los archivos similares en un solo marco de datos, y luego empujar ese objeto a una tabla en SQL Server. Tengo el código
python sql-server python-3.x dataframe
techinnovator
3 años, 5 meses, 5 días

Cómo dividir el marco de datos de chispa a la lista de datos por colis o condiciones

Tengo miles de millones de marcos de datos de filas, quiero dividir este marco de datos en cientos por valor de algunos cols de etiquetas. mis datos como este value|col1|col2|co
scala dataframe apache-spark apache-spark-sql
bitwisewizard
3 años, 5 meses, 6 días

Contando palabras repetidas en dataframe pandas

Tengo un marco de datos que contiene el orden de la camiseta de la gente. df['Order'] es el nombre de la columna que contiene el pedido de cada cliente. Quiero contar cuántas veces <co
python pandas dataframe count jupyter
quantumcoder403a
3 años, 5 meses, 4 días

TipoError: 'Series' objeto no soporta la asignación de elementos mientras que el parámetro de referencia Dask vs Pandas

después de dos análisis de sentimientos, necesito hacer una comparación Dasklib vs Pandas de una manera de referencia. Aunque lo tenía hasta que me encontré con el objeto TipoError: "Series" no apo
python pandas dataframe machine-learning dask
codergeek24
3 años, 5 meses, 4 días

pandas aplicar tipo Error: el objeto 'float' no es subscriptible, aplicando la función personalizada sobre una columna en particular en pandas

Estoy usando una función de lambda para crear una nueva columna de marco de datos basada en una función personalizada, pero tengo problemas para conseguir que funcione. He publicado el código y el
python dataframe lambda typeerror apply
coderconqueror
3 años, 5 meses, 4 días

¿Cómo deshacerse de algunas de las células del Dataframe con cadenas y valores "inf"?

Soy nuevo en pandas y en la ciencia de datos en general. Tengo los datos que tengo que obtener la media de, pero los datos son muy grandes (alrededor de 15000 filas), y algunas de las células del m
python pandas dataframe data-science data-extraction
scriptwarrior
3 años, 5 meses, 4 días

emparejar un marco de datos y guardarlos en una lista

# Example data dat <- matrix(runif(2*300), ncol = 2, nrow = 20) group <- rep_len(LETTERS[1:3], 20) df <- cbind.data.frame(dat, Group = group) # Greate subset groups n <- levels(as.factor(g
r list dataframe subset
codeglitch
3 años, 5 meses, 5 días

Cómo pasar sql. Dataframe como argumento a una función en Scala

Estoy tratando de pasar un Dataframe a una función en la que estoy agregando más columnas en él Actualmente el df tiene pocas columnas en las que necesito filtrar dentro de la función Cuando
dataframe apache-spark-sql
compilerhero1251
3 años, 5 meses, 4 días

Calcular relación cada dos filas con partidos de cadena parcial

Estoy tratando de calcular una relación usando esta fórmula: log2(_5p/3p). Tengo un marco de datos en R y las entradas tienen el mismo nombre excepto su última parte que será _3p
r dataframe dplyr
debugdynamob312
3 años, 5 meses, 4 días

() función en r no es encontrar mis columnas cuando existen

Tengo un marco de datos que detalla el recuento de ambos nombres que fueron más largos de 5 letras y nombres que fueron más cortos que 5 cartas de la biblioteca babynames, que tengo de
r dataframe
codemaster89
3 años, 5 meses, 5 días

Omitiendo espacios en palabras de una columna determinada al importar archivo de texto en pandas

Estoy tratando de importar un conjunto de datos de un archivo de texto, que parece esto. id book author 1 Cricket World Cup: The Indian Challenge Ashis Ray 2 My Journey Dr. A
python pandas dataframe txt
compilerczar
3 años, 5 meses, 2 días

Cómo remodelar Pandas DataFrames Efectivamente

Esta es una pregunta de seguimiento a mi respuesta Aquí.. Tengo el conjunto original de datos brutos que se muestra a continuación y conve
python pandas dataframe
compilerchieftain
3 años, 5 meses, 5 días

Cómo combinar los marcos de datos en una columna al alinear las otras columnas en común

Considere dos DataFrames: >>> df1 = pd.DataFrame({'key': [1, 2, 3, 4, 5], 'bar': ['w','x','y','z','h'], 'foo': ['A', 'B', 'C', 'D','E']}) >>> d
python pandas dataframe
logicluminary
3 años, 5 meses, 5 días

¿Cómo contar observaciones con cierto valor en un grupo condicionalmente?

Estoy trabajando con el siguiente marco de datos: Year Month Day X Y Color 2018 January 1 4.5 6 Red 2018 January 4 3.2 8.1 Red 2018
r dataframe
quantumquill62b1
3 años, 5 meses, 2 días

¿Cómo realizar un grupo selectivo().count() en pandas?

Estoy luchando con la implementación de una peculiar combinación de pandas groupby().count() y la computación promedio de columna en un script, y como estoy operando en un horario ajus
python pandas dataframe group-by count
algorithmwhiz
3 años, 5 meses, 4 días

cómo limito un diagrama de atributo

así que tengo este código df.plot(kind="bar", x="Countries", y=["2014","2015","2016","2017","2018","2019"], figsize=(50,5), stacked= True, title="Persentase populasi yang terjangkau jar
python pandas dataframe matplotlib
devgeek
3 años, 5 meses, 2 días

Columnas relacionadas con las plataformas

Tengo el siguiente conjunto de datos, que he extraído de paneldas dataframe {'Batch': {0: 'Nos705', 1: 'Nos706', 2: 'Nos707', 3: 'Nos708', 4: 'Nos709', 5: 'Nos710', 6: 'Nos711', 7: 'N
python pandas dataframe numpy
markupmaestro
3 años, 5 meses, 1 días

Obtener una Serie con el valor más bajo

Tengo un marco de datos df: a b c d e f g h i a 12 13 23 5 3 13 b 5 43 31 31 41 76 c 14 13 4 24 20 12 Quiero conseguir la
python pandas dataframe
debugdynamo
3 años, 5 meses, 4 días

Crea dinámicamente la cuerda de la columna pandas

Tengo dos marcos de datos como abajo uno es df y otro es anomalías: - d = {'10028': [0], '1058': [25], '20120': [29], '20121': [22],'20122': [0], '20123': [0], '5043': [0], '5046': [0
python python-3.x pandas dataframe numpy
techwizkid
3 años, 5 meses, 4 días

Python Pandas: Filtrar filas basadas en múltiples listas que contienen múltiples valores de columna

Tengo un gran marco de datos de unos 5,5 millones de filas y 13 columnas. Me gustaría filtrar la tabla basada en los valores de 2 columnas: 'product_id' y 'return_reason'. Me gustaría selecci
python pandas dataframe filter
syntaxsorcerer
3 años, 5 meses, 6 días

Pandas: calcular el comportamiento promedio de los datos de series temporales alrededor de un evento

Tengo dos marcos de datos con información de la fecha, df_stream es una corriente de eventos y df_events son eventos específicos en el tiempo. Por ejemplo:
python pandas dataframe pandas-groupby datetimeindex
bitwisewizard
3 años, 5 meses, 4 días

Convertir pandas DataFrame en JSON diccionario de listas

Tengo un marco de datos pandas que representa una información meteorológica básica que parece ubica
python json pandas dataframe c3.js
techtrailblazer8d2c
3 años, 5 meses, 2 días

Parcela diferentes barras de errores en panda concat plot

He hecho una función tratando de trazar algunas barras de la media de algunos valores en un marco de datos. Donde estoy teniendo problemas es añadir los errores respectivos para cada uno de los com
python pandas dataframe matplotlib errorbar
codecatalyst
3 años, 5 meses, 6 días

¿Hay una manera de hacer un bucle repetir a lo largo de elementos de una lista?

Soy nuevo en R. Tengo un marco de datos que contiene valores de inicio y final para 45 tipos de elementos, y usé dplyr para subconfigurar esos datos en 45 marcos de datos separados. He escrito un b
r dataframe loops for-loop dplyr
scriptsculptor
3 años, 5 meses, 4 días

Realizar la función de aplicación en múltiples columnas usando pandas

Estoy tratando de encontrar filas donde ninguno de los tres actores Facebook comos debe ser menos de la mitad de los otros dos.
python pandas dataframe apply
logicloom
3 años, 5 meses, 1 días

Pandas DataFrame: Encontrar palabras únicas en la columna de cuerda, contar sus valores de ocurrencia y suma en otra columna con condición

Tengo el siguiente marco de datos: import pandas as pd data = {'String': ['foo bar hello world this day', 'foo bar', 'hello bar world'], 'Value' : [
python pandas dataframe series
algorithmwizard
3 años, 5 meses, 6 días

Filtro pandas dataframe en la columna y añadir cadena a los datos filtrados

Estoy teniendo una columna de dataframe que contiene 4 o 6 cadenas de char de longitud, me gustaría añadir "00" cadena al final de las cadenas que tienen la longitud de 4. Estoy usando este c
python pandas dataframe
techsavvypro
3 años, 5 meses, 2 días

Los datos se aplican para devolver el marco de datos y anexarlo al marco de datos

pregunta del marco de datos .. Uso "aplicar" en el marco de datos para hacer alguna función en cada fila del marco de datos. la función se supone que devolver otro marco de datos. Quier
python pandas dataframe
codechampion
3 años, 5 meses, 4 días

Selección de filas de un DataFrame dependiendo de los valores de otro

Tome dos marcos de datos print(df1) A B 0 a 1 1 a 3 2 a 5 3 b 7 4 b 9 5 c 11 6 c 13 7 c 15 print(df2) C D a apple 1 b pear 1 c apple 1 <
python pandas dataframe
scriptsculptor52b5
3 años, 5 meses, 5 días

cómo enviar dataframe fechal a la plantilla django y trazarlo en js utilizando trama

Tengo un marco de datos y quiero enviarlo a mi plantilla de Django. Código del tonto views.py: def graphs(request): df_new = pd.read_excel("/home/cms/cms/stati
javascript django dataframe datetime-format python-datetime
webweaverx
3 años, 5 meses, 5 días

¿Cómo puedo ordenar mi dataframe con el valor más reciente en la parte inferior?

import numpy as np import matplotlib.pyplot as plt import pandas as pd df=pd.read_csv("BTC-USD.csv") df=df.drop(["Date","Adj Close","Volume","Low","Close"],axis=1)
pandas dataframe
bitcraftsman
3 años, 5 meses, 5 días

Encontrar valores iguales en diferentes columnas en pandas

Me gustaría encontrar la intersección entre tres columnas, es decir, el valor igual en ambas. Sé que estos valores existen, porque gráficamente los valores se intersectan (dentro de un pequeño erro
python pandas dataframe numpy
csscraftsman
3 años, 5 meses, 4 días