Preguntas con Tag: pandas
Pandas es una biblioteca de Python para la manipulación y análisis de datos, por ejemplo marcos de datos, series de tiempo multidimensionales y conjuntos de datos transversales comúnmente encontrados en estadísticas, resultados de la ciencia experimental, etc...
¿Hay una función Panda para el streaming a / desde una fuente binaria grande rápido en lugar de CSV o JSON? ¿O hay otra herramienta para ello?
JSON no es necesariamente una estructura de alta eficiencia para almacenar datos en términos de bytes de overhead y parsing. Hay una estructura lógica de persing, por ejemplo, basada en la sintaxis
python
pandas
3 años, 4 meses, 28 días
Python - Filtro de datos basado en los valores
Estoy realizando análisis de datos sobre acciones, analizando aprox. 600.000 líneas ejecutando varios criterios. Hasta ahora, hay un número máximo de combinaciones que ha satisfecho es 20. Encontré
python
pandas
dataframe
filter
combinations
3 años, 4 meses, 26 días
Prevenir pandas read_excel() dividir todos los valores por ciento en cien?
Estaba cargando un archivo xlsx con pandas (1.0.5) y noté que los valores con un signo por ciento (por ejemplo, 0,3%) se dividen automáticamente por 100.
Sé cómo cargar esa columna como una S
python
pandas
dataframe
xlsx
3 años, 4 meses, 29 días
Aplicar una distribución del valor perdido de un Dataframe a un subconjunto del Dataframe: Necesita ser más rápido
Tengo un panel grande Dataframe (20k filas). Mocking up some data:
columns = [chr(i) for i in range(ord('a'),ord('z')+1)]
df = pd.DataFrame(np.random.randint(0,100,size=(20000, 26)),
python
pandas
performance
dataframe
3 años, 4 meses, 29 días
Iteradores de pitón y grupo Pandas : punto de partida
Tengo un marco de datos pandas. Los he agrupado basado en una cierta columna.
La forma del marco de datos es (1275553, 87)
He creado entonces un iterador, que me permite iterar a
python-3.x
pandas
iterator
pandas-groupby
3 años, 4 meses, 29 días
cadena pitón a indexador
Quiero usar una entrada de cadena como parámetro para seleccionar una gama de columnas de un marco de datos pandas. Algo como:
columns ="3:10"
pd.iloc[:,columns]
pero
pandas
numpy
3 años, 4 meses, 28 días
Cómo agregar pandas dataframe timetamps columnas de días a años, calculando promedio ponderado
Estoy trabajando con un marco de datos pandas con el siguiente formato:
pd.DataFrame({
'Col_1': ['AAA', 'AAA', 'AAA', 'FFF', 'FFF'],
'Col_2': ['BBB', 'BBB', 'BBB', 'GGG', 'GGG'],
'C
python
pandas
timestamp
aggregation
3 años, 4 meses, 28 días
Hacer Pandas groupby aplicar comportarse como transformación?
¿Hay una manera de aplicar una función que devuelve las iterables de las mismas longitudes que los grupos, y "transformar" los resultados como una nueva columna?
Tengo alguno
pandas
pandas-groupby
transform
apply
3 años, 4 meses, 28 días
Python ejecutable que solicita un directorio
No tengo experiencia con pitón más allá de este proyecto en el que estoy trabajando. Estoy tratando de convertir mi código en un ejecutable para "automatizar" la mayoría de los procesamientos de da
python
pandas
3 años, 4 meses, 28 días
Busque un valor en pandas con marcos de datos de longitudes desiguales
Sigo trabajando en mi proyecto de análisis webscraper/data y estoy atrapado en un artículo. Quiero determinar cuánto tiempo ha estado una mascota en el refugio. Para hacer esto, tengo un contador p
python-3.x
pandas
dataframe
3 años, 4 meses, 27 días
¿Cómo puedo hacer pd.DataFrame() más rápido al convertir el conjunto de datos de imagen cruda a csv al crear csv de dataframe?
En el siguiente código estoy convirtiendo el conjunto de datos de imagen cruda a csv de tal manera que en la primera columna estoy guardando el nombre de la clase (label) que en este caso es el nom
python
pandas
numpy
3 años, 4 meses, 26 días
Postgres de Columno Indefinido Python
Tengo un marco de datos a continuación. Los nombres de las columnas son iguales tanto en el marco de datos como en la base de datos. al insertar estos datos en la base de datos me dio un error<
python
python-3.x
pandas
postgresql
dataframe
3 años, 4 meses, 27 días
merge_asof da valores NaN en columnas agregadas
Le pregunté a un cuestión antes, sobre la fusión de marcos de da
python
pandas
dataframe
3 años, 4 meses, 25 días
Calcular la densidad de población fusionando dos geodataframes
Tengo dos perfiles de una ciudad. El primero es extremadamente detallado, hasta el nivel de bloques, que tiene varias informaciones sobre cada bloque, incluyendo la densidad de población. La segund
python
pandas
gis
spatial
geopandas
3 años, 4 meses, 28 días
TensorFlow2: Unimplemented: Cadena fundida para flotar no es compatible
Estoy tratando de crear un modelo simple TensorFlow para propósitos de aprendizaje y he encontrado un error que no puedo parecer sacudir. Sigo recibiendo el error:
Unimplemented: Cast
python
pandas
numpy
tensorflow
keras
3 años, 4 meses, 28 días
Múltiple fecha de visualización en pitón
Tengo varios archivos binarios de salida en diferentes archivos y quiero visualizarlo en 1 parcela. en cada archivo, el archivo tenía diferentes filas ahora necesito visualizarlo en 1 parcela. Aquí
python
pandas
matplotlib
data-visualization
3 años, 4 meses, 27 días
trama media y intervalo de confianza - matplotlib
Quiero hacer una trama que divide un conjunto de datos y muestra la cantidad de observaciones por categoría en el eje izquierdo y un intervalo de confianza (por ejemplo, 90%) incluyendo la media pa
python
pandas
matplotlib
plot
data-visualization
3 años, 4 meses, 27 días
Índice de lista de Dask fuera de rango leyendo archivos JSON de S3
Estoy tratando de leer un montón de archivos JSON almacenados en S3, pero está levantando un list index out of range cuando computo el DataFrame
Mi llamada para abrir los archivo
python-3.x
pandas
dask
python-s3fs
3 años, 4 meses, 26 días
Python Pandas: ValueError: no puede establecer una fila con columnas desajustadas
Relativamente nuevo a Pandas y corriendo en el error mencionado anteriormente. El siguiente código pseudo describe lo que estoy tratando de obtener al fusionar dos DataFrames.
En filas de Dat
python
pandas
dataframe
3 años, 4 meses, 27 días
Después de pd.read_csv(nombre de archivo) mis números de fila son NaN, ¿por qué?
Imagen de mi DataFrame y el registro de errores cuando intento acceder a cualquier valor
He estado trabajando en re
python
pandas
dataframe
3 años, 4 meses, 28 días
Para Pandas cuál es la diferencia entre .loc y no loc [duplicar]
<
python
python-3.x
pandas
dataframe
3 años, 4 meses, 29 días
padding valores completos del marco de datos en python
Estoy tratando de remar el df:
Definir la longitud máxima como:
mx=new.groupby("COW_NUM").size().max()
</
python
pandas
keras
3 años, 4 meses, 29 días
Convertirse en str a numpy y unirse a la serie pandas
Necesito ayuda para agregar algunos enteros aleatorios y un poco prefijado a una serie de pandas. Será mejor que explique:
Tengo mi serie de pandas llamada variables y le gustaría añadir a
pandas
string
numpy
join
numpy-ufunc
3 años, 4 meses, 29 días
Contando palabras repetidas en dataframe pandas
Tengo un marco de datos que contiene el orden de la camiseta de la gente. df['Order'] es el nombre de la columna que contiene el pedido de cada cliente. Quiero contar cuántas veces <co
python
pandas
dataframe
count
jupyter
3 años, 4 meses, 27 días
Pandas: Pivoting multiple tables into single and counting occurences
Estoy tratando de crear una tabla de pivotes que une múltiples (más de 8) marcos de datos en uno.
Las tablas tienen múltiples columnas, pero lo mantendré simple aquí:
Table1
we
python
pandas
pivot-table
3 años, 4 meses, 29 días
TipoError: 'Series' objeto no soporta la asignación de elementos mientras que el parámetro de referencia Dask vs Pandas
después de dos análisis de sentimientos, necesito hacer una comparación Dasklib vs Pandas de una manera de referencia. Aunque lo tenía hasta que me encontré con el objeto TipoError: "Series" no apo
python
pandas
dataframe
machine-learning
dask
3 años, 4 meses, 27 días
Mesa de Pivot con índices duplicados y sin una función de agregación en Pandas
Tengo un marco de datos:
device_id timestamp metric_id value
0 device_1 2020-12-04 05:15:00 cpu_5min 116
1 device_1 2020-12-04 05:30:00 cpu_5mi
python
pandas
3 años, 4 meses, 28 días
Intervalo de configuración de datos
Un poco nuevo a pitón para que el código pueda mejorarse.
Tengo un archivo txt con valores x y y, separado por algún NaN en medio.
Los datos van de -x a x y luego regresan (x a -x) pero
pandas
matplotlib
plot
3 años, 4 meses, 27 días
¿Cómo utilizar el método de refactorización con funciones en el código de pitón?
Estoy en la fase de aprendizaje de escribir código de pitón. He creado el siguiente código y he conseguido resultados con éxito, sin embargo, se me ha pedido que refactorice el código y no estoy mu
python
pandas
refactoring
3 años, 4 meses, 27 días
Para el bucle que me tira para un bucle [duplicado]
<
python
pandas
dataframe
3 años, 4 meses, 27 días
Python pandas bar gráfico con títulos de columna
Tengo el siguiente marco de datos:
year tradevalueus partner
0 1989 26065 Algeria
1 1989 12345 Albania
2 1991 178144 Argentina
3 1991
python
pandas
matplotlib
3 años, 4 meses, 27 días
¿Cómo deshacerse de algunas de las células del Dataframe con cadenas y valores "inf"?
Soy nuevo en pandas y en la ciencia de datos en general. Tengo los datos que tengo que obtener la media de, pero los datos son muy grandes (alrededor de 15000 filas), y algunas de las células del m
python
pandas
dataframe
data-science
data-extraction
3 años, 4 meses, 27 días
Grupo condicional en pitón
Estoy trabajando con un marco de datos llamado Ozon. Tiene una columna llamada O3 y un DatetimeIndex. Ahora he creado un nuevo marco de datos para que pueda obtener los va
python
pandas
group-by
3 años, 4 meses, 29 días
Vía de archivo Web Scraping para salida CSV
Soy nuevo en el chatarra web. Este es mi primer intento. Actualmente tengo un script de trabajo que crea mi salida pero lo sitúa en el mismo archivo que donde se guarda mi script.
¿Cómo puedo añadi
python
pandas
3 años, 4 meses, 28 días
Dividir un gran conjunto de datos en grupos más pequeños
Estoy tratando de dividir un conjunto de datos grande con 1,7 millones de datos en 3 columnas y asignar un número de grupo a cada 2500 datos para poder analizar cada grupo por separado y compararlo
python
pandas
python-requests
dataset
3 años, 4 meses, 28 días
LGBMClassifier + Datos desequilibrados + GridSearchCV()
La variable dependiente es binaria, los datos desequilibrados es 1:10, el conjunto de datos tiene filas de 70k, la puntuación es la curva de roc, y estoy tratando de utilizar LGBM + GridSearch CV p
pandas
scikit-learn
lightgbm
boosting
3 años, 4 meses, 28 días
¿Cómo resumir el mismo id y valor de la segunda columna a través de diferentes archivos csv y guardar resultados en un nuevo csv con pandas?
Tengo 3 archivos csv que contienen IDs y columnas de usuarios activos. Los IDs en esos archivos a veces están presentes en un solo archivo, dos archivos, pero a veces pueden estar presentes en cada
python
pandas
csv
3 años, 4 meses, 27 días
Incoding categorical data to numerical
Estoy usando este conjunto de datos de Kaggle, y estoy tratando de convertir los valores categóricos a numérico, así que puedo aplicar la regresión.
python
pandas
data-conversion
categorical-data
3 años, 4 meses, 26 días
Rellene los valores NaN en DataFrame con valores genéricos
Utilizando Python3.7 y la versión actual más actualizada de Pandas.
Tengo un marco de datos con los siguientes tipos de datos: [category, float, object(text)]todo lo que quiero hacer e
python
pandas
3 años, 4 meses, 28 días
Obtener 25 quantum en cumsum pandas
Supongamos que tengo el siguiente DataFrame:
df = pd.DataFrame({'id': [2, 4, 10, 12, 13, 14, 19, 20, 21, 22, 24, 25, 27, 29, 30, 31, 42, 50, 54],
'value': [37410.0, 1840
python
pandas
3 años, 4 meses, 26 días
¿Cómo puedo subclase o extender de otro modo un paneldas DataFrame sin romper DataFrame.append()?
Tengo un objeto complejo que me gustaría construir alrededor de un pandas DataFrame. He intentado hacer esto con una subclase, pero dependiendo de DataFrame reinicia todas las propiedades en una nu
python
python-3.x
pandas
3 años, 4 meses, 26 días
¿Cómo combinar X_test, y test, y predicciones después de la predicción de análisis de texto?
Después de usar logitics Reg on text analytics, I was trying to combine the X_test, y_arr_test (label), and y_predictions to ONE dataframe, but don't know how to do it. Necesito ayuda.
' '</p
python
pandas
scikit-learn
nlp
concatenation
3 años, 4 meses, 27 días
¿Cómo crear una lista y filtrar fila de otro dataframe?
Sé que esta pregunta se ha hecho antes, pero cada solución no parece funcionar y me da el mismo resultado. Estoy buscando información sobre lo que estoy haciendo mal.
T_18_x2 y Tryp18_50 son
python-3.x
pandas
3 años, 4 meses, 28 días
Problema con obtener valores en una fila en lugar de una columna de archivo .json
Tengo varios archivos .json que me gustaría combinar en un archivo .csv. Los archivos .json se ven así:
{"version":1.3,"people":[{"person_id":[-
python
json
pandas
3 años, 4 meses, 25 días
Omitiendo espacios en palabras de una columna determinada al importar archivo de texto en pandas
Estoy tratando de importar un conjunto de datos de un archivo de texto, que parece esto.
id book author
1 Cricket World Cup: The Indian Challenge Ashis Ray
2 My Journey Dr. A
python
pandas
dataframe
txt
3 años, 4 meses, 25 días
Cómo utilizar el índice de un marco de datos para reindexar otro en pandas
Siento mucho que realmente no sepa qué título debería usar. Pero aquí está mi pregunta
Stocks_Open
d-1 d-2 d-3 d-4
000001.HR 1817.670960 18
python
pandas
3 años, 4 meses, 28 días
Cómo convertir correctamente la columna en csv que contiene las fechas en JSON
En mi archivo csv, el "ESTABLİSHMENT DATE" columna está delimitada por las barras así: 01/22/2012.
Estoy convirtiendo el formato csv en el formato JSON, que necesita
python
pandas
3 años, 4 meses, 28 días
Cálculo bucle a través del marco de datos de listas y lista de arrays
Quiero calcular la distancia de Euclidean usando una lista de arrays.
import numpy as np
import pandas as pd
from scipy.spatial import distance
#Dataframe
data = [np.array([[1, 2], [
python
arrays
pandas
loops
euclidean-distance
3 años, 4 meses, 27 días
¿Desde el marco de datos de Pandas hasta sobresalir con xlwings?
Tengo un marco de datos pandas donde hice una matriz 24x 12 con colores para poder representar mejor mis datos.
<img al
python
python-3.x
pandas
xlwings
3 años, 4 meses, 28 días
Cómo remodelar Pandas DataFrames Efectivamente
Esta es una pregunta de seguimiento a mi respuesta Aquí.. Tengo el conjunto original de datos brutos que se muestra a continuación y conve
python
pandas
dataframe
3 años, 4 meses, 28 días