Preguntas con Tag: pandas

Pandas es una biblioteca de Python para la manipulación y análisis de datos, por ejemplo marcos de datos, series de tiempo multidimensionales y conjuntos de datos transversales comúnmente encontrados en estadísticas, resultados de la ciencia experimental, etc...

¿Hay una función Panda para el streaming a / desde una fuente binaria grande rápido en lugar de CSV o JSON? ¿O hay otra herramienta para ello?

JSON no es necesariamente una estructura de alta eficiencia para almacenar datos en términos de bytes de overhead y parsing. Hay una estructura lógica de persing, por ejemplo, basada en la sintaxis
python pandas
codecraftsman
3 años, 4 meses, 28 días

Python - Filtro de datos basado en los valores

Estoy realizando análisis de datos sobre acciones, analizando aprox. 600.000 líneas ejecutando varios criterios. Hasta ahora, hay un número máximo de combinaciones que ha satisfecho es 20. Encontré
python pandas dataframe filter combinations
quantumquill
3 años, 4 meses, 26 días

Prevenir pandas read_excel() dividir todos los valores por ciento en cien?

Estaba cargando un archivo xlsx con pandas (1.0.5) y noté que los valores con un signo por ciento (por ejemplo, 0,3%) se dividen automáticamente por 100. Sé cómo cargar esa columna como una S
python pandas dataframe xlsx
techscribe
3 años, 4 meses, 29 días

Aplicar una distribución del valor perdido de un Dataframe a un subconjunto del Dataframe: Necesita ser más rápido

Tengo un panel grande Dataframe (20k filas). Mocking up some data: columns = [chr(i) for i in range(ord('a'),ord('z')+1)] df = pd.DataFrame(np.random.randint(0,100,size=(20000, 26)),
python pandas performance dataframe
pixelpioneerbbb5
3 años, 4 meses, 29 días

Iteradores de pitón y grupo Pandas : punto de partida

Tengo un marco de datos pandas. Los he agrupado basado en una cierta columna. La forma del marco de datos es (1275553, 87) He creado entonces un iterador, que me permite iterar a
python-3.x pandas iterator pandas-groupby
techtactician
3 años, 4 meses, 29 días

cadena pitón a indexador

Quiero usar una entrada de cadena como parámetro para seleccionar una gama de columnas de un marco de datos pandas. Algo como: columns ="3:10" pd.iloc[:,columns] pero
pandas numpy
devepicenter
3 años, 4 meses, 28 días

Cómo agregar pandas dataframe timetamps columnas de días a años, calculando promedio ponderado

Estoy trabajando con un marco de datos pandas con el siguiente formato: pd.DataFrame({ 'Col_1': ['AAA', 'AAA', 'AAA', 'FFF', 'FFF'], 'Col_2': ['BBB', 'BBB', 'BBB', 'GGG', 'GGG'], 'C
python pandas timestamp aggregation
byteexplorer
3 años, 4 meses, 28 días

Hacer Pandas groupby aplicar comportarse como transformación?

¿Hay una manera de aplicar una función que devuelve las iterables de las mismas longitudes que los grupos, y "transformar" los resultados como una nueva columna? Tengo alguno
pandas pandas-groupby transform apply
nasean
3 años, 4 meses, 28 días

Python ejecutable que solicita un directorio

No tengo experiencia con pitón más allá de este proyecto en el que estoy trabajando. Estoy tratando de convertir mi código en un ejecutable para "automatizar" la mayoría de los procesamientos de da
python pandas
compilerchieftain
3 años, 4 meses, 28 días

Busque un valor en pandas con marcos de datos de longitudes desiguales

Sigo trabajando en mi proyecto de análisis webscraper/data y estoy atrapado en un artículo. Quiero determinar cuánto tiempo ha estado una mascota en el refugio. Para hacer esto, tengo un contador p
python-3.x pandas dataframe
pixelpioneerx
3 años, 4 meses, 27 días

¿Cómo puedo hacer pd.DataFrame() más rápido al convertir el conjunto de datos de imagen cruda a csv al crear csv de dataframe?

En el siguiente código estoy convirtiendo el conjunto de datos de imagen cruda a csv de tal manera que en la primera columna estoy guardando el nombre de la clase (label) que en este caso es el nom
python pandas numpy
algoarchitect
3 años, 4 meses, 26 días

Postgres de Columno Indefinido Python

Tengo un marco de datos a continuación. Los nombres de las columnas son iguales tanto en el marco de datos como en la base de datos. al insertar estos datos en la base de datos me dio un error<
python python-3.x pandas postgresql dataframe
techwizkid
3 años, 4 meses, 27 días

merge_asof da valores NaN en columnas agregadas

Le pregunté a un cuestión antes, sobre la fusión de marcos de da
python pandas dataframe
gitguru
3 años, 4 meses, 25 días

Calcular la densidad de población fusionando dos geodataframes

Tengo dos perfiles de una ciudad. El primero es extremadamente detallado, hasta el nivel de bloques, que tiene varias informaciones sobre cada bloque, incluyendo la densidad de población. La segund
python pandas gis spatial geopandas
devdynamox
3 años, 4 meses, 28 días

TensorFlow2: Unimplemented: Cadena fundida para flotar no es compatible

Estoy tratando de crear un modelo simple TensorFlow para propósitos de aprendizaje y he encontrado un error que no puedo parecer sacudir. Sigo recibiendo el error: Unimplemented: Cast
python pandas numpy tensorflow keras
codechampion
3 años, 4 meses, 28 días

Múltiple fecha de visualización en pitón

Tengo varios archivos binarios de salida en diferentes archivos y quiero visualizarlo en 1 parcela. en cada archivo, el archivo tenía diferentes filas ahora necesito visualizarlo en 1 parcela. Aquí
python pandas matplotlib data-visualization
algorithmwizard
3 años, 4 meses, 27 días

trama media y intervalo de confianza - matplotlib

Quiero hacer una trama que divide un conjunto de datos y muestra la cantidad de observaciones por categoría en el eje izquierdo y un intervalo de confianza (por ejemplo, 90%) incluyendo la media pa
python pandas matplotlib plot data-visualization
bytebard
3 años, 4 meses, 27 días

Índice de lista de Dask fuera de rango leyendo archivos JSON de S3

Estoy tratando de leer un montón de archivos JSON almacenados en S3, pero está levantando un list index out of range cuando computo el DataFrame Mi llamada para abrir los archivo
python-3.x pandas dask python-s3fs
codervoyager
3 años, 4 meses, 26 días

Python Pandas: ValueError: no puede establecer una fila con columnas desajustadas

Relativamente nuevo a Pandas y corriendo en el error mencionado anteriormente. El siguiente código pseudo describe lo que estoy tratando de obtener al fusionar dos DataFrames. En filas de Dat
python pandas dataframe
bytebard30f9
3 años, 4 meses, 27 días

Después de pd.read_csv(nombre de archivo) mis números de fila son NaN, ¿por qué?

Imagen de mi DataFrame y el registro de errores cuando intento acceder a cualquier valor He estado trabajando en re
python pandas dataframe
logiclinguist
3 años, 4 meses, 28 días

padding valores completos del marco de datos en python

Estoy tratando de remar el df: Definir la longitud máxima como: mx=new.groupby("COW_NUM").size().max() </
python pandas keras
gitguru
3 años, 4 meses, 29 días

Convertirse en str a numpy y unirse a la serie pandas

Necesito ayuda para agregar algunos enteros aleatorios y un poco prefijado a una serie de pandas. Será mejor que explique: Tengo mi serie de pandas llamada variables y le gustaría añadir a
pandas string numpy join numpy-ufunc
codechampion
3 años, 4 meses, 29 días

Contando palabras repetidas en dataframe pandas

Tengo un marco de datos que contiene el orden de la camiseta de la gente. df['Order'] es el nombre de la columna que contiene el pedido de cada cliente. Quiero contar cuántas veces <co
python pandas dataframe count jupyter
quantumcoder403a
3 años, 4 meses, 27 días

Pandas: Pivoting multiple tables into single and counting occurences

Estoy tratando de crear una tabla de pivotes que une múltiples (más de 8) marcos de datos en uno. Las tablas tienen múltiples columnas, pero lo mantendré simple aquí: Table1 we
python pandas pivot-table
codecrusader
3 años, 4 meses, 29 días

TipoError: 'Series' objeto no soporta la asignación de elementos mientras que el parámetro de referencia Dask vs Pandas

después de dos análisis de sentimientos, necesito hacer una comparación Dasklib vs Pandas de una manera de referencia. Aunque lo tenía hasta que me encontré con el objeto TipoError: "Series" no apo
python pandas dataframe machine-learning dask
codergeek24
3 años, 4 meses, 27 días

Mesa de Pivot con índices duplicados y sin una función de agregación en Pandas

Tengo un marco de datos: device_id timestamp metric_id value 0 device_1 2020-12-04 05:15:00 cpu_5min 116 1 device_1 2020-12-04 05:30:00 cpu_5mi
python pandas
daniel1
3 años, 4 meses, 28 días

Intervalo de configuración de datos

Un poco nuevo a pitón para que el código pueda mejorarse. Tengo un archivo txt con valores x y y, separado por algún NaN en medio. Los datos van de -x a x y luego regresan (x a -x) pero
pandas matplotlib plot
cyberjedi
3 años, 4 meses, 27 días

¿Cómo utilizar el método de refactorización con funciones en el código de pitón?

Estoy en la fase de aprendizaje de escribir código de pitón. He creado el siguiente código y he conseguido resultados con éxito, sin embargo, se me ha pedido que refactorice el código y no estoy mu
python pandas refactoring
algorithmadeptc6cb
3 años, 4 meses, 27 días

Python pandas bar gráfico con títulos de columna

Tengo el siguiente marco de datos: year tradevalueus partner 0 1989 26065 Algeria 1 1989 12345 Albania 2 1991 178144 Argentina 3 1991
python pandas matplotlib
algorithmadept
3 años, 4 meses, 27 días

¿Cómo deshacerse de algunas de las células del Dataframe con cadenas y valores "inf"?

Soy nuevo en pandas y en la ciencia de datos en general. Tengo los datos que tengo que obtener la media de, pero los datos son muy grandes (alrededor de 15000 filas), y algunas de las células del m
python pandas dataframe data-science data-extraction
scriptwarrior
3 años, 4 meses, 27 días

Grupo condicional en pitón

Estoy trabajando con un marco de datos llamado Ozon. Tiene una columna llamada O3 y un DatetimeIndex. Ahora he creado un nuevo marco de datos para que pueda obtener los va
python pandas group-by
logicluminary
3 años, 4 meses, 29 días

Vía de archivo Web Scraping para salida CSV

Soy nuevo en el chatarra web. Este es mi primer intento. Actualmente tengo un script de trabajo que crea mi salida pero lo sitúa en el mismo archivo que donde se guarda mi script. ¿Cómo puedo añadi
python pandas
algorithmwizard
3 años, 4 meses, 28 días

Dividir un gran conjunto de datos en grupos más pequeños

Estoy tratando de dividir un conjunto de datos grande con 1,7 millones de datos en 3 columnas y asignar un número de grupo a cada 2500 datos para poder analizar cada grupo por separado y compararlo
python pandas python-requests dataset
codesculptor
3 años, 4 meses, 28 días

LGBMClassifier + Datos desequilibrados + GridSearchCV()

La variable dependiente es binaria, los datos desequilibrados es 1:10, el conjunto de datos tiene filas de 70k, la puntuación es la curva de roc, y estoy tratando de utilizar LGBM + GridSearch CV p
pandas scikit-learn lightgbm boosting
binarybard1cc8
3 años, 4 meses, 28 días

¿Cómo resumir el mismo id y valor de la segunda columna a través de diferentes archivos csv y guardar resultados en un nuevo csv con pandas?

Tengo 3 archivos csv que contienen IDs y columnas de usuarios activos. Los IDs en esos archivos a veces están presentes en un solo archivo, dos archivos, pero a veces pueden estar presentes en cada
python pandas csv
compilerhero1251
3 años, 4 meses, 27 días

Incoding categorical data to numerical

Estoy usando este conjunto de datos de Kaggle, y estoy tratando de convertir los valores categóricos a numérico, así que puedo aplicar la regresión.
python pandas data-conversion categorical-data
scriptsorcererf493
3 años, 4 meses, 26 días

Rellene los valores NaN en DataFrame con valores genéricos

Utilizando Python3.7 y la versión actual más actualizada de Pandas. Tengo un marco de datos con los siguientes tipos de datos: [category, float, object(text)]todo lo que quiero hacer e
python pandas
syntaxsensei
3 años, 4 meses, 28 días

Obtener 25 quantum en cumsum pandas

Supongamos que tengo el siguiente DataFrame: df = pd.DataFrame({'id': [2, 4, 10, 12, 13, 14, 19, 20, 21, 22, 24, 25, 27, 29, 30, 31, 42, 50, 54], 'value': [37410.0, 1840
python pandas
compilerhero
3 años, 4 meses, 26 días

¿Cómo puedo subclase o extender de otro modo un paneldas DataFrame sin romper DataFrame.append()?

Tengo un objeto complejo que me gustaría construir alrededor de un pandas DataFrame. He intentado hacer esto con una subclase, pero dependiendo de DataFrame reinicia todas las propiedades en una nu
python python-3.x pandas
codergeek24
3 años, 4 meses, 26 días

¿Cómo combinar X_test, y test, y predicciones después de la predicción de análisis de texto?

Después de usar logitics Reg on text analytics, I was trying to combine the X_test, y_arr_test (label), and y_predictions to ONE dataframe, but don't know how to do it. Necesito ayuda. ' '</p
python pandas scikit-learn nlp concatenation
debugdynamo05ee
3 años, 4 meses, 27 días

¿Cómo crear una lista y filtrar fila de otro dataframe?

Sé que esta pregunta se ha hecho antes, pero cada solución no parece funcionar y me da el mismo resultado. Estoy buscando información sobre lo que estoy haciendo mal. T_18_x2 y Tryp18_50 son
python-3.x pandas
codecatalyst
3 años, 4 meses, 28 días

Problema con obtener valores en una fila en lugar de una columna de archivo .json

Tengo varios archivos .json que me gustaría combinar en un archivo .csv. Los archivos .json se ven así: {"version":1.3,"people":[{"person_id":[-
python json pandas
syntaxsensei
3 años, 4 meses, 25 días

Omitiendo espacios en palabras de una columna determinada al importar archivo de texto en pandas

Estoy tratando de importar un conjunto de datos de un archivo de texto, que parece esto. id book author 1 Cricket World Cup: The Indian Challenge Ashis Ray 2 My Journey Dr. A
python pandas dataframe txt
compilerczar
3 años, 4 meses, 25 días

Cómo utilizar el índice de un marco de datos para reindexar otro en pandas

Siento mucho que realmente no sepa qué título debería usar. Pero aquí está mi pregunta Stocks_Open d-1 d-2 d-3 d-4 000001.HR 1817.670960 18
python pandas
bytebuster
3 años, 4 meses, 28 días

Cómo convertir correctamente la columna en csv que contiene las fechas en JSON

En mi archivo csv, el "ESTABLİSHMENT DATE" columna está delimitada por las barras así: 01/22/2012. Estoy convirtiendo el formato csv en el formato JSON, que necesita
python pandas
codemaster89
3 años, 4 meses, 28 días

Cálculo bucle a través del marco de datos de listas y lista de arrays

Quiero calcular la distancia de Euclidean usando una lista de arrays. import numpy as np import pandas as pd from scipy.spatial import distance #Dataframe data = [np.array([[1, 2], [
python arrays pandas loops euclidean-distance
codecatalyst
3 años, 4 meses, 27 días

¿Desde el marco de datos de Pandas hasta sobresalir con xlwings?

Tengo un marco de datos pandas donde hice una matriz 24x 12 con colores para poder representar mejor mis datos. <img al
python python-3.x pandas xlwings
codecrusaderx58e2
3 años, 4 meses, 28 días

Cómo remodelar Pandas DataFrames Efectivamente

Esta es una pregunta de seguimiento a mi respuesta Aquí.. Tengo el conjunto original de datos brutos que se muestra a continuación y conve
python pandas dataframe
compilerchieftain
3 años, 4 meses, 28 días