Preguntas con Tag: dataframe
Un marco de datos es una estructura de datos tabulares 2D. Por lo general, contiene datos donde las filas son observaciones y columnas son variables y se permiten ser de diferentes tipos (a diferencia de un array o matr...
Python - Filtro de datos basado en los valores
Estoy realizando análisis de datos sobre acciones, analizando aprox. 600.000 líneas ejecutando varios criterios. Hasta ahora, hay un número máximo de combinaciones que ha satisfecho es 20. Encontré
python
pandas
dataframe
filter
combinations
3 años, 5 meses, 3 días
Prevenir pandas read_excel() dividir todos los valores por ciento en cien?
Estaba cargando un archivo xlsx con pandas (1.0.5) y noté que los valores con un signo por ciento (por ejemplo, 0,3%) se dividen automáticamente por 100.
Sé cómo cargar esa columna como una S
python
pandas
dataframe
xlsx
3 años, 5 meses, 6 días
Aplicar una distribución del valor perdido de un Dataframe a un subconjunto del Dataframe: Necesita ser más rápido
Tengo un panel grande Dataframe (20k filas). Mocking up some data:
columns = [chr(i) for i in range(ord('a'),ord('z')+1)]
df = pd.DataFrame(np.random.randint(0,100,size=(20000, 26)),
python
pandas
performance
dataframe
3 años, 5 meses, 6 días
Plotting usando pitón para grandes conjuntos de datos
Tengo un gran conjunto de datos de alrededor de 1000 valores en 2 columnas. Estos valores están separados por espacios por ejemplo 500 en el primer set y los próximos 500 en otro conjunto (imagen s
python
excel
dataframe
loops
data-analysis
3 años, 5 meses, 6 días
¿Este DynamicFrame se une al comportamiento intencional? ¿O es un bicho?
El comportamiento de unión para un marco dinámico es diferente de lo que esperaba. Ofrecemos dos listas de columnas al método de unión, y parece que si las columnas de la primera coinciden con cual
dataframe
join
pyspark
aws-glue
3 años, 5 meses, 4 días
Pyspark - operación de filtro equivalente de dataframe da diferente salida
Estoy enfrentando un problema particularmente extraño mientras disparando consultas de filtros en un marco de datos de chispa. Aquí hay una captura del comando de filtro que estoy tratando de ejecu
dataframe
hadoop
pyspark
3 años, 5 meses, 4 días
Busque un valor en pandas con marcos de datos de longitudes desiguales
Sigo trabajando en mi proyecto de análisis webscraper/data y estoy atrapado en un artículo. Quiero determinar cuánto tiempo ha estado una mascota en el refugio. Para hacer esto, tengo un contador p
python-3.x
pandas
dataframe
3 años, 5 meses, 4 días
Postgres de Columno Indefinido Python
Tengo un marco de datos a continuación. Los nombres de las columnas son iguales tanto en el marco de datos como en la base de datos. al insertar estos datos en la base de datos me dio un error<
python
python-3.x
pandas
postgresql
dataframe
3 años, 5 meses, 4 días
merge_asof da valores NaN en columnas agregadas
Le pregunté a un cuestión antes, sobre la fusión de marcos de da
python
pandas
dataframe
3 años, 5 meses, 2 días
match() unable to find indexes of values from a dataframe in R
En una función con tres argumentos (es decir, estado, resultado y nums) y el marco de datos se llama df.
Aquí está el snippet con el tema:
else if (num == "worst"){
da <- as.n
r
function
dataframe
indexing
3 años, 5 meses, 4 días
Python Pandas: ValueError: no puede establecer una fila con columnas desajustadas
Relativamente nuevo a Pandas y corriendo en el error mencionado anteriormente. El siguiente código pseudo describe lo que estoy tratando de obtener al fusionar dos DataFrames.
En filas de Dat
python
pandas
dataframe
3 años, 5 meses, 4 días
Después de pd.read_csv(nombre de archivo) mis números de fila son NaN, ¿por qué?
Imagen de mi DataFrame y el registro de errores cuando intento acceder a cualquier valor
He estado trabajando en re
python
pandas
dataframe
3 años, 5 meses, 5 días
Para Pandas cuál es la diferencia entre .loc y no loc [duplicar]
<
python
python-3.x
pandas
dataframe
3 años, 5 meses, 6 días
Asunto raro con el patrón de nombre de archivo emparejando
Estoy tratando de bucle a través de varios archivos en una carpeta, fusionar los archivos similares en un solo marco de datos, y luego empujar ese objeto a una tabla en SQL Server. Tengo el código
python
sql-server
python-3.x
dataframe
3 años, 5 meses, 5 días
Cómo dividir el marco de datos de chispa a la lista de datos por colis o condiciones
Tengo miles de millones de marcos de datos de filas, quiero dividir este marco de datos en cientos por valor de algunos cols de etiquetas.
mis datos como este
value|col1|col2|co
scala
dataframe
apache-spark
apache-spark-sql
3 años, 5 meses, 6 días
Contando palabras repetidas en dataframe pandas
Tengo un marco de datos que contiene el orden de la camiseta de la gente. df['Order'] es el nombre de la columna que contiene el pedido de cada cliente. Quiero contar cuántas veces <co
python
pandas
dataframe
count
jupyter
3 años, 5 meses, 4 días
TipoError: 'Series' objeto no soporta la asignación de elementos mientras que el parámetro de referencia Dask vs Pandas
después de dos análisis de sentimientos, necesito hacer una comparación Dasklib vs Pandas de una manera de referencia. Aunque lo tenía hasta que me encontré con el objeto TipoError: "Series" no apo
python
pandas
dataframe
machine-learning
dask
3 años, 5 meses, 4 días
pandas aplicar tipo Error: el objeto 'float' no es subscriptible, aplicando la función personalizada sobre una columna en particular en pandas
Estoy usando una función de lambda para crear una nueva columna de marco de datos basada en una función personalizada, pero tengo problemas para conseguir que funcione. He publicado el código y el
python
dataframe
lambda
typeerror
apply
3 años, 5 meses, 4 días
Para el bucle que me tira para un bucle [duplicado]
<
python
pandas
dataframe
3 años, 5 meses, 4 días
¿Cómo deshacerse de algunas de las células del Dataframe con cadenas y valores "inf"?
Soy nuevo en pandas y en la ciencia de datos en general. Tengo los datos que tengo que obtener la media de, pero los datos son muy grandes (alrededor de 15000 filas), y algunas de las células del m
python
pandas
dataframe
data-science
data-extraction
3 años, 5 meses, 4 días
emparejar un marco de datos y guardarlos en una lista
# Example data
dat <- matrix(runif(2*300), ncol = 2, nrow = 20)
group <- rep_len(LETTERS[1:3], 20)
df <- cbind.data.frame(dat, Group = group)
# Greate subset groups
n <- levels(as.factor(g
r
list
dataframe
subset
3 años, 5 meses, 5 días
Cómo eliminar filas de un marco de datos basado en una condición de grupo, sin perder algunas columnas [duplicar]
<
r
dataframe
subset
3 años, 5 meses, 3 días
Cómo pasar sql. Dataframe como argumento a una función en Scala
Estoy tratando de pasar un Dataframe a una función en la que estoy agregando más columnas en él
Actualmente el df tiene pocas columnas en las que necesito filtrar dentro de la función
Cuando
dataframe
apache-spark-sql
3 años, 5 meses, 4 días
Calcular relación cada dos filas con partidos de cadena parcial
Estoy tratando de calcular una relación usando esta fórmula: log2(_5p/3p).
Tengo un marco de datos en R y las entradas tienen el mismo nombre excepto su última parte que será _3p
r
dataframe
dplyr
3 años, 5 meses, 4 días
() función en r no es encontrar mis columnas cuando existen
Tengo un marco de datos que detalla el recuento de ambos nombres que fueron más largos de 5 letras y nombres que fueron más cortos que 5 cartas de la biblioteca babynames, que tengo de
r
dataframe
3 años, 5 meses, 5 días
Omitiendo espacios en palabras de una columna determinada al importar archivo de texto en pandas
Estoy tratando de importar un conjunto de datos de un archivo de texto, que parece esto.
id book author
1 Cricket World Cup: The Indian Challenge Ashis Ray
2 My Journey Dr. A
python
pandas
dataframe
txt
3 años, 5 meses, 2 días
Cómo remodelar Pandas DataFrames Efectivamente
Esta es una pregunta de seguimiento a mi respuesta Aquí.. Tengo el conjunto original de datos brutos que se muestra a continuación y conve
python
pandas
dataframe
3 años, 5 meses, 5 días
Cómo combinar los marcos de datos en una columna al alinear las otras columnas en común
Considere dos DataFrames:
>>> df1 = pd.DataFrame({'key': [1, 2, 3, 4, 5],
'bar': ['w','x','y','z','h'],
'foo': ['A', 'B', 'C', 'D','E']})
>>> d
python
pandas
dataframe
3 años, 5 meses, 5 días
¿Cómo contar observaciones con cierto valor en un grupo condicionalmente?
Estoy trabajando con el siguiente marco de datos:
Year Month Day X Y Color
2018 January 1 4.5 6 Red
2018 January 4 3.2 8.1 Red
2018
r
dataframe
3 años, 5 meses, 2 días
¿Cómo realizar un grupo selectivo().count() en pandas?
Estoy luchando con la implementación de una peculiar combinación de pandas groupby().count() y la computación promedio de columna en un script, y como estoy operando en un horario ajus
python
pandas
dataframe
group-by
count
3 años, 5 meses, 4 días
cómo limito un diagrama de atributo
así que tengo este código
df.plot(kind="bar", x="Countries", y=["2014","2015","2016","2017","2018","2019"], figsize=(50,5), stacked= True, title="Persentase populasi yang terjangkau jar
python
pandas
dataframe
matplotlib
3 años, 5 meses, 2 días
Columnas relacionadas con las plataformas
Tengo el siguiente conjunto de datos, que he extraído de paneldas dataframe
{'Batch': {0: 'Nos705', 1: 'Nos706', 2: 'Nos707', 3: 'Nos708', 4: 'Nos709', 5: 'Nos710', 6: 'Nos711', 7: 'N
python
pandas
dataframe
numpy
3 años, 5 meses, 1 días
Obtener una Serie con el valor más bajo
Tengo un marco de datos df:
a b c
d e f g h i
a 12 13 23 5 3 13
b 5 43 31 31 41 76
c 14 13 4 24 20 12
Quiero conseguir la
python
pandas
dataframe
3 años, 5 meses, 4 días
Crea dinámicamente la cuerda de la columna pandas
Tengo dos marcos de datos como abajo uno es df y otro es anomalías: -
d = {'10028': [0], '1058': [25], '20120': [29], '20121': [22],'20122': [0], '20123': [0], '5043': [0], '5046': [0
python
python-3.x
pandas
dataframe
numpy
3 años, 5 meses, 4 días
Cambiar el nombre específico de fila en una columna específica [cerrada]
<
r
dataframe
row
3 años, 5 meses, 4 días
Python Pandas: Filtrar filas basadas en múltiples listas que contienen múltiples valores de columna
Tengo un gran marco de datos de unos 5,5 millones de filas y 13 columnas. Me gustaría filtrar la tabla basada en los valores de 2 columnas: 'product_id' y 'return_reason'.
Me gustaría selecci
python
pandas
dataframe
filter
3 años, 5 meses, 6 días
Cómo crear Pandas DataFrame con valores únicos de otro DataFrame? [duplicado]
<
python
pandas
dataframe
3 años, 5 meses, 4 días
Pandas: calcular el comportamiento promedio de los datos de series temporales alrededor de un evento
Tengo dos marcos de datos con información de la fecha, df_stream es una corriente de eventos y df_events son eventos específicos en el tiempo. Por ejemplo:
python
pandas
dataframe
pandas-groupby
datetimeindex
3 años, 5 meses, 4 días
Convertir pandas DataFrame en JSON diccionario de listas
Tengo un marco de datos pandas que representa una información meteorológica básica que parece
ubica
python
json
pandas
dataframe
c3.js
3 años, 5 meses, 2 días
¿Cómo puedo convertir cadenas en una columna en números que puedo usar más tarde, en un marco de datos? [duplicado]
<
python
python-3.x
pandas
dataframe
3 años, 5 meses, 3 días
Parcela diferentes barras de errores en panda concat plot
He hecho una función tratando de trazar algunas barras de la media de algunos valores en un marco de datos. Donde estoy teniendo problemas es añadir los errores respectivos para cada uno de los com
python
pandas
dataframe
matplotlib
errorbar
3 años, 5 meses, 6 días
¿Hay una manera de hacer un bucle repetir a lo largo de elementos de una lista?
Soy nuevo en R. Tengo un marco de datos que contiene valores de inicio y final para 45 tipos de elementos, y usé dplyr para subconfigurar esos datos en 45 marcos de datos separados. He escrito un b
r
dataframe
loops
for-loop
dplyr
3 años, 5 meses, 4 días
Realizar la función de aplicación en múltiples columnas usando pandas
Estoy tratando de encontrar filas donde ninguno de los tres actores Facebook comos debe ser menos de la mitad de los otros dos.
python
pandas
dataframe
apply
3 años, 5 meses, 1 días
Pandas DataFrame: Encontrar palabras únicas en la columna de cuerda, contar sus valores de ocurrencia y suma en otra columna con condición
Tengo el siguiente marco de datos:
import pandas as pd
data = {'String': ['foo bar hello world this day', 'foo bar', 'hello bar world'],
'Value' : [
python
pandas
dataframe
series
3 años, 5 meses, 6 días
Filtro pandas dataframe en la columna y añadir cadena a los datos filtrados
Estoy teniendo una columna de dataframe que contiene 4 o 6 cadenas de char de longitud, me gustaría añadir "00" cadena al final de las cadenas que tienen la longitud de 4.
Estoy usando este c
python
pandas
dataframe
3 años, 5 meses, 2 días
Los datos se aplican para devolver el marco de datos y anexarlo al marco de datos
pregunta del marco de datos ..
Uso "aplicar" en el marco de datos para hacer alguna función en cada fila del marco de datos.
la función se supone que devolver otro marco de datos.
Quier
python
pandas
dataframe
3 años, 5 meses, 4 días
Selección de filas de un DataFrame dependiendo de los valores de otro
Tome dos marcos de datos
print(df1)
A B
0 a 1
1 a 3
2 a 5
3 b 7
4 b 9
5 c 11
6 c 13
7 c 15
print(df2)
C D
a apple 1
b pear 1
c apple 1
<
python
pandas
dataframe
3 años, 5 meses, 5 días
cómo enviar dataframe fechal a la plantilla django y trazarlo en js utilizando trama
Tengo un marco de datos y quiero enviarlo a mi plantilla de Django.
Código del tonto views.py:
def graphs(request):
df_new = pd.read_excel("/home/cms/cms/stati
javascript
django
dataframe
datetime-format
python-datetime
3 años, 5 meses, 5 días
¿Cómo puedo ordenar mi dataframe con el valor más reciente en la parte inferior?
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
df=pd.read_csv("BTC-USD.csv")
df=df.drop(["Date","Adj Close","Volume","Low","Close"],axis=1)
pandas
dataframe
3 años, 5 meses, 5 días
Encontrar valores iguales en diferentes columnas en pandas
Me gustaría encontrar la intersección entre tres columnas, es decir, el valor igual en ambas. Sé que estos valores existen, porque gráficamente los valores se intersectan (dentro de un pequeño erro
python
pandas
dataframe
numpy
3 años, 5 meses, 4 días