Preguntas con Tag: data-science

Cuestiones de implementación sobre ciencia de datos. La ciencia de datos se refiere a extraer conocimiento o información de datos, en cualquier forma o forma. Puede contener analítica predictiva y normalmente toma mucho...

¿Cómo deshacerse de algunas de las células del Dataframe con cadenas y valores "inf"?

Soy nuevo en pandas y en la ciencia de datos en general. Tengo los datos que tengo que obtener la media de, pero los datos son muy grandes (alrededor de 15000 filas), y algunas de las células del m
python pandas dataframe data-science data-extraction
scriptwarrior
3 años, 4 meses, 28 días

No se puede conseguir ggraph para mostrar etiquetas para un dendrogram

Uso ggraph para visualizar los resultados de un análisis de racimo. Pero no puedo conseguir ggraph para mostrar etiquetas. Traté de agregarlos como nombres de fila a los datos, y traté de agregarlo
r label data-science dendrogram ggraph
htmlhelix
3 años, 4 meses, 28 días

¿Cuál es la complejidad temporal del algoritmo proporcionado?

Considere el siguiente código c++ de una función: A(int n) { ​ i = 1; S = 1; while (S<=n) ​ { ​ i++; ​ S = S + i; ​ printf("Edward"); ​ } ​ } Supongamos que la fu
algorithm math time-complexity data-science big-o
cybermage
3 años, 4 meses, 28 días

Importar funciones personalizadas en Jupyter Notebook

Estoy tratando de reutilizar algunas funciones personalizadas comunes para proyectos de ciencia de datos. Estoy guardando las funciones como un archivo .py y llamándolos en un cuaderno de error. Es
jupyter-notebook data-science
techtactician
3 años, 4 meses, 27 días

Quitar milisegundos del formato del tiempo en Python

Por favor, consulte la imagen siguiente al final de este post. Por alguna razón, la columna en rojo (AVERAGE_TIME) tiene un formato de tiempo que muestra los micro / milisegu
python dataframe jupyter-notebook data-science
scriptsorcererf493
3 años, 5 meses, 0 días

Spark Scala - Winsorize DataFrame columns within groups

Estoy preprocesando datos para entradas de aprendizaje automático, una columna de valor objetivo, llámalo "precio" tiene muchos outliers, y en lugar de winsorizing precio sobre todo el conjunto Qui
scala apache-spark statistics data-science
quantumcoder403a
3 años, 4 meses, 29 días