Preguntas con Tag: hadoop
Hadoop es un proyecto de código abierto Apache que proporciona software para computación distribuida fiable y escalable. El núcleo consiste en un sistema de archivos distribuido (HDFS) y un gestor de recursos (YARN). ...
¿Es posible ejecutar consultas de Hive en HDFS sin usar YARN?
He utilizado Hive y Hadoop en configuración de modos distribuida pseudo con YARN y mis consultas corrieron correctamente y dieron los resultados esperados.Ahora para mi pr
hadoop
hive
hdfs
hiveql
hadoop-yarn
3 años, 4 meses, 28 días
Pyspark - operación de filtro equivalente de dataframe da diferente salida
Estoy enfrentando un problema particularmente extraño mientras disparando consultas de filtros en un marco de datos de chispa. Aquí hay una captura del comando de filtro que estoy tratando de ejecu
dataframe
hadoop
pyspark
3 años, 4 meses, 27 días
Exportar datos de Hadoop utilizando el conector sql-spark (Apache)
Estoy tratando de exportar datos de Hadoop a MS SQL usando Apache Spark SQL Connector como se indica aquí sql-s
sql-server
apache-spark
hadoop
3 años, 4 meses, 28 días
Inserción de inserción sobreescribir registros divididos en tamaños de archivo iguales
Estoy usando una tabla externa de colmenas para verter datos como json. Mis archivos de dump se ven bien. Sin embargo después de mi vertedero, los archivos escritos por colmena son de tamaños varia
hadoop
hive
hiveql
3 años, 4 meses, 28 días
Spark dataset escribe en 2 directorios diferentes
Tengo un conjunto de datos en chispa partida por una columna ip. Ahora quiero dividir este conjunto de datos en 2 y escribir en HDFS de tal manera que si las particiones totales son <c
apache-spark
hadoop
apache-spark-sql
3 años, 4 meses, 29 días
Failure after tez shuffle handler setup : La inicialización del operador de mapas falló
Después de la configuración para el manipulador Tez Shuffle siguiendo instrucciones en: https://tez.apache.org/shuffl
hadoop
hive
apache-tez
3 años, 4 meses, 27 días
Cómo insertar la fecha actual en la colmena usando el comando insertar
insert into kb values(select current_date(),select current_timestamp());
select * from kb;
Da un error.
date
hadoop
hive
hiveql
3 años, 4 meses, 28 días