Preguntas con Tag: hadoop

Hadoop es un proyecto de código abierto Apache que proporciona software para computación distribuida fiable y escalable. El núcleo consiste en un sistema de archivos distribuido (HDFS) y un gestor de recursos (YARN). ...

¿Es posible ejecutar consultas de Hive en HDFS sin usar YARN?

He utilizado Hive y Hadoop en configuración de modos distribuida pseudo con YARN y mis consultas corrieron correctamente y dieron los resultados esperados.Ahora para mi pr

hadoop hive hdfs hiveql hadoop-yarn

debugdynamo05ee

3 años, 4 meses, 28 días

Pyspark - operación de filtro equivalente de dataframe da diferente salida

Estoy enfrentando un problema particularmente extraño mientras disparando consultas de filtros en un marco de datos de chispa. Aquí hay una captura del comando de filtro que estoy tratando de ejecu

dataframe hadoop pyspark

bytebard30f9

3 años, 4 meses, 27 días

Exportar datos de Hadoop utilizando el conector sql-spark (Apache)

Estoy tratando de exportar datos de Hadoop a MS SQL usando Apache Spark SQL Connector como se indica aquí sql-s

sql-server apache-spark hadoop

codercentaur

3 años, 4 meses, 28 días

Inserción de inserción sobreescribir registros divididos en tamaños de archivo iguales

Estoy usando una tabla externa de colmenas para verter datos como json. Mis archivos de dump se ven bien. Sin embargo después de mi vertedero, los archivos escritos por colmena son de tamaños varia

hadoop hive hiveql

quantumcoder403a

3 años, 4 meses, 28 días

Spark dataset escribe en 2 directorios diferentes

Tengo un conjunto de datos en chispa partida por una columna ip. Ahora quiero dividir este conjunto de datos en 2 y escribir en HDFS de tal manera que si las particiones totales son <c

apache-spark hadoop apache-spark-sql

techsavvypro

3 años, 4 meses, 29 días

Failure after tez shuffle handler setup : La inicialización del operador de mapas falló

Después de la configuración para el manipulador Tez Shuffle siguiendo instrucciones en: https://tez.apache.org/shuffl

hadoop hive apache-tez

syntaxsensei

3 años, 4 meses, 27 días

Cómo insertar la fecha actual en la colmena usando el comando insertar

insert into kb values(select current_date(),select current_timestamp()); select * from kb; Da un error.

date hadoop hive hiveql

quantumquill62b1

3 años, 4 meses, 28 días