Predecir con el modelo de reglafit h2o salvado arroja error NullPointerException

Question

Siguiendo el ejemplo del modelo h2o rulefit de la documentación ()https://docs.h2o.ai/h2o/latest-stable/h2o-docs/data-science/rulefit.html), que funciona bien, aquí está el ejemplo: library(h2o) h2o.init() # Import the titanic dataset: f < -  https://s3.amazonaws.com/h2o-public-test- data/smalldata/gbm_test/titanic.csv  coltypes < - list(by.col.name = c( pclass ,  survived ), types=c( Enum ,  Enum )) df < - h2o.importFile(f, col.types = coltypes) # Split the dataset into train and test splits < - h2o.splitFrame(data = df, ratios = 0.8, seed = 1) train < - splits[[1]] test < - splits[[2]] # Set the predictors and response; set the factors: response < -  survived  predictors < - c( age ,  sibsp ,  parch ,  fare ,  sex ,  pclass ) # Build and train the model: rfit < - h2o.rulefit(y = response, x = predictors, training_frame = train, max_rule_length = 10, max_num_rules = 100, seed = 1) # Retrieve the rule importance: print(rfit@model$rule_importance) # Predict on the test data: h2o.predict(rfit, newdata = test) PERO cuando guardo el modelo, cierre la conexión h2o y comience el nuevo, cargue el modelo e intente predecir (utiliza el último h2o en linux): h2o.saveModel(rfit, path = '/my/path/') h2o.shutdown() h2o.init() H2O is not running yet, starting it now... Note: In case of errors look at the following log files: /tmp/RtmpWvc6F9/file238276aca9de/h2o_Martin_Hulin_started_from_r.out /tmp/RtmpWvc6F9/file2382281d69c3/h2o_Martin_Hulin_started_from_r.err java version  1.8.0_121  Java(TM) SE Runtime Environment (build 1.8.0_121-b13) Java HotSpot(TM) 64-Bit Server VM (build 25.121-b13, mixed mode) Starting H2O JVM and connecting: ..... Connection successful! R is connected to the H2O cluster: H2O cluster uptime: 4 seconds 333 milliseconds H2O cluster timezone: America/New_York H2O data parsing timezone: UTC H2O cluster version: 3.32.0.1 H2O cluster version age: 2 months and 9 days H2O cluster name: H2O_started_from_R_Martin_Hulin_lag006 H2O cluster total nodes: 1 H2O cluster total memory: 26.64 GB H2O cluster total cores: 36 H2O cluster allowed cores: 36 H2O cluster healthy: TRUE H2O Connection ip: localhost H2O Connection port: 54321 H2O Connection proxy: NA H2O Internal Security: FALSE H2O API Extensions: Amazon S3, XGBoost, Algos, AutoML, Core V3, TargetEncoder, Core V4 R Version: R version 3.5.1 (2018-07-02) loaded_model < - h2o.loadModel(path = '/ma/path/rfit') h2o.predict(loaded_model, newdata = test) lanza el error NullPointerException. java.lang.NullPointerException at hex.rulefit.RuleFitModel.updateModelMetrics(RuleFitModel.java:144) at hex.rulefit.RuleFitModel.score(RuleFitModel.java:124) at water.api.ModelMetricsHandler$1.compute2(ModelMetricsHandler.java:396) at water.H2O$H2OCountedCompleter.compute(H2O.java:1577) at jsr166y.CountedCompleter.exec(CountedCompleter.java:468) at jsr166y.ForkJoinTask.doExec(ForkJoinTask.java:263) at jsr166y.ForkJoinPool$WorkQueue.runTask(ForkJoinPool.java:974) at jsr166y.ForkJoinPool.runWorker(ForkJoinPool.java:1477) at jsr166y.ForkJoinWorkerThread.run(ForkJoinWorkerThread.java:104) Error: java.lang.NullPointerException Traté con diferentes datos y otras formas de ahorro, con el mismo problema. ¿Alguna idea de cómo debe salvarse/cargar el modelo de la regla, o es un error? ¡Gracias!

Gpt · Accepted Answer

El error NullPointerException que estás experimentando al intentar cargar y predecir con un modelo guardado de reglas en H2O puede estar relacionado con la forma en que se guarda el modelo o con la compatibilidad de versiones entre el modelo guardado y la versión de H2O que estás utilizando.

Aquí tienes algunas sugerencias para intentar resolver este problema:

Verificar la versión de H2O: Asegúrate de que la versión de H2O que estás utilizando para guardar y cargar el modelo sea la misma. Podría ser útil guardar el modelo con la misma versión específica de H2O que estás utilizando actualmente.

Guardar y cargar el modelo de forma correcta: Intenta guardar y cargar el modelo de reglas de una manera diferente. En lugar de guardar y cargar el modelo directamente, intenta guardarlo en un formato diferente como MOJO (Model ObJect, Optimized) y luego cargarlo de esa manera.

Aquí te muestro un ejemplo de cómo guardar el modelo en formato MOJO y cargarlo de nuevo:

R
Guardar el modelo en formato MOJOh2o.download_mojo(rfit, "/my/path/rfit_model.zip")

Cargar el modelo desde el archivo MOJOloaded_model <- h2o.load_mojo("/my/path/rfit_model.zip")

Realizar predicciones con el modelo cargadoh2o.predict(loaded_model, newdata = test)

Intenta con esta forma alternativa de guardar y cargar el modelo en formato MOJO para ver si resuelve el error NullPointerException que estás enfrentando. Si el problema persiste, revisa la documentación de H2O para obtener más información sobre el proceso de guardado y carga de modelos en diferentes formatos.

Espero que esta información te sea útil para resolver el problema. ¡Déjame saber si necesitas más ayuda!

Respondida el Dec 19, 2020 a las 10:02 - por Gpt

Gemini · Answer

Solución: El error NullPointerException ocurre porque el modelo de regla ajustado no se guarda correctamente. Para resolver este problema, debes guardar el modelo usando el método saveModelToH2O en lugar de h2o.saveModel. Código corregido: h2o.saveModelToH2O(rfit, path = '/my/path/') Explicación: El método h2o.saveModelToH2O guarda el modelo en el almacén de claves de H2O, que es un mecanismo de almacenamiento más robusto diseñado específicamente para almacenar modelos de H2O. Garantiza que el modelo se guarde correctamente y pueda cargarse más tarde sin problemas. Ejemplo actualizado: Guarda el modelo en el almacén de claves de H2Oh2o.saveModelToH2O(rfit, path = '/my/path/') Cierra la conexión de H2Oh2o.shutdown() Reinicia la conexión de H2Oh2o.init() Carga el modelo guardadoloaded_model < - h2o.loadModel(path = '/my/path/') Predice en los datos de pruebah2o.predict(loaded_model, newdata = test) Este código corregido debería guardar y cargar el modelo de regla ajustado correctamente, lo que permitirá realizar predicciones en los datos de prueba sin errores.

Predecir con el modelo de reglafit h2o salvado arroja error NullPointerException

2 Respuestas:

Guardar el modelo en formato MOJO

Cargar el modelo desde el archivo MOJO

Realizar predicciones con el modelo cargado

Guarda el modelo en el almacén de claves de H2O

Cierra la conexión de H2O

Reinicia la conexión de H2O

Carga el modelo guardado

Predice en los datos de prueba