TensorFlow Decision Forests

import tensorflow_decision_forests as tfdf
import pandas as pd

# Load a dataset in a Pandas dataframe.
train_df = pd.read_csv("project/train.csv")
test_df = pd.read_csv("project/test.csv")

# Convert the dataset into a TensorFlow dataset.
train_ds = tfdf.keras.pd_dataframe_to_tf_dataset(train_df, label="my_label")
test_ds = tfdf.keras.pd_dataframe_to_tf_dataset(test_df, label="my_label")

# Train a Random Forest model.
model = tfdf.keras.RandomForestModel()
model.fit(train_ds)

# Summary of the model structure.
model.summary()

# Evaluate the model.
model.evaluate(test_ds)

# Export the model to a SavedModel.
model.save("project/model")

A TensorFlow Decision Forests (TF-DF) é um conjunto de algoritmos de última geração para treinar, exibir e interpretar modelos de floresta de decisão. A biblioteca é uma coleção de modelos da Keras, e é compatível com classificação, regressão e ranking.

A TF-DF é um wrapper para as bibliotecas C++ Yggdrasil Decision Forests. Os modelos treinados com a TF-DF são compatíveis com os modelos da Yggdrasil Decision Forests, e vice versa.

A TF-DF ainda não está disponível para Mac (#16) nem Windows (#3). Estamos trabalhando nisso.

Palavras-chave: florestas de decisão, TensorFlow, floresta aleatória, árvores aprimoradas por gradiente, CART, interpretação de modelo.

Comunidade

Os recursos a seguir estão disponíveis:

Contribuições

Aceitamos contribuições para as bibliotecas Yggdrasil Decision Forests e TensorFlow Decision Forests. Se quiser contribuir, consulte o manual do desenvolvedor.