TensorFlow 决策森林

import tensorflow_decision_forests as tfdf
import pandas as pd

# Load a dataset in a Pandas dataframe.
train_df = pd.read_csv("project/train.csv")
test_df = pd.read_csv("project/test.csv")

# Convert the dataset into a TensorFlow dataset.
train_ds = tfdf.keras.pd_dataframe_to_tf_dataset(train_df, label="my_label")
test_ds = tfdf.keras.pd_dataframe_to_tf_dataset(test_df, label="my_label")

# Train a Random Forest model.
model = tfdf.keras.RandomForestModel()
model.fit(train_ds)

# Summary of the model structure.
model.summary()

# Evaluate the model.
model.evaluate(test_ds)

# Export the model to a SavedModel.
model.save("project/model")

TensorFlow 决策森林 (TF-DF) 是一套先进的算法,可用于训练、应用和解释决策森林模型。该库包含一套 Keras 模型,并且支持分类、回归和排名。

TF-DF 是 Yggdrasil 决策森林 C++ 库的封装容器。使用 TF-DF 训练的模型兼容 Yggdrasil 决策森林模型,反之亦然。

遗憾的是,TF-DF 尚不支持 Mac (#16)Windows (#3),我们正在努力开发。

关键词:决策森林, TensorFlow, 随机森林, 梯度提升树, CART, 模型解释。

社区

您可以使用以下资源:

贡献

欢迎大家为 TensorFlow 决策森林和 Yggdrasil 决策森林贡献代码。如果您要贡献代码,请务必查看开发者手册