Halaman ini diterjemahkan oleh Cloud Translation API.
Switch to English

tf.estimator.BoostedTreesClassifier

TensorFlow 1 versi Lihat sumber di GitHub

Sebuah Classifier untuk Tensorflow Didorong model Pohon.

Digunakan di notebook

Digunakan dalam tutorial

feature_columns Sebuah iterable yang berisi semua kolom fitur yang digunakan oleh model. Semua item di set harus contoh kelas yang berasal dari FeatureColumn .
n_batches_per_layer jumlah batch untuk mengumpulkan statistik per lapisan. Jumlah total batch adalah jumlah data dibagi dengan ukuran batch.
model_dir Direktori untuk menyimpan parameter model, grafik dan lain-lain ini juga dapat digunakan untuk pos-pos pemeriksaan beban dari direktori ke estimator untuk terus melatih model disimpan sebelumnya.
n_classes jumlah kelas label. Default adalah klasifikasi biner.
weight_column Sebuah string atau NumericColumn diciptakan oleh tf.fc_old.numeric_column mendefinisikan kolom fitur yang mewakili bobot. Hal ini digunakan untuk downweight atau dorongan contoh selama pelatihan. Ini akan dikalikan dengan hilangnya contoh. Jika string, itu digunakan sebagai kunci untuk mengambil tensor berat dari features . Jika itu adalah NumericColumn , tensor baku diambil oleh kunci weight_column.key , maka weight_column.normalizer_fn diterapkan di atasnya untuk mendapatkan tensor berat badan.
label_vocabulary Sebuah daftar string merupakan nilai yang mungkin label. Jika diberi, label harus tipe string dan memiliki nilai di label_vocabulary . Jika tidak diberikan, yang berarti label sudah dikodekan sebagai integer atau pelampung dalam [0, 1] untuk n_classes=2 dan dikodekan sebagai nilai-nilai integer dalam {0, 1, ..., n_classes-1} untuk n_classes>2 . Juga, akan ada kesalahan jika kosakata tidak disediakan dan label tali.
n_trees pohon nomor yang akan dibuat.
max_depth kedalaman maksimum pohon untuk tumbuh.
learning_rate penyusutan parameter yang akan digunakan ketika pohon ditambahkan ke model.
l1_regularization regularisasi multiplier diterapkan pada bobot mutlak dari daun pohon.
l2_regularization regularisasi multiplier diterapkan pada bobot kuadrat dari daun pohon.
tree_complexity Faktor regularisasi untuk menghukum pohon dengan daun yang lebih.
min_node_weight min_node_weight: goni minimum simpul harus memiliki untuk split untuk dipertimbangkan. Nilai akan dibandingkan dengan sum(leaf_hessian)/(batch_size * n_batches_per_layer) .
config RunConfig objek untuk mengkonfigurasi pengaturan runtime.
center_bias Apakah Bias centering kebutuhan terjadi. Bias centering mengacu pada node pertama di pohon pertama kembali prediksi yang diselaraskan dengan distribusi label asli. Sebagai contoh, untuk masalah regresi, node pertama akan kembali mean dari label. Untuk masalah klasifikasi biner, itu akan kembali logit untuk probabilitas sebelumnya dari label 1.
pruning_mode salah satu none , pre , post untuk menunjukkan tidak ada pemangkasan, pemangkasan pra (tidak terpecah node jika tidak cukup mendapatkan diamati) dan pasca pemangkasan (membangun pohon sampai dengan kedalaman max dan cabang kemudian Pangkas dengan gain negatif). Untuk pra dan pasca pemangkasan, Anda harus memberikan tree_complexity >0 .
quantile_sketch_epsilon mengambang antara 0 dan 1. Kesalahan terikat untuk perhitungan kuantil. Ini hanya digunakan untuk kolom fitur float, dan jumlah ember yang dihasilkan per fitur mengapung adalah 1/quantile_sketch_epsilon .
train_in_memory bool , ketika benar, itu mengasumsikan dataset dalam memori, yaitu, input_fn harus mengembalikan seluruh dataset sebagai batch tunggal, n_batches_per_layer harus ditetapkan sebagai 1, num_worker_replicas harus 1, dan num_ps_replicas harus 0 di tf.Estimator.RunConfig .

ValueError ketika argumen yang salah diberikan atau fungsi yang tidak didukung diminta.

Kompatibilitas bersemangat

Penduga dapat digunakan saat eksekusi bersemangat diaktifkan. Perhatikan bahwa input_fn dan semua kait dijalankan dalam konteks grafik, sehingga mereka harus ditulis agar kompatibel dengan modus grafik. Perhatikan bahwa input_fn kode menggunakan tf.data umumnya bekerja di kedua grafik dan mode bersemangat.

config

model_dir

model_fn Mengembalikan model_fn yang terikat self.params .
params

metode

eval_dir

Lihat sumber

Menunjukkan nama direktori dimana metrik evaluasi yang dibuang.

args
name Nama evaluasi jika kebutuhan pengguna untuk menjalankan beberapa evaluasi pada set data yang berbeda, seperti pada pelatihan Data vs data uji. Metrik untuk evaluasi yang berbeda disimpan dalam folder terpisah, dan muncul secara terpisah di tensorboard.

Pengembalian
Sebuah string yang merupakan jalur direktori berisi metrik evaluasi.

evaluate

Lihat sumber

Mengevaluasi model yang diberikan data evaluasi input_fn .

Untuk setiap langkah, panggilan input_fn , yang mengembalikan satu batch data. Mengevaluasi sampai:

  • steps batch diproses, atau
  • input_fn menimbulkan end-of-masukan pengecualian ( tf.errors.OutOfRangeError atau StopIteration ).

args
input_fn Sebuah fungsi yang membangun input data untuk evaluasi. Lihat Premade estimator untuk informasi lebih lanjut. Fungsi harus membangun dan kembali salah satu berikut:

  • Sebuah tf.data.Dataset objek: Output dari Dataset objek harus menjadi tuple (features, labels) dengan kendala yang sama seperti di bawah ini.
  • Sebuah tuple (features, labels) : Dimana features adalah tf.Tensor atau kamus nama fitur string untuk Tensor dan labels adalah Tensor atau kamus nama label string untuk Tensor . Kedua features dan labels dikonsumsi oleh model_fn . Mereka harus memenuhi harapan model_fn dari input.
steps Sejumlah langkah yang untuk mengevaluasi model yang. Jika None , mengevaluasi sampai input_fn menimbulkan end-of-masukan pengecualian.
hooks Daftar tf.train.SessionRunHook kasus subclass. Digunakan untuk callback dalam panggilan evaluasi.
checkpoint_path Jalan dari pos pemeriksaan tertentu untuk mengevaluasi. Jika None , pos pemeriksaan terbaru dalam model_dir digunakan. Jika tidak ada pos-pos pemeriksaan di model_dir , evaluasi dijalankan dengan baru diinisialisasi Variables bukan yang dipulihkan dari pos pemeriksaan.
name Nama evaluasi jika kebutuhan pengguna untuk menjalankan beberapa evaluasi pada set data yang berbeda, seperti pada pelatihan Data vs data uji. Metrik untuk evaluasi yang berbeda disimpan dalam folder terpisah, dan muncul secara terpisah di tensorboard.

Pengembalian
Sebuah dict yang berisi metrik evaluasi yang ditetapkan dalam model_fn mengetik dengan nama, serta entri global_step yang berisi nilai langkah global untuk yang evaluasi ini dilakukan. Untuk estimator kaleng, dict yang berisi loss (rata-rata kerugian per mini-batch) dan average_loss (rata-rata kerugian per sampel). Pengklasifika