Halaman ini diterjemahkan oleh Cloud Translation API.
Switch to English

tf.estimator.LinearClassifier

TensorFlow 1 versi Lihat sumber di GitHub

Model classifier linier.

Mewarisi Dari: Estimator

Digunakan di notebook

Digunakan dalam panduan Digunakan dalam tutorial

Melatih model linier untuk contoh mengklasifikasikan menjadi salah satu dari beberapa kelas mungkin. Ketika jumlah kelas yang mungkin adalah 2, ini adalah klasifikasi biner.

Contoh:

 categorical_column_a = categorical_column_with_hash_bucket(...)
categorical_column_b = categorical_column_with_hash_bucket(...)

categorical_feature_a_x_categorical_feature_b = crossed_column(...)

# Estimator using the default optimizer.
estimator = tf.estimator.LinearClassifier(
    feature_columns=[categorical_column_a,
                     categorical_feature_a_x_categorical_feature_b])

# Or estimator using the FTRL optimizer with regularization.
estimator = tf.estimator.LinearClassifier(
    feature_columns=[categorical_column_a,
                     categorical_feature_a_x_categorical_feature_b],
    optimizer=tf.keras.optimizers.Ftrl(
      learning_rate=0.1,
      l1_regularization_strength=0.001
    ))

# Or estimator using an optimizer with a learning rate decay.
estimator = tf.estimator.LinearClassifier(
    feature_columns=[categorical_column_a,
                     categorical_feature_a_x_categorical_feature_b],
    optimizer=lambda: tf.keras.optimizers.Ftrl(
        learning_rate=tf.exponential_decay(
            learning_rate=0.1,
            global_step=tf.get_global_step(),
            decay_steps=10000,
            decay_rate=0.96))

# Or estimator with warm-starting from a previous checkpoint.
estimator = tf.estimator.LinearClassifier(
    feature_columns=[categorical_column_a,
                     categorical_feature_a_x_categorical_feature_b],
    warm_start_from="/path/to/checkpoint/dir")


# Input builders
def input_fn_train:
  # Returns tf.data.Dataset of (x, y) tuple where y represents label's class
  # index.
  pass
def input_fn_eval:
  # Returns tf.data.Dataset of (x, y) tuple where y represents label's class
  # index.
  pass
def input_fn_predict:
  # Returns tf.data.Dataset of (x, None) tuple.
  pass
estimator.train(input_fn=input_fn_train)
metrics = estimator.evaluate(input_fn=input_fn_eval)
predictions = estimator.predict(input_fn=input_fn_predict)
 

Masukan dari train dan evaluate seharusnya fitur berikut, jika tidak akan ada KeyError :

  • jika weight_column tidak None , fitur dengan key=weight_column yang nilainya adalah Tensor .
  • untuk setiap column di feature_columns :
    • jika column adalah SparseColumn , fitur dengan key=column.name yang value adalah SparseTensor .
    • jika column adalah WeightedSparseColumn , dua fitur: pertama dengan key id nama kolom, yang kedua dengan key berat nama kolom. Kedua fitur value harus menjadi SparseTensor .
    • jika column adalah RealValuedColumn , fitur dengan key=column.name yang value adalah Tensor .

Rugi dihitung dengan menggunakan Softmax lintas entropi.

feature_columns Sebuah iterable yang berisi semua kolom fitur yang digunakan oleh model. Semua item di set harus contoh kelas yang berasal dari FeatureColumn .
model_dir Direktori untuk menyimpan parameter model, grafik dan lain-lain ini juga dapat digunakan untuk pos-pos pemeriksaan beban dari direktori ke estimator untuk terus melatih model disimpan sebelumnya.
n_classes jumlah kelas label. Default adalah klasifikasi biner. Perhatikan bahwa label kelas adalah bilangan bulat yang mewakili indeks kelas (nilai yaitu dari 0 sampai n_classes-1). Untuk nilai-nilai label sewenang-wenang (misalnya label string), convert ke indeks kelas.
weight_column Sebuah string atau _NumericColumn diciptakan oleh tf.feature_column.numeric_column mendefinisikan kolom fitur yang mewakili bobot. Hal ini digunakan untuk berat badan atau meningkatkan turun contoh selama pelatihan. Ini akan dikalikan dengan hilangnya contoh. Jika string, itu digunakan sebagai kunci untuk mengambil tensor berat dari features . Jika itu adalah _NumericColumn , tensor baku diambil oleh kunci weight_column.key , maka weight_column.normalizer_fn diterapkan di atasnya untuk mendapatkan tensor berat badan.
label_vocabulary Sebuah daftar string merupakan nilai yang mungkin label. Jika diberi, label harus tipe string dan memiliki nilai di label_vocabulary . Jika tidak diberikan, yang berarti label sudah dikodekan sebagai integer atau pelampung dalam [0, 1] untuk n_classes=2 dan dikodekan sebagai nilai-nilai integer dalam {0, 1, ..., n_classes-1} untuk n_classes > 2. Juga akan ada kesalahan jika kosakata tidak disediakan dan label tali.
optimizer Sebuah contoh dari tf.keras.optimizers.* Atau tf.estimator.experimental.LinearSDCA digunakan untuk melatih model. Bisa juga berupa string (salah satu 'Adagrad', 'Adam', 'Ftrl', 'RMSProp', 'SGD'), atau callable. Default untuk FTRL optimizer.
config RunConfig objek untuk mengkonfigurasi pengaturan runtime.
warm_start_from Sebuah string filepath ke sebuah pos pemeriksaan untuk menghangatkan-mulai dari, atau WarmStartSettings keberatan untuk sepenuhnya mengkonfigurasi hangat-mulai. Jika filepath string yang disediakan bukannya WarmStartSettings , maka semua bobot dan bias hangat-mulai, dan diasumsikan bahwa kosakata dan nama Tensor tidak berubah.
loss_reduction Salah satu tf.losses.Reduction kecuali NONE . Menjelaskan cara mengurangi kerugian pelatihan selama batch. Default untuk SUM_OVER_BATCH_SIZE .
sparse_combiner Sebuah string menentukan bagaimana mengurangi jika kolom kategoris adalah multivalen. Salah satu "berarti", "sqrtn", dan "sum" - ini adalah cara efektif yang berbeda untuk melakukan normalisasi contoh-tingkat, yang dapat berguna untuk tas-dari-kata fitur. untuk lebih jelasnya, lihat tf.feature_column.linear_model .

ValueError jika n_classes <2.

Kompatibilitas bersemangat

Penduga dapat digunakan saat eksekusi bersemangat diaktifkan. Perhatikan bahwa input_fn dan semua kait dijalankan dalam konteks grafik, sehingga mereka harus ditulis agar kompatibel dengan modus grafik. Perhatikan bahwa input_fn kode menggunakan tf.data umumnya bekerja di kedua grafik dan mode bersemangat.

config

export_savedmodel

model_dir

model_fn Mengembalikan model_fn yang terikat self.params .
params

metode

eval_dir

Lihat sumber

Menunjukkan nama direktori dimana metrik evaluasi yang dibuang.

args
name Nama evaluasi jika kebutuhan pengguna untuk menjalankan beberapa evaluasi pada set data yang berbeda, seperti pada pelatihan Data vs data uji. Metrik untuk evaluasi yang berbeda disimpan dalam folder terpisah, dan muncul secara terpisah di tensorboard.

Pengembalian
Sebuah string yang merupakan jalur direktori berisi metrik evaluasi.

evaluate

Lihat sumber

Mengevaluasi model yang diberikan data evaluasi input_fn .

Untuk setiap langkah, panggilan input_fn , yang mengembalikan satu batch data. Mengevaluasi sampai:

  • steps batch diproses, atau
  • input_fn menimbulkan end-of-masukan pengecualian ( tf.errors.OutOfRangeError atau StopIteration ).

args
input_fn Sebuah fungsi yang membangun input data untuk evaluasi. Lihat Premade estimator untuk informasi lebih lanjut. Fungsi harus membangun dan kembali salah satu berikut:

  • Sebuah tf.data.Dataset objek: Output dari Dataset objek harus menjadi tuple (features, labels) dengan kendala yang sama seperti di bawah ini.
  • Sebuah tuple (features, labels) : Dimana features adalah tf.Tensor atau kamus nama fitur string untuk Tensor dan labels adalah Tensor atau kamus nama label string untuk Tensor . Kedua features dan labels dikonsumsi oleh model_fn . Mereka harus memenuhi harapan model_fn dari input.
steps Sejumlah langkah yang untuk mengevaluasi model yang. Jika None , mengevaluasi sampai input_fn menimbulkan end-of-masukan pengecualian.
hooks Daftar tf.train.SessionRunHook kasus subclass. Digunakan untuk callback dalam panggilan evaluasi.
checkpoint_path Jalan dari pos pemeriksaan tertentu untuk mengevaluasi. Jika None , pos pemeriksaan terbaru dalam model_dir digunakan. Jika tidak ada pos-pos pemeriksaan di model_dir , evaluasi dijalankan dengan baru diinisialisasi Variables bukan yang dipulihkan dari pos pemeriksaan.
name Nama evaluasi jika kebutuhan pengguna untuk menjalankan beberapa evaluasi pada set data yang berbeda, seperti pada pelatihan Data vs data uji. Metrik untuk evaluasi yang berbeda disimpan dalam folder terpisah, dan muncul secara terpisah di tensorboard.

Pengembalian
Sebuah dict yang berisi metrik evaluasi yang ditetapkan dalam model_fn mengetik dengan nama, serta entri global_step yang berisi nilai langkah global untuk yang evaluasi ini dilakukan. Untuk estimator kaleng, dict yang berisi loss (rata-rata kerugian per mini-batch) dan average_loss (rata-rata kerugian per sampel). Pengklasifikasi kaleng juga mengembalikan accuracy . Regressors kaleng juga mengembalikan label/mean dan prediction/mean .

kenaikan gaji
ValueError Jika steps <= 0 .

experimental_export_all_saved_models

Lihat sumber

Ekspor sebuah SavedModel dengan tf.MetaGraphDefs untuk setiap mode yang diminta.

Untuk setiap mode berlalu dalam melalui input_receiver_fn_map , metode ini membangun grafik baru dengan memanggil input_receiver_fn untuk mendapatkan fitur dan label Tensor s. Berikutnya, metode ini menyebut Estimator 's model_fn dalam modus lulus untuk menghasilkan grafik model yang didasarkan pada fitur-fitur dan label, dan mengembalikan pos pemeriksaan yang diberikan (atau, kurang itu, pos pemeriksaan terbaru) ke grafik. Hanya salah satu mode digunakan untuk menyimpan variabel ke SavedModel (urutan prefere