Skipgram

Skipgram kelas akhir publik

Mem-parsing file teks dan membuat sekumpulan contoh.

Kelas Bersarang

kelas Skipgram.Opsi Atribut opsional untuk Skipgram

Konstanta

Rangkaian OP_NAME Nama operasi ini dikenal dengan mesin inti TensorFlow

Metode Publik

Skipgram statis
buat ( Lingkup cakupan , Nama file string, Ukuran batch panjang, Opsi... opsi)
Metode pabrik untuk membuat kelas yang membungkus operasi Skipgram baru.
Keluaran < TInt32 >
Zaman saat ini ()
Nomor zaman saat ini.
Keluaran < TInt32 >
contoh ()
Vektor id kata.
Keluaran < TInt32 >
label ()
Vektor id kata.
Skipgram.Opsi statis
minCount (Panjang minCount)
Skipgram.Opsi statis
subsampel (Subsampel mengambang)
Keluaran < TInt64 >
totalKata-kata yang Diproses ()
Jumlah total kata yang diproses sejauh ini.
Keluaran < TInt32 >
frekuensi kosakata ()
Frekuensi kata-kata.
Keluaran <TString>
kosakataKata ()
Vektor kata-kata dalam korpus.
Skipgram.Opsi statis
ukuran jendela (Ukuran jendela panjang)
Keluaran < TInt64 >
kata-kataPerEpoch ()
Jumlah kata per zaman dalam file data.

Metode Warisan

Konstanta

String akhir statis publik OP_NAME

Nama operasi ini dikenal dengan mesin inti TensorFlow

Nilai Konstan: "Skipgram"

Metode Publik

pembuatan Skipgram statis publik ( Lingkup cakupan, Nama file string, Ukuran batch panjang, Opsi... opsi)

Metode pabrik untuk membuat kelas yang membungkus operasi Skipgram baru.

Parameter
cakupan ruang lingkup saat ini
nama file Nama file teks korpus.
ukuran batch Ukuran batch yang diproduksi.
pilihan membawa nilai atribut opsional
Kembali
  • contoh baru Skipgram

Output publik < TInt32 > Epoch saat ini ()

Nomor zaman saat ini.

Output publik < TInt32 > contoh ()

Vektor id kata.

Output publik < TInt32 > label ()

Vektor id kata.

Skipgram statis publik. Opsi minCount (MinCount panjang)

Parameter
hitungan menit Jumlah minimum kemunculan kata untuk dimasukkan ke dalam kosakata.

Subsampel Skipgram.Options statis publik (Subsampel mengambang)

Parameter
subsampel Ambang batas kemunculan kata. Kata-kata yang muncul dengan frekuensi lebih tinggi akan diambil sampelnya secara acak. Setel ke 0 untuk menonaktifkan.

Keluaran publik < TInt64 > totalWordsProcessed ()

Jumlah total kata yang diproses sejauh ini.

Keluaran publik < TInt32 > vocabFreq ()

Frekuensi kata-kata. Diurutkan dalam urutan non-ascending.

Keluaran publik < TString > vocabWord ()

Vektor kata-kata dalam korpus.

Skipgram statis publik. Opsi ukuran jendela (Ukuran jendela panjang)

Parameter
ukuran jendela Jumlah kata yang akan diprediksi ke kiri dan kanan target.

Keluaran publik < TInt64 > kataPerEpoch ()

Jumlah kata per zaman dalam file data.