FixedUnigramCandidateSampler.Options

FixedUnigramCandidateSampler.Options estáticos de clase pública

Los atributos opcionales para FixedUnigramCandidateSampler

Métodos públicos

FixedUnigramCandidateSampler.Options
distorsión (distorsión Float)
FixedUnigramCandidateSampler.Options
numReservedIds (numReservedIds de largo)
FixedUnigramCandidateSampler.Options
numShards (numShards de largo)
FixedUnigramCandidateSampler.Options
semilla (semilla de larga duración)
FixedUnigramCandidateSampler.Options
seed2 (Long seed2)
FixedUnigramCandidateSampler.Options
fragmento (fragmento largo)
FixedUnigramCandidateSampler.Options
unigrams (List <Float> unigrams)
FixedUnigramCandidateSampler.Options
vocabFile (String vocabFile)

Métodos heredados

Métodos públicos

pública FixedUnigramCandidateSampler.Options distorsión (distorsión del flotador)

Parámetros
distorsión La distorsión se utiliza para sesgar la distribución de probabilidad unigrama. Cada peso se eleva primero a la potencia de la distorsión antes de agregarlo a la distribución interna de unigramo. Como resultado, la distorsión = 1.0 proporciona un muestreo de unigramo regular (según lo definido por el archivo de vocabulario) y la distorsión = 0.0 proporciona una distribución uniforme.

públicas FixedUnigramCandidateSampler.Options numReservedIds (numReservedIds de largo)

Parámetros
numReservedIds Opcionalmente, los usuarios pueden agregar algunos ID reservados en el rango [0, ..., num_reserved_ids). Un caso de uso es que se utiliza un token de palabra desconocida especial como ID 0. Estos ID tendrán una probabilidad de muestreo de 0.

públicas FixedUnigramCandidateSampler.Options numShards (numShards de largo)

Parámetros
numShards Se puede utilizar un muestreador para muestrear de un subconjunto del rango original con el fin de acelerar todo el cálculo a través del paralelismo. Este parámetro (junto con 'fragmento') indica el número de particiones que se utilizan en el cálculo general.

pública FixedUnigramCandidateSampler.Options semilla (semilla de larga duración)

Parámetros
semilla Si la semilla o semilla2 se establecen en un valor distinto de cero, el generador de números aleatorios es sembrado por la semilla dada. De lo contrario, es sembrado por una semilla aleatoria.

públicas FixedUnigramCandidateSampler.Options seed2 (Long seed2)

Parámetros
semilla2 Una segunda semilla para evitar la colisión de semillas.

pública FixedUnigramCandidateSampler.Options fragmento (fragmento largo)

Parámetros
casco Se puede utilizar un muestreador para muestrear de un subconjunto del rango original con el fin de acelerar todo el cálculo a través del paralelismo. Este parámetro (junto con 'num_shards') indica el número de partición particular de una operación de muestreo, cuando se utiliza la partición.

públicas FixedUnigramCandidateSampler.Options unigrams (List <Float> unigrams)

Parámetros
unigramos Una lista de recuentos o probabilidades de unigramo, uno por ID en orden secuencial. Se debe pasar exactamente uno de vocab_file y unigrams a esta operación.

pública FixedUnigramCandidateSampler.Options vocabFile (String vocabFile)

Parámetros
vocabFile Cada línea válida en este archivo (que debe tener un formato similar a CSV) corresponde a una ID de palabra válida. Los ID están en orden secuencial, comenzando por num_reserved_ids. Se espera que la última entrada en cada línea sea un valor correspondiente al recuento o probabilidad relativa. Exactamente uno de vocab_file y unigrams debe pasarse a esta operación.