FixedUnigramCandidateSampler.Options

общедоступный статический класс FixUnigramCandidateSampler.Options

Дополнительные атрибуты для FixedUnigramCandidateSampler

Публичные методы

ИсправленоUnigramCandidateSampler.Options
искажение (плавающее искажение)
ИсправленоUnigramCandidateSampler.Options
numReservedIds (длинное значение numReservedIds)
ИсправленоUnigramCandidateSampler.Options
numShards (длинное число осколков)
ИсправленоUnigramCandidateSampler.Options
семя (длинное семя)
ИсправленоUnigramCandidateSampler.Options
семя2 (длинное семя2)
ИсправленоUnigramCandidateSampler.Options
осколок (длинный осколок)
ИсправленоUnigramCandidateSampler.Options
униграммы (List<Float> униграммы)
ИсправленоUnigramCandidateSampler.Options
vocabFile (Строка vocabFile)

Унаследованные методы

Публичные методы

public FixUnigramCandidateSampler.Options искажение (Искажение с плавающей запятой)

Параметры
искажение Искажение используется для искажения распределения вероятностей униграмм. Каждый вес сначала увеличивается до степени искажения, а затем добавляется к внутреннему распределению униграмм. В результате искажение = 1,0 дает регулярную выборку униграмм (как определено в файле словаря), а искажение = 0,0 дает равномерное распределение.

publicFixedUnigramCandidateSampler.Options numReservedIds (Long numReservedIds)

Параметры
numReservedIds При желании пользователи могут добавить некоторые зарезервированные идентификаторы в диапазоне [0, ..., num_reserved_ids). Один из вариантов использования заключается в том, что в качестве идентификатора 0 используется специальный токен неизвестного слова. Вероятность выборки этих идентификаторов будет равна 0.

publicFixedUnigramCandidateSampler.Options numShards (Long numShards)

Параметры
число осколков Сэмплер можно использовать для выборки из подмножества исходного диапазона, чтобы ускорить все вычисления за счет параллелизма. Этот параметр (вместе с «shard») указывает количество разделов, которые используются в общих вычислениях.

общедоступное семя FixUnigramCandidateSampler.Options (длинное семя)

Параметры
семя Если для начального числа или начального числа2 задано ненулевое значение, генератор случайных чисел заполняется данным начальным числом. В противном случае он засеивается случайным семенем.

общедоступный фиксированныйUnigramCandidateSampler.Options семя2 (длинное семя2)

Параметры
семя2 Второе семя, чтобы избежать столкновения семян.

Осколок publicFixedUnigramCandidateSampler.Options (длинный осколок)

Параметры
осколок Сэмплер можно использовать для выборки из подмножества исходного диапазона, чтобы ускорить все вычисления за счет параллелизма. Этот параметр (вместе с «num_shards») указывает конкретный номер раздела операции сэмплера, когда используется секционирование.

общедоступные униграммы FixUnigramCandidateSampler.Options (униграммы List<Float>)

Параметры
униграммы Список чисел или вероятностей униграмм, по одному на каждый идентификатор в последовательном порядке. В эту операцию следует передать ровно один из vocab_file и униграмм.

общедоступный фиксированныйUnigramCandidateSampler.Options vocabFile (String vocabFile)

Параметры
vocabFile Каждая допустимая строка в этом файле (который должен иметь формат, подобный CSV) соответствует допустимому идентификатору слова. Идентификаторы располагаются последовательно, начиная с num_reserved_ids. Ожидается, что последняя запись в каждой строке будет значением, соответствующим количеству или относительной вероятности. В эту операцию необходимо передать ровно один из vocab_file и униграмм.