FixedUnigramCandidateSampler.Options

lớp tĩnh công khai FixUnigramCandidateSampler.Options

Thuộc tính tùy chọn cho FixedUnigramCandidateSampler

Phương pháp công khai

Đã sửa lỗiUnigramCandidateSampler.Options
biến dạng (biến dạng nổi)
Đã sửa lỗiUnigramCandidateSampler.Options
numReservedIds (numReservedIds dài)
Đã sửa lỗiUnigramCandidateSampler.Options
numShards (numShards dài)
Đã sửa lỗiUnigramCandidateSampler.Options
hạt giống (Hạt dài)
Đã sửa lỗiUnigramCandidateSampler.Options
hạt giống2 (Hạt dài2)
Đã sửa lỗiUnigramCandidateSampler.Options
mảnh vỡ (Mảnh dài)
Đã sửa lỗiUnigramCandidateSampler.Options
unigram (Danh sách<Float> unigram)
Đã sửa lỗiUnigramCandidateSampler.Options
vocabFile (Chuỗi vocabFile)

Phương pháp kế thừa

Phương pháp công khai

biến dạng công khai FixUnigramCandidateSampler.Options (Biến dạng nổi)

Thông số
méo mó Sự biến dạng được sử dụng để làm lệch phân bố xác suất unigram. Mỗi trọng số trước tiên được nâng lên tới mức độ biến dạng trước khi thêm vào phân phối unigram bên trong. Kết quả là, độ méo = 1,0 cho phép lấy mẫu unigram thông thường (như được xác định bởi tệp từ vựng) và độ méo = 0,0 mang lại sự phân bố đồng đều.

công khai FixUnigramCandidateSampler.Options numReservedIds (numReservedIds dài)

Thông số
numReservedId Người dùng có thể tùy chọn thêm một số ID dành riêng trong phạm vi [0, ..., num_reserved_ids). Một trường hợp sử dụng là mã thông báo từ đặc biệt không xác định được sử dụng làm ID 0. Các ID này sẽ có xác suất lấy mẫu là 0.

công khai FixUnigramCandidateSampler.Options numShards (numShards dài)

Thông số
số mảnh vỡ Một bộ lấy mẫu có thể được sử dụng để lấy mẫu từ một tập hợp con của phạm vi ban đầu nhằm tăng tốc toàn bộ quá trình tính toán thông qua tính song song. Tham số này (cùng với 'phân đoạn') cho biết số lượng phân vùng đang được sử dụng trong quá trình tính toán tổng thể.

hạt giống công khai FixUnigramCandidateSampler.Options (Hạt giống dài)

Thông số
hạt giống Nếu hạt giống hoặc hạt giống2 được đặt khác 0, thì bộ tạo số ngẫu nhiên sẽ được gieo hạt giống đã cho. Nếu không, nó sẽ được gieo bởi một hạt giống ngẫu nhiên.

công khai FixUnigramCandidateSampler.Options Seed2 (Hạt giống dài2)

Thông số
hạt giống2 Hạt giống thứ hai để tránh va chạm hạt giống.

phân đoạn công khai FixUnigramCandidateSampler.Options (Phân đoạn dài)

Thông số
mảnh vỡ Một bộ lấy mẫu có thể được sử dụng để lấy mẫu từ một tập hợp con của phạm vi ban đầu nhằm tăng tốc toàn bộ quá trình tính toán thông qua tính song song. Tham số này (cùng với 'num_shards') cho biết số phân vùng cụ thể của hoạt động lấy mẫu khi phân vùng đang được sử dụng.

unigram công khai FixUnigramCandidateSampler.Options ( Danh sách<Float> unigram)

Thông số
unigram Danh sách số lượng hoặc xác suất unigram, mỗi số một ID theo thứ tự tuần tự. Chính xác một trong số vocab_file và unigram sẽ được chuyển cho op này.

public FixUnigramCandidateSampler.Options vocabFile (Chuỗi vocabFile)

Thông số
tập tin từ vựng Mỗi dòng hợp lệ trong tệp này (phải có định dạng giống CSV) tương ứng với một ID từ hợp lệ. ID được sắp xếp theo thứ tự, bắt đầu từ num_reserved_ids. Mục cuối cùng trong mỗi dòng dự kiến ​​​​sẽ là một giá trị tương ứng với số lượng hoặc xác suất tương đối. Chính xác một trong số vocab_file và unigram cần được chuyển tới op này.