Giúp bảo vệ Great Barrier Reef với TensorFlow trên Kaggle Tham Challenge

dòng chảy :: hoạt động :: FixedUnigramCandidateSampler :: Đính kèm

#include <candidate_sampling_ops.h>

Bộ thiết lập thuộc tính tùy chọn cho FixedUnigramCandidateSampler .

Tóm lược

Thuộc tính công khai

distortion_ = 1.0f
float
num_reserved_ids_ = 0
int64
num_shards_ = 1
int64
seed2_ = 0
int64
seed_ = 0
int64
shard_ = 0
int64
unigrams_ = {}
gtl::ArraySlice< float >
vocab_file_ = ""
StringPiece

Chức năng công cộng

Distortion (float x)
TF_MUST_USE_RESULT Attrs
Sự biến dạng được sử dụng để làm lệch phân phối xác suất unigram.
NumReservedIds (int64 x)
TF_MUST_USE_RESULT Attrs
Người dùng có thể tùy chọn thêm một số ID dành riêng trong phạm vi [0, ..., num_reserved_ids).
NumShards (int64 x)
TF_MUST_USE_RESULT Attrs
Bộ lấy mẫu có thể được sử dụng để lấy mẫu từ một tập hợp con của phạm vi ban đầu nhằm tăng tốc độ toàn bộ tính toán thông qua song song.
Seed (int64 x)
TF_MUST_USE_RESULT Attrs
Nếu hạt giống hoặc hạt giống2 được đặt là khác 0, bộ tạo số ngẫu nhiên sẽ được tạo hạt giống đã cho.
Seed2 (int64 x)
TF_MUST_USE_RESULT Attrs
Một hạt giống thứ hai để tránh hạt bị va chạm.
Shard (int64 x)
TF_MUST_USE_RESULT Attrs
Bộ lấy mẫu có thể được sử dụng để lấy mẫu từ một tập hợp con của phạm vi ban đầu nhằm tăng tốc độ toàn bộ tính toán thông qua song song.
Unigrams (const gtl::ArraySlice< float > & x)
TF_MUST_USE_RESULT Attrs
Một danh sách các số lượng hoặc xác suất unigram, một cho mỗi ID theo thứ tự tuần tự.
VocabFile (StringPiece x)
TF_MUST_USE_RESULT Attrs
Mỗi dòng hợp lệ trong tệp này (phải có định dạng giống CSV) tương ứng với một ID từ hợp lệ.

Thuộc tính công khai

méo mó_

float tensorflow::ops::FixedUnigramCandidateSampler::Attrs::distortion_ = 1.0f

num_reserved_ids_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_reserved_ids_ = 0

num_shards_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_shards_ = 1

seed2_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed2_ = 0

hạt giống_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed_ = 0

shard_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::shard_ = 0

unigram_

gtl::ArraySlice< float > tensorflow::ops::FixedUnigramCandidateSampler::Attrs::unigrams_ = {}

vocab_file_

StringPiece tensorflow::ops::FixedUnigramCandidateSampler::Attrs::vocab_file_ = ""

Chức năng công cộng

Méo mó

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Distortion(
  float x
)

Sự biến dạng được sử dụng để làm lệch phân phối xác suất unigram.

Trước tiên, mỗi trọng lượng được nâng lên đến sức mạnh của độ méo trước khi thêm vào phân phối unigram bên trong. Kết quả là, độ méo = 1,0 cho phép lấy mẫu unigram thường xuyên (như được định nghĩa bởi tệp vocab) và độ méo = 0,0 cho phép phân phối đồng đều.

Mặc định là 1

NumReservedIds

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumReservedIds(
  int64 x
)

Người dùng có thể tùy chọn thêm một số ID dành riêng trong phạm vi [0, ..., num_reserved_ids).

Một trường hợp sử dụng là mã thông báo từ không xác định đặc biệt được sử dụng làm ID 0. Những ID này sẽ có xác suất lấy mẫu là 0.

Mặc định là 0

NumShards

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumShards(
  int64 x
)

Bộ lấy mẫu có thể được sử dụng để lấy mẫu từ một tập hợp con của phạm vi ban đầu nhằm tăng tốc độ toàn bộ tính toán thông qua song song.

Tham số này (cùng với 'shard') cho biết số lượng phân vùng đang được sử dụng trong tính toán tổng thể.

Mặc định là 1

Hạt giống

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed(
  int64 x
)

Nếu hạt giống hoặc hạt giống2 được đặt là khác 0, bộ tạo số ngẫu nhiên sẽ được tạo hạt giống đã cho.

Nếu không, nó được gieo bởi một hạt ngẫu nhiên.

Mặc định là 0

Seed2

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed2(
  int64 x
)

Một hạt giống thứ hai để tránh hạt bị va chạm.

Mặc định là 0

Mảnh vỡ

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Shard(
  int64 x
)

Bộ lấy mẫu có thể được sử dụng để lấy mẫu từ một tập hợp con của phạm vi ban đầu nhằm tăng tốc độ toàn bộ tính toán thông qua song song.

Tham số này (cùng với 'num_shards') cho biết số phân vùng cụ thể của op trình lấy mẫu, khi phân vùng đang được sử dụng.

Mặc định là 0

Unigram

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Unigrams(
  const gtl::ArraySlice< float > & x
)

Một danh sách các số lượng hoặc xác suất unigram, một cho mỗi ID theo thứ tự tuần tự.

Chính xác một trong các vocab_file và unigram phải được chuyển đến op này.

Mặc định là []

VocabFile

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::VocabFile(
  StringPiece x
)

Mỗi dòng hợp lệ trong tệp này (phải có định dạng giống CSV) tương ứng với một ID từ hợp lệ.

Các ID theo thứ tự tuần tự, bắt đầu từ num_reserved_ids. Mục nhập cuối cùng trong mỗi dòng được mong đợi là một giá trị tương ứng với số đếm hoặc xác suất tương đối. Chính xác một trong các vocab_file và unigram cần được chuyển tới op này.

Mặc định là ""