Skipgram

lớp học cuối cùng công khai Skipgram

Phân tích một tệp văn bản và tạo ra một loạt ví dụ.

Các lớp lồng nhau

lớp học Skipgram.Options Thuộc tính tùy chọn cho Skipgram

Phương pháp công cộng

Skipgram tĩnh
tạo ( Phạm vi phạm vi, Tên tệp chuỗi, Kích thước lô dài, Tùy chọn... tùy chọn)
Phương thức xuất xưởng để tạo một lớp bao bọc một thao tác Skipgram mới.
Đầu ra <Số nguyên>
hiện tạiEpoch ()
Số kỷ nguyên hiện tại.
Đầu ra <Số nguyên>
ví dụ ()
Một vectơ của id từ.
Đầu ra <Số nguyên>
nhãn ()
Một vectơ của id từ.
Skipgram.Options tĩnh
minCount (Số phút dài)
Skipgram.Options tĩnh
mẫu phụ (mẫu phụ nổi)
Đầu ra <Dài>
tổng sốWordsProcessed ()
Tổng số từ được xử lý cho đến nay.
Đầu ra <Số nguyên>
tần số từ vựng ()
Tần suất của từ.
Đầu ra <Chuỗi>
từ vựngWord ()
Một vectơ các từ trong kho ngữ liệu.
Skipgram.Options tĩnh
kích thước cửa sổ (Kích thước cửa sổ dài)
Đầu ra <Dài>
từ mỗi kỷ nguyên ()
Số từ mỗi kỷ nguyên trong tệp dữ liệu.

Phương pháp kế thừa

Phương pháp công cộng

tạo Skipgram tĩnh công khai ( Phạm vi phạm vi, Tên tệp chuỗi, Kích thước lô dài, Tùy chọn... tùy chọn)

Phương thức xuất xưởng để tạo một lớp bao bọc một thao tác Skipgram mới.

Thông số
phạm vi phạm vi hiện tại
tên tập tin Tên tệp văn bản của kho văn bản.
kích thước lô Kích thước lô sản xuất.
tùy chọn mang các giá trị thuộc tính tùy chọn
Trả lại
  • một phiên bản mới của Skipgram

Đầu ra công khai <Integer> currentEpoch ()

Số kỷ nguyên hiện tại.

Ví dụ đầu ra công khai <Integer> ()

Một vectơ của id từ.

nhãn đầu ra công khai <Số nguyên> ()

Một vectơ của id từ.

công khai Skipgram tĩnh.Options minCount (Long minCount)

Thông số
phútĐếm Số lần xuất hiện từ tối thiểu để nó được đưa vào từ vựng.

mẫu phụ Skipgram.Options tĩnh công khai (mẫu phụ Float)

Thông số
mẫu phụ Ngưỡng xuất hiện của từ. Những từ xuất hiện với tần suất cao hơn sẽ được lấy mẫu xuống một cách ngẫu nhiên. Đặt thành 0 để tắt.

Đầu ra công khai <Dài> TotalWordsProcessed ()

Tổng số từ được xử lý cho đến nay.

Đầu ra công khai <Integer> vocabFreq ()

Tần suất của từ. Sắp xếp theo thứ tự không tăng dần.

Đầu ra công khai <String> vocabWord ()

Một vectơ các từ trong kho ngữ liệu.

public static Skipgram.Options windowSize (Kích thước cửa sổ dài)

Thông số
kích thước cửa sổ Số lượng từ cần dự đoán ở bên trái và bên phải của mục tiêu.

Đầu ra công khai <Dài> từPerEpoch ()

Số từ mỗi kỷ nguyên trong tệp dữ liệu.