Trang này được dịch bởi Cloud Translation API.
Switch to English

tfds.features.Video

Xem nguồn trên GitHub

FeatureConnector cho video, mã hóa khung riêng biệt trên đĩa.

Inherits From: Sequence

Video: Các kết nối hình ảnh chấp nhận như là đầu vào một chiều 4 tf.uint8 mảng đại diện cho một video, một chuỗi các đường dẫn đến khung mã hóa, hoặc một con đường hay một đối tượng tập tin đó có thể được giải mã với ffmpeg. Lưu ý rằng không phải tất cả các định dạng hỗ trợ ffmpeg đọc từ đường ống, do đó cung cấp một đối tượng tập tin có thể thất bại. Hơn nữa, nếu một con đường được đưa ra mà không nằm trong hệ thống tập tin địa phương, trước tiên chúng ta sao chép nó vào một tập tin cục bộ tạm thời trước khi đi qua nó để ffmpeg.

Output:

  • video : tf.Tensor loại tf.uint8 và hình dạng [num_frames, chiều cao, chiều rộng, các kênh truyền hình], nơi các kênh truyền hình phải có 1 hoặc 3

Thí dụ:

  • Trong các đối tượng DatasetInfo:
 features=features.FeatureDict({
    'video': features.Video(shape=(None, 64, 64, 3)),
})
 
  • Trong thế hệ, bạn có thể sử dụng bất kỳ:
 yield {
    'video': np.ones(shape=(128, 64, 64, 3), dtype=np.uint8),
}
 

hoặc danh sách các khung hình:

 yield {
    'video': ['path/to/frame001.png', 'path/to/frame002.png'],
}
 

hoặc đường dẫn đến video:

 yield {
    'video': '/path/to/video.avi',
}
 

hoặc đối tượng tập tin:

 yield {
    'video': tf.io.gfile.GFile('/complex/path/video.avi'),
}
 

shape tuple ints, hình dạng của video (num_frames, chiều cao, chiều rộng, các kênh truyền hình), nơi các kênh truyền hình là 1 hoặc 3.
encoding_format Đoạn video được lưu giữ như một chuỗi các hình ảnh được mã hóa. Bạn có thể sử dụng bất kỳ định dạng mã hóa được hỗ trợ bởi image_feature.Feature.
ffmpeg_extra_args Một chuỗi args bổ sung để được truyền cho nhị phân ffmpeg. Cụ thể, ffmpeg sẽ được gọi là: ffmpeg -i <input_file> <ffmpeg_extra_args> %010d.<encoding_format>

ValueError Nếu hình dạng không hợp lệ

dtype Trả lại dtype (hoặc dict của dtype) của FeatureConnector này.
feature Các tính năng bên trong.
shape Quay trở lại hình dạng (hoặc dict hình dạng) của FeatureConnector này.

phương pháp

decode_batch_example

Xem nguồn

Decode nhiều tính năng trộn trong một tf.Tensor duy nhất.

Chức năng này được sử dụng để tính năng giải mã được bọc trong tfds.features.Sequence() . Theo mặc định, chức năng này áp dụng decode_example trên mỗi yếu tố cá nhân sử dụng tf.map_fn . Tuy nhiên, để tối ưu hóa, các tính năng có thể ghi đè lên phương pháp này để áp dụng một giải mã hàng loạt tùy chỉnh.

args
tfexample_data Cùng tf.Tensor đầu vào như decode_example , nhưng với và kích thước của đầu tiên bổ sung cho chiều dài chuỗi.

Returns
tensor_data Tensor hoặc từ điển của tensor, sản lượng của đối tượng tf.data.Dataset

decode_example

Xem nguồn

Giải mã các ví dụ serialize.

args
serialized_example Lồng nhau dict của tf.Tensor
decoders Dict lồng nhau của Decoder đối tượng cho phép tùy biến giải mã. Cấu trúc phải phù hợp với cấu trúc tính năng, nhưng các phím tính năng chỉ tùy chỉnh cần phải có mặt. Xem hướng dẫn để biết thêm.

Returns
example Lồng nhau dict chứa các ví dụ lồng nhau giải mã.

decode_ragged_example

Xem nguồn

Giải mã tính năng lồng nhau từ một tf.RaggedTensor.

Chức năng này được sử dụng để tính năng giải mã được bọc trong lồng tfds.features.Sequence() . Theo mặc định, chức năng này áp dụng decode_batch_example trên các giá trị căn hộ của tensor rách rưới. Để tối ưu hóa, các tính năng có thể ghi đè lên phương pháp này để áp dụng một giải mã hàng loạt tùy chỉnh.

args
tfexample_data tf.RaggedTensor đầu vào có chứa các ví dụ mã hóa lồng nhau.

Returns
tensor_data Các giải mã tf.RaggedTensor hoặc từ điển của tensor, sản lượng của đối tượng tf.data.Dataset

encode_example

Xem nguồn

Chuyển đổi hình ảnh cho thành một dict mui trần để dụ tf.

get_serialized_info

Xem nguồn

Xem lớp cơ sở để biết chi tiết.

get_tensor_info

Xem nguồn

Xem lớp cơ sở để biết chi tiết.

load_metadata

Xem nguồn

Xem lớp cơ sở để biết chi tiết.

save_metadata

Xem nguồn

Xem lớp cơ sở để biết chi tiết.

__getitem__

Xem nguồn

phương pháp thuận tiện để truy cập vào các tính năng cơ bản.