Diese Seite wurde von der Cloud Translation API übersetzt.
Switch to English

tfds.features.Video

Quelltext anzeigen auf GitHub

FeatureConnector für Videos, Bilder einzeln auf der Festplatte kodiert.

Erbt von Sequence

Video: Die Bild Verbinder akzeptiert als Eingabe einen 4 - dimensionalen tf.uint8 Array repräsentiert ein Video, das eine Sequenz von Pfaden zu codierten Rahmen oder einen Pfad oder ein Dateiobjekt , das mit ffmpeg decodiert werden kann. Beachten Sie, dass nicht alle Formate in ffmpeg Unterstützung von Rohren zu lesen, so dass ein Dateiobjekt Bereitstellung fehlschlagen. Außerdem, wenn ein Pfad angegeben wird, die nicht auf dem lokalen Dateisystem ist, kopieren wir es zunächst in eine temporäre lokale Datei, bevor es zu ffmpeg vorbei.

Ausgabe:

  • video : tf.Tensor vom Typ tf.uint8 und Form [num_frames, Höhe, Breite, Kanäle], wobei Kanäle müssen 1 oder 3

Beispiel:

  • Im DatasetInfo Objekt:
 features=features.FeatureDict({
    'video': features.Video(shape=(None, 64, 64, 3)),
})
 
  • Bei der Generierung können Sie alle verwenden:
 yield {
    'video': np.ones(shape=(128, 64, 64, 3), dtype=np.uint8),
}
 

oder eine Liste von Frames:

 yield {
    'video': ['path/to/frame001.png', 'path/to/frame002.png'],
}
 

oder Pfad zum Video:

 yield {
    'video': '/path/to/video.avi',
}
 

oder Dateiobjekt:

 yield {
    'video': tf.io.gfile.GFile('/complex/path/video.avi'),
}
 

shape Tupel von ints, wobei die Form des Video (num_frames, Höhe, Breite, Kanäle), in denen die Kanäle 1 oder 3 ist.
encoding_format Das Video wird als eine Folge von kodierten Bildern gespeichert. Sie können eine beliebige Codierungsformat von image_feature.Feature unterstützt verwenden.
ffmpeg_extra_args Eine Folge von zusätzlichen args zum ffmpeg binären übergeben werden. Insbesondere wird ffmpeg wie genannt werden: ffmpeg -i <input_file> <ffmpeg_extra_args> %010d.<encoding_format>

ValueError Wenn die Form ist ungültig

dtype Bringen Sie den dtype (oder dict von dtype) dieses FeatureConnector.
feature Die innere Funktion.
shape Bringen Sie die Form (oder dict der Form) dieses FeatureConnector.

Methods

decode_batch_example

Quelltext anzeigen

Decode mehr Funktionen in einem einzigen tf.Tensor chargiert.

Diese Funktion zu dekodieren Funktionen verwendet wird , in gewickelt tfds.features.Sequence() . Standardmäßig gilt diese Funktion decode_example auf jedem einzelnen Elemente mit tf.map_fn . Doch für die Optimierung können Merkmale dieser Methode überschreiben Sie eine benutzerdefinierte Batch-Dekodierung anzuwenden.

args
tfexample_data Gleiche tf.Tensor Eingänge als decode_example , aber mit zusätzlicher und erster Dimension für die Sequenzlänge.

Kehrt zurück
tensor_data Tensor oder Wörterbuch von Tensor Ausgabe des tf.data.Dataset Objekt

decode_example

Quelltext anzeigen

Dekodieren die serialize Beispiele.

args
serialized_example Verschachtelte dict von tf.Tensor
decoders Verschachtelte dict von Decoder Objekte , die erlauben , die Dekodierung anzupassen. Die Struktur sollte die Merkmalstruktur übereinstimmen, aber nur maßgeschneiderte Funktionstasten vorhanden sein müssen. Siehe Reiseführer für weitere Informationen.

Kehrt zurück
example Nested dict der decodierten verschachtelten Beispiele enthält.

decode_ragged_example

Quelltext anzeigen

Decode verschachtelte Funktionen von einem tf.RaggedTensor.

Diese Funktion zu dekodieren Funktionen verwendet wird , in verschachtelter gewickelten tfds.features.Sequence() . Standardmäßig gilt diese Funktion decode_batch_example auf den flachen Werte des zackigen Tensor. Zur Optimierung können Merkmale diese Methode überschreiben Sie eine benutzerdefinierte Batch-Dekodierung anzuwenden.

args
tfexample_data tf.RaggedTensor Eingänge die verschachtelten kodierten Beispiele enthält.

Kehrt zurück
tensor_data Das decodierte tf.RaggedTensor Wörterbuch oder Tensor Ausgabe des tf.data.Dataset Objekt

encode_example

Quelltext anzeigen

Wandelt das gegebene Bild in eine tf dict umwandelbar Beispiel.

get_serialized_info

Quelltext anzeigen

Siehe Basisklasse für weitere Einzelheiten.

get_tensor_info

Quelltext anzeigen

Siehe Basisklasse für weitere Einzelheiten.

load_metadata

Quelltext anzeigen

Siehe Basisklasse für weitere Einzelheiten.

save_metadata

Quelltext anzeigen

Siehe Basisklasse für weitere Einzelheiten.

__getitem__

Quelltext anzeigen

Convenience-Methode, die zugrunde liegenden Funktionen zuzugreifen.