TFDS supporte désormais le format Croissant 🥐 ! Lisez la documentation pour en savoir plus.

Interface de ligne de commande TFDS

TFDS CLI est un outil de ligne de commande qui fournit diverses commandes pour travailler facilement avec les ensembles de données TensorFlow.

Voir sur TensorFlow.org

Exécuter dans Google Colab

Voir la source sur GitHub

Télécharger le cahier

Désactiver les journaux TF lors de l'importation

%%capture
%env TF_CPP_MIN_LOG_LEVEL=1  # Disable logs on TF import

Installation

L'outil CLI est installé avec tensorflow-datasets (ou tfds-nightly ).

pip install -q tfds-nightly
tfds --version

Pour la liste de toutes les commandes CLI :

tfds --help

usage: tfds [-h] [--helpfull] [--version] {build,new} ...

Tensorflow Datasets CLI tool

optional arguments:
  -h, --help   show this help message and exit
  --helpfull   show full help message and exit
  --version    show program's version number and exit

command:
  {build,new}
    build      Commands for downloading and preparing datasets.
    new        Creates a new dataset directory from the template.

`tfds new` : Implémentation d'un nouveau jeu de données

Cette commande vous aidera à démarrer l'écriture de votre nouvel ensemble de données Python en créant un répertoire <dataset_name>/ contenant les fichiers d'implémentation par défaut.

Usage:

tfds new my_dataset

2022-02-07 04:04:10.397902: E tensorflow/stream_executor/cuda/cuda_driver.cc:271] failed call to cuInit: CUDA_ERROR_NO_DEVICE: no CUDA-capable device is detected
Dataset generated at /tmpfs/src/temp/docs/my_dataset
You can start searching `TODO(my_dataset)` to complete the implementation.
Please check https://www.tensorflow.org/datasets/add_dataset for additional details.

Créera:

ls -1 my_dataset/

__init__.py
checksums.tsv
dummy_data/
my_dataset.py
my_dataset_test.py

Consultez notre guide d'écriture d'ensemble de données pour plus d'informations.

Options disponibles:

tfds new --help

usage: tfds new [-h] [--helpfull] [--dir DIR] dataset_name

positional arguments:
  dataset_name  Name of the dataset to be created (in snake_case)

optional arguments:
  -h, --help    show this help message and exit
  --helpfull    show full help message and exit
  --dir DIR     Path where the dataset directory will be created. Defaults to
                current directory.

`tfds build` : Télécharger et préparer un jeu de données

Utilisez tfds build <my_dataset> pour générer un nouvel ensemble de données. <my_dataset> peut être :

Un chemin d'accès au dossier dataset/ ou au fichier dataset.py (vide pour le répertoire actuel) :
- tfds build datasets/my_dataset/
- cd datasets/my_dataset/ && tfds build
- cd datasets/my_dataset/ && tfds build my_dataset
- cd datasets/my_dataset/ && tfds build my_dataset.py
Un jeu de données enregistré :
- tfds build mnist
- tfds build my_dataset --imports my_project.datasets