此页面由 Cloud Translation API 翻译。
Switch to English

模组:tfds

在GitHub上查看源代码

tensorflow_datasetstfds )定义了可与TensorFlow一起使用的数据集。

每个数据集都定义为tfds.core.DatasetBuilder ,它封装了下载数据集和构建输入管道的逻辑,还包含数据集文档(版本,拆分,示例数等)。

主要的库入口点是:

说明文件:

模组

core模块:用于定义数据集的API。

decode模块:解码器公共API。

download模块: tfds.download.DownloadManager API。

features模块: tfds.features.FeatureConnector API,用于定义功能类型。

testing模块:测试实用程序。

units模块:定义用于转换各种单位的便利常数/功能。

visualization模块:Visualizer utils。

班级

class GenerateModeEnum ,用于处理现有的下载和数据。

class ImageFolder :从手动目录创建的通用图像分类数据集。

class ReadConfig :配置输入读取管道。

class Split :用于数据集拆分的Enum

class TranslateFolder :从手动目录创建的通用文本翻译数据集。

功能

as_numpy(...) :将tf.data.Dataset转换为可迭代的NumPy数组。

builder(...) :按字符串名称获取tfds.core.DatasetBuilder

tfds.core.DatasetBuilder builder_cls(...) :按字符串名称获取tfds.core.DatasetBuilder类。

disable_progress_bar(...) :禁用Tqdm进度栏。

is_dataset_on_gcs(...) :如果数据集在GCS存储段gs:// tfds-data / datasets上可用。

list_builders(...) :返回所有tfds.core.DatasetBuilder的字符串名称。

load(...) :将命名数据集加载到tf.data.Dataset

show_examples(...) :可视化图像分类数据集中的图像(和标签)。

show_statistics(...) :在Colab / Jupyter笔记本上显示数据集统计信息。

其他成员

  • __version__ = '3.2.1'