此页面由 Cloud Translation API 翻译。
Switch to English

tfds.core.DatasetInfo

GitHub上查看源代码

有关数据集信息。

DatasetInfo文件的数据集,包括它的名称,版本和功能。见构造函数的参数和属性的完整列表。

builder DatasetBuilder ,数据集建设者此信息。
description str ,该数据集的描述。
features tfds.features.FeaturesDict ,上的特征的dict信息tf.data.Dataset()从物体builder.as_dataset()方法。
supervised_keys tuple(input_key, target_key)指定输入功能,并为监督学习的标签,适用于数据集,如果。按键对应的功能名称中选择info.features 。当调用tfds.core.DatasetBuilder.as_dataset()as_supervised=True ,则tf.data.Dataset对象将产生这里定义的(输入,目标)。
homepage str ,可选的,网页的数据集。
citation str ,可选,引文用于该数据集。
metadata tfds.core.Metadata ,其将被存储产生额外的对象/恢复与数据集。这使得存储与数据集的附加信息。
redistribution_info dict ,需要进行再分配可选,信息,如指定dataset_info_pb2.RedistributionInfo 。该内容license子将自动写入到存储与数据集的许可文件。

as_json

as_proto

citation

data_dir

dataset_size 生成的数据集文件的大小,以字节为单位。
description

download_size 下载的文件大小,以字节为单位。
features

full_name 完整规范名称:( / / )。
homepage

initialized 无论DatasetInfo已完全初始化。
metadata

name

redistribution_info

splits

supervised_keys

version

方法

compute_dynamic_properties

查看源代码

initialize_from_bucket

查看源代码

初始化DatasetInfo从GCS水桶信息的文件。

read_from_directory

查看源代码

更新DatasetInfo从JSON文件dataset_info_dir

此功能更新所有DatasetInfo的动态生成的字段(num_examples,哈希,创建时间,...)。

这将覆盖所有以前的元数据。

ARGS
dataset_info_dir str包含元数据的文件的目录。这应该是一个特定的数据集版本的根目录。

update_splits_if_different

查看源代码

覆盖劈叉,如果他们是从当前不完全相同。

  • 如果分割尚未定义的或不同的(例如:不同数量的碎片),则使用新的分割字典。这将触发download_and_prepare内的统计数据计算。
  • 如果拆分在DatasetInfo和类似的(相同的名称和碎片)已经定义:保持恢复分裂其中包含的统计数据(从GCS或文件恢复)

ARGS
split_dict tfds.core.SplitDict ,新的分割

write_to_directory

查看源代码

DatasetInfo为JSON到dataset_info_dir