이 페이지는 Cloud Translation API를 통해 번역되었습니다.
Switch to English

tf.data.experimental.make_batched_features_dataset

TensorFlow 1 개 버전 GitHub의에서 소스보기

반환 Dataset 에서 기능 사전의 Example PROTOS는.

전자 필기장에서 사용

튜토리얼에서 사용

label_key 인수가 제공되는 경우 반환 Dataset 튜플의이 기능은 사전 및 레이블의 포함.

예:

 serialized_examples = [
  features {
    feature { key: "age" value { int64_list { value: [ 0 ] } } }
    feature { key: "gender" value { bytes_list { value: [ "f" ] } } }
    feature { key: "kws" value { bytes_list { value: [ "code", "art" ] } } }
  },
  features {
    feature { key: "age" value { int64_list { value: [] } } }
    feature { key: "gender" value { bytes_list { value: [ "f" ] } } }
    feature { key: "kws" value { bytes_list { value: [ "sports" ] } } }
  }
]
 

우리는 인수를 사용할 수 있습니다 :

 features: {
  "age": FixedLenFeature([], dtype=tf.int64, default_value=-1),
  "gender": FixedLenFeature([], dtype=tf.string),
  "kws": VarLenFeature(dtype=tf.string),
}
 

그리고 예상 출력은 다음과 같습니다

 {
  "age": [[0], [-1]],
  "gender": [["f"], ["f"]],
  "kws": SparseTensor(
    indices=[[0, 0], [0, 1], [1, 0]],
    values=["code", "art", "sports"]
    dense_shape=[2, 2]),
}
 

file_pattern 파일이나 포함 된 파일 경로의 패턴 목록 Example 기록을. 참조 tf.io.gfile.glob 패턴 규칙.
batch_size 레코드 수를 나타내는 int는 하나의 배치에 결합한다.
features dict 매핑 기능 키 FixedLenFeature 또는 VarLenFeature 값. 참조 tf.io.parse_example .
reader 호출 할 수있는 함수 또는 클래스 filenames 텐서 (옵션) reader_args 와 리턴 DatasetExample 텐서. 기본값은 tf.data.TFRecordDataset .
label_key 키 라벨에 해당하는 (선택 사항) 문자열에 저장됩니다 tf.Examples . 제공되는 경우에는 중 하나 여야합니다 features 키를,에, 그렇지 않으면 결과 ValueError .
reader_args 추가 인수는 리더 클래스에 전달합니다.
num_epochs 데이터 세트를 읽는 횟수를 지정하는 정수. 없는 경우는, 영원히 데이터 세트를 통해 순환합니다. 기본값은 None .
shuffle 부울 입력이 셔플되어야 하는지를 나타낸다. 기본값은 True .
shuffle_buffer_size ShuffleDataset의 버퍼 크기. 큰 용량을 보장하지만 더 나은 셔플하지만 메모리 사용량과 시작 시간을 증가시킬 것입니다.
shuffle_seed 무작위 씨앗 셔플을 위해 사용합니다.
prefetch_buffer_size 기능 배치의 수는 성능을 향상시키기 위해 프리 페치합니다. 권장 값은 훈련 단계에 따라 소비 배치의 수입니다. 자동 조정 기본값.
reader_num_threads 스레드 수는 읽는 데 사용 Example 기록을. 1> 경우, 결과는 인터리브됩니다. 기본값은 1 .
parser_num_threads 스레드 수는 구문 분석에 사용하는 Example 의 사전에 텐서를 Feature 텐서. 기본값은 2 .
sloppy_ordering 경우 True , 읽기 성능이 비 결정적 순서의 비용으로 향상 될 것입니다. 경우 False , 생산 요소의 순서는 (요소가 여전히 경우 무작위 이전 셔플에 결정적 shuffle=True . 주 씨가 설정되어있는 경우, 셔플 후 요소의 다음 순서는 결정적이다). 기본값은 False .
drop_final_batch 경우 True 과 배치 크기가 균일하게 입력 데이터 세트의 크기를 분할하지 않고, 마지막 작은 일괄 삭제됩니다. 기본값은 False .

한 세트 dict 요소 (또는 튜플 dict 요소와 라벨). 각 dict 에 기능 키를 매핑 Tensor 또는 SparseTensor 객체.

TypeError 경우 reader 잘못된 타입이다.
ValueError 경우 label_key 중 하나없는 features 키.