Dataset

공개 추상 클래스 데이터 세트

잠재적으로 큰 독립 요소(샘플) 목록을 나타내며 이러한 요소 전체에 걸쳐 반복 및 변환을 수행할 수 있습니다.

공공 생성자

데이터 세트 (Ops tf, Operand <?> 변형, List<Class<? 확장 TType >> outputTypes, List< Shape > outputShapes)

공개 방법

최종 데이터세트
배치 (긴 배치 크기, 부울 dropLastBatch)
이 데이터 세트의 요소를 배치로 그룹화합니다.
최종 데이터세트
배치 (긴 배치 크기)
이 데이터 세트의 요소를 배치로 그룹화합니다.
정적 데이터세트
fromTensorSlices (Ops tf, List< Operand <?>> 텐서, List<Class<? 확장 TType >> outputTypes)
요소가 주어진 텐서의 조각인 메모리 내 '데이터 세트'를 생성합니다.
운영
목록< 모양 >
getOutputShapes ()
이 데이터 세트의 각 구성 요소에 대한 모양 목록을 가져옵니다.
목록<클래스<? TType 확장 >>
getOutputTypes ()
이 데이터세트의 각 구성요소에 대한 출력 유형 목록을 가져옵니다.
피연산자 <?>
getVariant ()
이 데이터 세트를 나타내는 변형 텐서를 가져옵니다.
Iterator<목록< 피연산자 <?>>>
반복자 ()
이 Dataset의 모든 배치를 열심히 반복하는 반복자를 만듭니다.
데이터세트반복자
makeInitializeableIterator ()
이 데이터 세트의 요소를 반복하는 데 사용할 수 있는 `DatasetIterator`를 만듭니다.
데이터세트반복자
makeOneShotIterator ()
이 데이터 세트의 요소를 반복하는 데 사용할 수 있는 `DatasetIterator`를 만듭니다.
데이터세트
(Function<List< Operand <?>>, List< Operand <?>>> 매퍼)
이 데이터세트에서 반환된 모든 요소에 함수를 매핑하는 새 데이터세트를 반환합니다.
데이터세트
mapAllComponents (함수< 피연산자 <?>, 피연산자 <?>> 매퍼)
각 요소의 모든 구성요소에 대해 이 데이터세트의 모든 요소에 걸쳐 함수를 매핑하는 새 데이터세트를 반환합니다.
데이터세트
mapOneComponent (int 인덱스, Function< Operand <?>, Operand <?>> 매퍼)
각 요소의 단일 구성요소에서 이 데이터세트의 모든 요소에 걸쳐 함수를 매핑하는 새 데이터세트를 반환합니다.
최종 데이터세트
건너뛰기 (긴 카운트)
이 데이터세트에서 초기 요소 `count`개를 건너뛰는 새 `데이터세트`를 반환합니다.
최종 데이터세트
걸릴 (긴 카운트)
이 데이터세트의 첫 번째 '개수' 요소만 포함된 새 '데이터세트'를 반환합니다.
정적 데이터세트
textLineDataset (Ops tf, 문자열 파일 이름, 문자열 압축 유형, 긴 버퍼 크기)
정적 데이터세트
tfRecordDataset (Ops tf, 문자열 파일 이름, 문자열 압축 유형, 긴 버퍼 크기)

상속된 메서드

부울
같음 (개체 arg0)
마지막 수업<?>
getClass ()
정수
해시코드 ()
최종 무효
알림 ()
최종 무효
통지모두 ()
toString ()
최종 무효
대기 (long arg0, int arg1)
최종 무효
기다리세요 (긴 arg0)
최종 무효
기다리다 ()
추상적인 공백
forEach (소비자<? super T> arg0)
추상 반복자<목록< 피연산자 <?>>>
반복자 ()
추상 Spliterator<List< 피연산자 <?>>>
분할기 ()

공공 생성자

공개 데이터세트 (Ops tf, Operand <?> 변형, List<Class<? 확장 TType >> outputTypes, List< Shape > outputShapes)

공개 방법

공개 최종 데이터 세트 배치 (long BatchSize, 부울 dropLastBatch)

이 데이터 세트의 요소를 배치로 그룹화합니다.

매개변수
배치 크기 배치당 원하는 요소 수
dropLastBatch 'batchSize' 요소보다 적은 경우 최종 배치를 생략할지 여부입니다.
보고
  • 일괄 데이터 세트

공개 최종 데이터 세트 배치 (긴 배치 크기)

이 데이터 세트의 요소를 배치로 그룹화합니다. 'batchSize' 요소보다 적은 경우에도 마지막 배치를 포함합니다.

매개변수
배치 크기 배치당 원하는 요소 수
보고
  • 일괄 데이터세트

공개 정적 데이터 세트 fromTensorSlices (Ops tf, List< Operand <?>> 텐서, List<Class<? 확장 TType >> outputTypes)

요소가 주어진 텐서의 조각인 메모리 내 '데이터 세트'를 생성합니다. 이 데이터세트의 각 요소는 제공된 텐서의 조각(예: 배치)을 나타내는 List<Operand<?>> 입니다.

매개변수
tf 작전 접근자
텐서 이 데이터 세트의 구성 요소(예: 기능, 레이블)를 나타내는 Operand<?> 목록
출력 유형 이 데이터 세트의 각 구성 요소의 데이터 유형을 나타내는 텐서 유형 클래스 목록입니다.
보고
  • 새로운 '데이터 세트'

공개 작전 getOpsInstance ()

공개 목록< 모양 > getOutputShapes ()

이 데이터세트의 각 구성요소에 대한 모양 목록을 가져옵니다.

공개 목록<클래스<? TType >> getOutputTypes 확장 ()

이 데이터세트의 각 구성요소에 대한 출력 유형 목록을 가져옵니다.

공용 피연산자 <?> getVariant ()

이 데이터 세트를 나타내는 변형 텐서를 가져옵니다.

공용 Iterator<List< 피연산자 <?>>> 반복자 ()

이 Dataset의 모든 배치를 열심히 반복하는 반복자를 만듭니다. 각 배치는 '출력' 객체로 반환되는 구성 요소 목록입니다.

이 방법을 사용하면 Eager 모드에서 실행할 때 일괄 처리를 통해 각 반복을 수행할 수 있습니다. 그래프 모드 일괄 반복에 대해서는 `makeOneShotIterator`를 참조하세요.

보고
  • 이 데이터 세트의 배치를 통한 반복자입니다.

공개 DatasetIterator makeInitializeableIterator ()

이 데이터 세트의 요소를 반복하는 데 사용할 수 있는 `DatasetIterator`를 만듭니다.

이 반복자는 루프에서 요소를 검색하기 전에 `iterator.makeInitializer(Dataset)`에 대한 호출로 초기화되어야 합니다.

보고
  • 이 데이터 세트의 구조를 기반으로 하는 새로운 `DatasetIterator`입니다.

공개 DatasetIterator makeOneShotIterator ()

이 데이터 세트의 요소를 반복하는 데 사용할 수 있는 `DatasetIterator`를 만듭니다. `makeOneShotIterator`를 사용하면 이 데이터세트에서 반복자가 자동으로 초기화됩니다. 건너뛰기 그래프 모드에서 초기화 작업은 `tf.init()`를 통해 실행되어야 하는 그래프의 초기화 목록에 추가됩니다.

전:

     try (Session session = new Session(graph) {
         // Immediately run initializers
         session.run(tf.init());
     }
 

Eager 모드에서는 이 호출의 결과로 초기화 프로그램이 자동으로 실행됩니다.

보고
  • 이 데이터 세트의 구조를 기반으로 하는 새로운 `DatasetIterator`입니다.

공용 데이터세트 (Function<List< Operand <?>>, List< Operand <?>>> 매퍼)

이 데이터세트에서 반환된 모든 요소에 함수를 매핑하는 새 데이터세트를 반환합니다.

예를 들어, 각 요소가 2개의 구성 요소(기능, 레이블)가 있는 List<Operand<?>> 가정합니다.

부름

dataset.map(components -> {
      Operand<?> features = components.get(0);
      Operand<?> labels   = components.get(1);

      return Arrays.asList(
        tf.math.mul(features, tf.constant(2)),
        tf.math.mul(labels, tf.constant(5))
      );
 );
 }
기능을 'features' 및 'labels' 구성요소에 매핑하여 기능에 2를 곱하고 라벨에 5를 곱합니다.

매개변수
매퍼 이 반복자의 각 요소에 적용할 함수입니다.
보고
  • 이 반복자의 각 요소에 '매퍼'를 적용하는 새 데이터 세트입니다.

공용 데이터세트 mapAllComponents (함수< 피연산자 <?>, 피연산자 <?>> 매퍼)

각 요소의 모든 구성요소에서 이 데이터세트의 모든 요소에 걸쳐 함수를 매핑하는 새 데이터세트를 반환합니다.

예를 들어, 각 요소가 2개의 구성 요소(기능, 레이블)가 있는 List<Operand<?>> 가정합니다.

dataset.mapAllComponents(component -> tf.math.mul(component, tf.constant(2))) 를 호출하면 각 요소의 `features` 및 `labels` 구성 요소 모두에 대해 함수를 매핑하여 모두 2를 곱합니다.

매개변수
매퍼 각 컴포넌트에 적용할 기능
보고
  • 각 요소의 모든 구성 요소에 '매퍼'를 적용하는 새로운 데이터 세트입니다.

공용 데이터세트 mapOneComponent (int index, Function< Operand <?>, Operand <?>> 매퍼)

각 요소의 단일 구성요소에서 이 데이터세트의 모든 요소에 걸쳐 함수를 매핑하는 새 데이터세트를 반환합니다.

예를 들어, 각 요소가 2개의 구성 요소(기능, 레이블)가 있는 List<Operand<?>> 가정합니다.

dataset.mapOneComponent(0, features -> tf.math.mul(features, tf.constant(2))) 를 호출하면 각 요소의 'features' 구성 요소에 함수를 매핑하고 각 요소에 2를 곱합니다.

매개변수
색인 변환할 구성 요소의 인덱스입니다.
매퍼 대상 구성요소에 적용할 함수입니다.
보고
  • 선택한 인덱스의 구성 요소에 '매퍼'를 적용하는 새 데이터 세트입니다.

공개 최종 데이터세트 건너뛰기 (긴 개수)

이 데이터세트에서 초기 요소 `count`개를 건너뛰는 새 `데이터세트`를 반환합니다.

매개변수
세다 새 데이터세트를 구성하기 위해 `건너뛰`할 요소의 수입니다.
보고
  • `count` 요소가 제거된 새 데이터세트입니다.

공개 최종 데이터 세트 소요 (긴 개수)

이 데이터세트의 첫 번째 '개수' 요소만 포함된 새 '데이터세트'를 반환합니다.

매개변수
세다 이 데이터세트에서 '가져올' 요소 수입니다.
보고
  • 이 데이터세트의 첫 번째 'count' 요소를 포함하는 새 데이터세트입니다.

공개 정적 데이터 세트 textLineDataset (Ops tf, 문자열 파일 이름, 문자열 압축 유형, 긴 버퍼 크기)

공개 정적 데이터 세트 tfRecordDataset (Ops tf, 문자열 파일 이름, 문자열 압축 유형, 긴 버퍼 크기)

공개 문자열 toString ()