StringNGrams
컬렉션을 사용해 정리하기
내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요.
비정형 문자열 데이터에서 ngram을 생성합니다.
이 작업은 문자열만 포함하는 1개의 비정형 차원이 있는 비정형 텐서를 허용하고 가장 안쪽 축을 따라 결합된 해당 문자열의 ngram을 포함하는 1개의 비정형 차원이 있는 비정형 텐서를 출력합니다.
공개 방법
| static <T는 숫자를 확장합니다> StringNGrams <T> | 생성 ( 범위 범위, 피연산자 <String> 데이터, 피연산자 <T> dataSplits, 문자열 구분 기호, List<Long> ngramWidths, 문자열 leftPad, 문자열 rightPad, Long padWidth, Boolean presentsShortSequences) 새로운 StringNGrams 작업을 래핑하는 클래스를 생성하는 팩토리 메서드입니다. |
| 출력 <문자열> | 엔그램 () 출력 ngram의 비정형 텐서 값 텐서. |
| 출력 <T> | |
상속된 메서드
java.lang.Object 클래스에서 | 부울 | 같음 (개체 arg0) |
| 마지막 수업<?> | getClass () |
| 정수 | 해시 코드 () |
| 최종 무효 | 알림 () |
| 최종 무효 | 통지모두 () |
| 끈 | toString () |
| 최종 무효 | 대기 (long arg0, int arg1) |
| 최종 무효 | 기다리세요 (긴 arg0) |
| 최종 무효 | 기다리다 () |
공개 방법
public static StringNGrams <T> create ( 범위 범위, 피연산자 <String> 데이터, 피연산자 <T> dataSplits, 문자열 구분 기호, List<Long> ngramWidths, 문자열 leftPad, 문자열 rightPad, Long padWidth, Boolean presentsShortSequences)
새로운 StringNGrams 작업을 래핑하는 클래스를 생성하는 팩토리 메서드입니다.
매개변수
| 범위 | 현재 범위 |
|---|
| 데이터 | ngram을 만들 비정형 문자열 텐서의 값 텐서입니다. 1D 문자열 텐서여야 합니다. |
|---|
| 데이터분할 | ngram을 만들기 위해 비정형 문자열 텐서의 분할 텐서를 사용합니다. |
|---|
| 분리 기호 | 토큰 요소 사이에 추가할 문자열입니다. 구분 기호가 없으면 ""를 사용하세요. |
|---|
| ngram 폭 | 생성할 ngram의 크기입니다. |
|---|
| 왼쪽 패드 | ngram 시퀀스의 왼쪽을 채우는 데 사용할 문자열입니다. pad_width != 0인 경우에만 사용됩니다. |
|---|
| 오른쪽 패드 | ngram 시퀀스의 오른쪽을 채우는 데 사용할 문자열입니다. pad_width != 0인 경우에만 사용됩니다. |
|---|
| 패드너비 | 각 시퀀스의 각 측면에 추가할 패딩 요소 수입니다. 패딩은 이 값에 관계없이 'ngram_widths'-1보다 클 수 없습니다. `pad_width=-1`인 경우 `max(ngram_widths)-1` 요소를 추가합니다. |
|---|
공개 출력 <T> ngramsSplits ()
달리 명시되지 않는 한 이 페이지의 콘텐츠에는 크리에이티브 커먼즈 저작자 표시 라이선스 4.0 라이선스에 따라 라이선스가 부여되며, 코드 샘플에는 Apache 2.0 라이선스에 따라 라이선스가 부여됩니다. 자세한 내용은 Google Developers 사이트 정책을 참조하세요. 자바는 Oracle 및/또는 Oracle 계열사의 등록 상표입니다. 일부 콘텐츠에는 Numpy 라이선스가 부여됩니다.
최종 업데이트: 2025-07-26(UTC)
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["필요한 정보가 없음","missingTheInformationINeed","thumb-down"],["너무 복잡함/단계 수가 너무 많음","tooComplicatedTooManySteps","thumb-down"],["오래됨","outOfDate","thumb-down"],["번역 문제","translationIssue","thumb-down"],["샘플/코드 문제","samplesCodeIssue","thumb-down"],["기타","otherDown","thumb-down"]],["최종 업데이트: 2025-07-26(UTC)"],[],[]]