Интеграция классификатора естественного языка BERT

Оптимизируйте свои подборки Сохраняйте и классифицируйте контент в соответствии со своими настройками.

API библиотеки задач BertNLClassifier очень похож на NLClassifier , который классифицирует входной текст по различным категориям, за исключением того, что этот API специально разработан для моделей, связанных с Bert, которые требуют токенизации Wordpiece и Sentencepiece вне модели TFLite.

Основные возможности API BertNLClassifier

  • Принимает одну строку в качестве входных данных, выполняет классификацию со строкой и выводит пары в качестве результатов классификации.

  • Выполняет токенизацию Wordpiece или Sentencepiece вне графика для входного текста.

Поддерживаемые модели BertNLClassifier

Следующие модели совместимы с BertNLClassifier API.

Выполнить вывод в Java

Шаг 1: Импорт зависимости Gradle и других настроек

Скопируйте файл модели .tflite в каталог активов модуля Android, где будет запускаться модель. Укажите, что файл не должен быть сжат, и добавьте библиотеку TensorFlow Lite в файл build.gradle модуля:

android {
    // Other settings

    // Specify tflite file should not be compressed for the app apk
    aaptOptions {
        noCompress "tflite"
    }

}

dependencies {
    // Other dependencies

    // Import the Task Text Library dependency (NNAPI is included)
    implementation 'org.tensorflow:tensorflow-lite-task-text:0.3.0'
}

Шаг 2. Выполните вывод с помощью API

// Initialization
BertNLClassifierOptions options =
    BertNLClassifierOptions.builder()
        .setBaseOptions(BaseOptions.builder().setNumThreads(4).build())
        .build();
BertNLClassifier classifier =
    BertNLClassifier.createFromFileAndOptions(context, modelFile, options);

// Run inference
List<Category> results = classifier.classify(input);

См. исходный код для более подробной информации.

Запустить вывод в Swift

Шаг 1: Импортируйте CocoaPods

Добавьте модуль TensorFlowLiteTaskText в файл Podfile.

target 'MySwiftAppWithTaskAPI' do
  use_frameworks!
  pod 'TensorFlowLiteTaskText', '~> 0.2.0'
end

Шаг 2. Выполните вывод с помощью API

// Initialization
let bertNLClassifier = TFLBertNLClassifier.bertNLClassifier(
      modelPath: bertModelPath)

// Run inference
let categories = bertNLClassifier.classify(text: input)

См. исходный код для более подробной информации.

Запустить вывод на C++

// Initialization
BertNLClassifierOptions options;
options.mutable_base_options()->mutable_model_file()->set_file_name(model_path);
std::unique_ptr<BertNLClassifier> classifier = BertNLClassifier::CreateFromOptions(options).value();

// Run inference with your input, `input_text`.
std::vector<core::Category> categories = classifier->Classify(input_text);

См. исходный код для более подробной информации.

Запустить вывод в Python

Шаг 1: Установите пакет pip

pip install tflite-support

Шаг 2: Использование модели

# Imports
from tflite_support.task import text

# Initialization
classifier = text.BertNLClassifier.create_from_file(model_path)

# Run inference
text_classification_result = classifier.classify(text)

Дополнительные параметры настройки BertNLClassifier см. в исходном коде .

Пример результатов

Вот пример результатов классификации обзоров фильмов с использованием модели MobileBert от Model Maker.

Ввод: «это очаровательное и часто трогательное путешествие».

Выход:

category[0]: 'negative' : '0.00006'
category[1]: 'positive' : '0.99994'

Попробуйте простой демонстрационный инструмент CLI для BertNLClassifier с собственной моделью и тестовыми данными.

Требования к совместимости моделей

API BetNLClassifier ожидает модель TFLite с обязательными метаданными модели TFLite .

Метаданные должны соответствовать следующим требованиям:

  • input_process_units для токенизатора Wordpiece/Sentencepiece

  • 3 входных тензора с именами «id», «mask» и «segment_ids» для вывода токенизатора

  • 1 выходной тензор типа float32 с опционально прикрепленным файлом метки. Если прикреплен файл метки, этот файл должен быть текстовым файлом с одной меткой в ​​строке, а количество меток должно соответствовать количеству категорий, выводимых моделью.