Интегрируйте автоответчик BERT

API библиотеки задач BertQuestionAnswerer загружает модель Берта и отвечает на вопросы на основе содержания данного отрывка. Дополнительную информацию можно найти в документации по модели «Вопрос-Ответ» здесь .

Ключевые особенности API BertQuestionAnswerer

Принимает два текстовых ввода в виде вопроса и контекста и выводит список возможных ответов.
Выполняет внеграфическую токенизацию Wordpiece или Sentencepiece для входного текста.

Поддерживаемые модели BertQuestionAnswerer

Следующие модели совместимы с API BertNLClassifier .

Модели, созданные TensorFlow Lite Model Maker для BERT Вопрос-Ответ .
Предварительно обученные модели BERT на TensorFlow Hub .
Пользовательские модели, соответствующие требованиям совместимости моделей .

Запустить вывод в Java

Шаг 1. Импортируйте зависимости Gradle и другие настройки.

Скопируйте файл модели .tflite в каталог ресурсов модуля Android, где будет запускаться модель. Укажите, что файл не должен быть сжат, и добавьте библиотеку TensorFlow Lite в файл build.gradle модуля:

android {
    // Other settings

    // Specify tflite file should not be compressed for the app apk
    aaptOptions {
        noCompress "tflite"
    }

}

dependencies {
    // Other dependencies

    // Import the Task Text Library dependency (NNAPI is included)
    implementation 'org.tensorflow:tensorflow-lite-task-text:0.4.4'
}

Шаг 2. Запустите логический вывод с помощью API

// Initialization
BertQuestionAnswererOptions options =
    BertQuestionAnswererOptions.builder()
        .setBaseOptions(BaseOptions.builder().setNumThreads(4).build())
        .build();
BertQuestionAnswerer answerer =
    BertQuestionAnswerer.createFromFileAndOptions(
        androidContext, modelFile, options);

// Run inference
List<QaAnswer> answers = answerer.answer(contextOfTheQuestion, questionToAsk);

Более подробную информацию смотрите в исходном коде .

Запустить вывод в Swift

Шаг 1. Импортируйте CocoaPods

Добавьте модуль TensorFlowLiteTaskText в Podfile.

target 'MySwiftAppWithTaskAPI' do
  use_frameworks!
  pod 'TensorFlowLiteTaskText', '~> 0.4.4'
end

Шаг 2. Запустите логический вывод с помощью API

// Initialization
let mobileBertAnswerer = TFLBertQuestionAnswerer.questionAnswerer(
      modelPath: mobileBertModelPath)

// Run inference
let answers = mobileBertAnswerer.answer(
      context: context, question: question)

Более подробную информацию смотрите в исходном коде .

Запустить вывод на C++

// Initialization
BertQuestionAnswererOptions options;
options.mutable_base_options()->mutable_model_file()->set_file_name(model_path);
std::unique_ptr<BertQuestionAnswerer> answerer = BertQuestionAnswerer::CreateFromOptions(options).value();

// Run inference with your inputs, `context_of_question` and `question_to_ask`.
std::vector<QaAnswer> positive_results = answerer->Answer(context_of_question, question_to_ask);

Более подробную информацию смотрите в исходном коде .

Запустить вывод в Python

Шаг 1. Установите пакет pip

pip install tflite-support

Шаг 2: Использование модели

# Imports
from tflite_support.task import text

# Initialization
answerer = text.BertQuestionAnswerer.create_from_file(model_path)

# Run inference
bert_qa_result = answerer.answer(context, question)

Дополнительные параметры настройки BertQuestionAnswerer см. в исходном коде .

Примеры результатов

Вот пример результатов ответа модели ALBERT .

Контекст: «Тропический лес Амазонки, альтернативно, джунгли Амазонки, также известный на английском языке как Амазония, представляет собой влажный широколиственный тропический лес в биоме Амазонки, который покрывает большую часть бассейна Амазонки в Южной Америке. Этот бассейн охватывает 7 000 000 км2 (2 700 000 квадратных миль). ), из которых 5 500 000 км2 (2 100 000 квадратных миль) покрыты тропическими лесами. Этот регион включает территорию, принадлежащую девяти странам».

Вопрос: «Где находятся тропические леса Амазонки?»

Ответы:

answer[0]:  'South America.'
logit: 1.84847, start_index: 39, end_index: 40
answer[1]:  'most of the Amazon basin of South America.'
logit: 1.2921, start_index: 34, end_index: 40
answer[2]:  'the Amazon basin of South America.'
logit: -0.0959535, start_index: 36, end_index: 40
answer[3]:  'the Amazon biome that covers most of the Amazon basin of South America.'
logit: -0.498558, start_index: 28, end_index: 40
answer[4]:  'Amazon basin of South America.'
logit: -0.774266, start_index: 37, end_index: 40

Попробуйте простой демонстрационный инструмент CLI для BertQuestionAnswerer с вашей собственной моделью и тестовыми данными.

Требования совместимости модели

API BertQuestionAnswerer ожидает модель TFLite с обязательными метаданными модели TFLite .

Метаданные должны отвечать следующим требованиям:

input_process_units для токенизатора Wordpiece/Sentencepiece
3 входных тензора с именами «ids», «mask» и «segment_ids» для вывода токенизатора.
2 выходных тензора с именами «end_logits» и «start_logits», чтобы указать относительное положение ответа в контексте.