Интегрируйте ответчик на вопросы BERT

Оптимизируйте свои подборки Сохраняйте и классифицируйте контент в соответствии со своими настройками.

API библиотеки задач BertQuestionAnswerer загружает модель Bert и отвечает на вопросы на основе содержания данного отрывка. Для получения дополнительной информации см. документацию по модели «Вопрос-ответ» здесь .

Основные возможности API BertQuestionAnswerer

  • Принимает два текстовых ввода как вопрос и контекст и выводит список возможных ответов.

  • Выполняет токенизацию Wordpiece или Sentencepiece вне графика для входного текста.

Поддерживаемые модели BertQuestionAnswerer

Следующие модели совместимы с BertNLClassifier API.

Выполнить вывод в Java

Шаг 1: Импорт зависимости Gradle и других настроек

Скопируйте файл модели .tflite в каталог активов модуля Android, где будет запускаться модель. Укажите, что файл не должен быть сжат, и добавьте библиотеку TensorFlow Lite в файл build.gradle модуля:

android {
    // Other settings

    // Specify tflite file should not be compressed for the app apk
    aaptOptions {
        noCompress "tflite"
    }

}

dependencies {
    // Other dependencies

    // Import the Task Text Library dependency (NNAPI is included)
    implementation 'org.tensorflow:tensorflow-lite-task-text:0.3.0'
}

Шаг 2. Выполните вывод с помощью API

// Initialization
BertQuestionAnswererOptions options =
    BertQuestionAnswererOptions.builder()
        .setBaseOptions(BaseOptions.builder().setNumThreads(4).build())
        .build();
BertQuestionAnswerer answerer =
    BertQuestionAnswerer.createFromFileAndOptions(
        androidContext, modelFile, options);

// Run inference
List<QaAnswer> answers = answerer.answer(contextOfTheQuestion, questionToAsk);

См. исходный код для более подробной информации.

Запустить вывод в Swift

Шаг 1: Импортируйте CocoaPods

Добавьте модуль TensorFlowLiteTaskText в файл Podfile.

target 'MySwiftAppWithTaskAPI' do
  use_frameworks!
  pod 'TensorFlowLiteTaskText', '~> 0.2.0'
end

Шаг 2. Выполните вывод с помощью API

// Initialization
let mobileBertAnswerer = TFLBertQuestionAnswerer.questionAnswerer(
      modelPath: mobileBertModelPath)

// Run inference
let answers = mobileBertAnswerer.answer(
      context: context, question: question)

См. исходный код для более подробной информации.

Запустить вывод на C++

// Initialization
BertQuestionAnswererOptions options;
options.mutable_base_options()->mutable_model_file()->set_file_name(model_path);
std::unique_ptr<BertQuestionAnswerer> answerer = BertQuestionAnswerer::CreateFromOptions(options).value();

// Run inference with your inputs, `context_of_question` and `question_to_ask`.
std::vector<QaAnswer> positive_results = answerer->Answer(context_of_question, question_to_ask);

См. исходный код для более подробной информации.

Пример результатов

Вот пример результатов ответа модели ALBERT .

Контекст: «Тропический лес Амазонки, также известный как джунгли Амазонки, также известный на английском языке как Амазония, представляет собой влажный широколиственный тропический лес в биоме Амазонки, который покрывает большую часть бассейна Амазонки в Южной Америке. Этот бассейн охватывает 7 000 000 км2 (2 700 000 квадратных миль). ), из которых 5 500 000 км2 (2 100 000 квадратных миль) покрыты тропическим лесом. Этот регион включает территорию, принадлежащую девяти нациям».

Вопрос: Где находятся тропические леса Амазонки?

Ответы:

answer[0]:  'South America.'
logit: 1.84847, start_index: 39, end_index: 40
answer[1]:  'most of the Amazon basin of South America.'
logit: 1.2921, start_index: 34, end_index: 40
answer[2]:  'the Amazon basin of South America.'
logit: -0.0959535, start_index: 36, end_index: 40
answer[3]:  'the Amazon biome that covers most of the Amazon basin of South America.'
logit: -0.498558, start_index: 28, end_index: 40
answer[4]:  'Amazon basin of South America.'
logit: -0.774266, start_index: 37, end_index: 40

Попробуйте простой демонстрационный инструмент CLI для BertQuestionAnswerer с собственной моделью и тестовыми данными.

Требования к совместимости моделей

API BertQuestionAnswerer ожидает модель TFLite с обязательными метаданными модели TFLite .

Метаданные должны соответствовать следующим требованиям:

  • input_process_units для токенизатора Wordpiece/Sentencepiece

  • 3 входных тензора с именами «id», «mask» и «segment_ids» для вывода токенизатора

  • 2 выходных тензора с именами «end_logits» и «start_logits», чтобы указать относительное положение ответа в контексте