Zintegruj odpowiedź na pytania BERT

Biblioteka zadań BertQuestionAnswerer API ładuje model Berta i odpowiada na pytania na podstawie treści danego fragmentu. Aby uzyskać więcej informacji, zapoznaj się z dokumentacją modelu pytanie-odpowiedź tutaj .

Kluczowe cechy interfejsu BertQuestionAnswerer API

  • Pobiera dwa wejścia tekstowe jako pytanie i kontekst i wyświetla listę możliwych odpowiedzi.

  • Wykonuje tokenizacje Wordpiece lub Sentencepiece poza wykresem w tekście wejściowym.

Obsługiwane modele BertQuestionAnswerer

Następujące modele są kompatybilne z API BertNLClassifier .

Uruchom wnioskowanie w Javie

Krok 1: Importuj zależność Gradle i inne ustawienia

Skopiuj plik modelu .tflite do katalogu asset modułu Android, w którym będzie uruchamiany model. Określ, że plik nie powinien być skompresowany, i dodaj bibliotekę TensorFlow Lite do pliku build.gradle modułu:

android {
    // Other settings

    // Specify tflite file should not be compressed for the app apk
    aaptOptions {
        noCompress "tflite"
    }

}

dependencies {
    // Other dependencies

    // Import the Task Text Library dependency (NNAPI is included)
    implementation 'org.tensorflow:tensorflow-lite-task-text:0.3.0'
}

Krok 2: Uruchom wnioskowanie za pomocą interfejsu API

// Initialization
BertQuestionAnswererOptions options =
    BertQuestionAnswererOptions.builder()
        .setBaseOptions(BaseOptions.builder().setNumThreads(4).build())
        .build();
BertQuestionAnswerer answerer =
    BertQuestionAnswerer.createFromFileAndOptions(
        androidContext, modelFile, options);

// Run inference
List<QaAnswer> answers = answerer.answer(contextOfTheQuestion, questionToAsk);

Więcej szczegółów znajdziesz w kodzie źródłowym .

Uruchom wnioskowanie w Swift

Krok 1: Importuj CocoaPods

Dodaj tensorFlowLiteTaskText pod w pliku Podfile

target 'MySwiftAppWithTaskAPI' do
  use_frameworks!
  pod 'TensorFlowLiteTaskText', '~> 0.2.0'
end

Krok 2: Uruchom wnioskowanie za pomocą interfejsu API

// Initialization
let mobileBertAnswerer = TFLBertQuestionAnswerer.questionAnswerer(
      modelPath: mobileBertModelPath)

// Run inference
let answers = mobileBertAnswerer.answer(
      context: context, question: question)

Więcej szczegółów znajdziesz w kodzie źródłowym .

Uruchom wnioskowanie w C++

// Initialization
BertQuestionAnswererOptions options;
options.mutable_base_options()->mutable_model_file()->set_file_name(model_file);
std::unique_ptr<BertQuestionAnswerer> answerer = BertQuestionAnswerer::CreateFromOptions(options).value();

// Run inference
std::vector<QaAnswer> positive_results = answerer->Answer(context_of_question, question_to_ask);

Więcej szczegółów znajdziesz w kodzie źródłowym .

Przykładowe wyniki

Oto przykład wyników odpowiedzi modelu ALBERT .

Kontekst: „Amazoński las deszczowy, alternatywnie, amazońska dżungla, znana również po angielsku jako Amazonia, to wilgotny liściasty tropikalny las deszczowy w biomie amazońskim, który obejmuje większość dorzecza Amazonki w Ameryce Południowej. ), z czego 5 500 000 km2 (2 100 000 ²) pokrywa las deszczowy. Ten region obejmuje terytorium należące do dziewięciu narodów”.

Pytanie: „Gdzie jest las deszczowy Amazonii?”

Odpowiedzi:

answer[0]:  'South America.'
logit: 1.84847, start_index: 39, end_index: 40
answer[1]:  'most of the Amazon basin of South America.'
logit: 1.2921, start_index: 34, end_index: 40
answer[2]:  'the Amazon basin of South America.'
logit: -0.0959535, start_index: 36, end_index: 40
answer[3]:  'the Amazon biome that covers most of the Amazon basin of South America.'
logit: -0.498558, start_index: 28, end_index: 40
answer[4]:  'Amazon basin of South America.'
logit: -0.774266, start_index: 37, end_index: 40

Wypróbuj proste narzędzie demonstracyjne CLI dla BertQuestionAnswerer z własnym modelem i danymi testowymi.

Wymagania dotyczące zgodności modelu

BertQuestionAnswerer API oczekuje modelu TFLite z obowiązkowymi metadanymi modelu TFLite .

Metadane powinny spełniać następujące wymagania:

  • input_process_units dla tokenizera Wordpiece/Sentencepiece

  • 3 wejściowe tensory o nazwach „ids”, „mask” i „segment_ids” dla wyjścia tokenizera

  • 2 wyjściowe tensory o nazwach „end_logits” i „start_logits”, aby wskazać względną pozycję odpowiedzi w kontekście