Modelos escalonáveis ​​de aprendizado neural para classificar (LTR)

import tensorflow as tf
import tensorflow_datasets as tfds
import tensorflow_ranking as tfr

# Prep data
ds = tfds.load("mslr_web/10k_fold1", split="train")
ds = ds.map(lambda feature_map: {
    "_mask": tf.ones_like(feature_map["label"], dtype=tf.bool),
    **feature_map
})
ds = ds.shuffle(buffer_size=1000).padded_batch(batch_size=32)
ds = ds.map(lambda feature_map: (
    feature_map, tf.where(feature_map["_mask"], feature_map.pop("label"), -1.)))

# Create a model
inputs = {
    name: tf.keras.Input(shape=(None, 1), dtype=tf.float32, name=name)
    for name in ds.element_spec[0]
    if name != "_mask"
}
norm_inputs = [tf.keras.layers.BatchNormalization()(x) for x in inputs.values()]
x = tf.concat(norm_inputs, axis=-1)
for layer_width in [128, 64, 32]:
  x = tf.keras.layers.Dense(units=layer_width)(x)
  x = tf.keras.layers.Activation(activation=tf.nn.relu)(x)
scores = tf.squeeze(tf.keras.layers.Dense(units=1)(x), axis=-1)

# Compile and train
model = tf.keras.Model(inputs=inputs, outputs=scores)
model.compile(
    optimizer=tf.keras.optimizers.Adam(learning_rate=0.01),
    loss=tfr.keras.losses.SoftmaxLoss(),
    metrics=tfr.keras.metrics.get("ndcg", topn=5, name="NDCG@5"))
model.fit(ds, epochs=3)
Run em um Notebook

TensorFlow Ranking é uma biblioteca de código aberto para o desenvolvimento de escalável, neural aprendizagem para classificar modelos (LTR). Modelos de classificação são normalmente utilizados nos sistemas de busca e recomendação, mas também têm sido aplicados com sucesso em uma ampla variedade de campos, incluindo a tradução automática , sistemas de diálogo e-commerce , resolvedores SAT , urbanismo inteligente , e até mesmo biologia computacional.

Um modelo de classificação pega uma lista de itens (páginas da web, documentos, produtos, filmes, etc.) e gera uma lista em uma ordem otimizada, como os itens mais relevantes na parte superior e os itens menos relevantes na parte inferior, geralmente em resposta a uma consulta do usuário:

Esta biblioteca oferece suporte a funções padrão de perda pontual, emparelhada e listwise para modelos LTR. Ela também suporta uma ampla gama de métricas de classificação, incluindo média recíproco Posto (MRR) e Normalizado desconto cumulativo Gain (NDCG), para que possa avaliar e comparar estas abordagens para a sua tarefa ranking. A biblioteca de classificação também fornece funções para abordagens de classificação aprimoradas que são pesquisadas, testadas e desenvolvidas por engenheiros de aprendizado de máquina do Google.

Comece com a biblioteca Ranking TensorFlow, verificando o tutorial . Saiba mais sobre os recursos da biblioteca lendo a Visão Confira o código-fonte para TensorFlow Ranking do GitHub .