¡El Día de la Comunidad de ML es el 9 de noviembre! Únase a nosotros para recibir actualizaciones de TensorFlow, JAX, y más Más información

amazon_us×

  • Descripción:

Reseñas de clientes de Amazon (también conocidas como Reseñas de productos) es uno de los productos icónicos de Amazons. En un período de más de dos décadas desde la primera revisión en 1995, millones de clientes de Amazon han contribuido con más de cien millones de reseñas para expresar opiniones y describir sus experiencias con respecto a productos en el sitio web Amazon.com. Esto convierte a Amazon Customer Reviews en una rica fuente de información para investigadores académicos en los campos de procesamiento del lenguaje natural (NLP), recuperación de información (IR) y aprendizaje automático (ML), entre otros. En consecuencia, estamos publicando estos datos para futuras investigaciones en múltiples disciplinas relacionadas con la comprensión de las experiencias de los productos de los clientes. Específicamente, este conjunto de datos se construyó para representar una muestra de las evaluaciones y opiniones de los clientes, la variación en la percepción de un producto en las regiones geográficas y la intención o sesgo promocional en las reseñas.

Más de 130 millones de reseñas de clientes están disponibles para los investigadores como parte de esta versión. Los datos están disponibles en archivos TSV en el bucket de amazon-reviews-pds S3 en la región este de EE. UU. De AWS. Cada línea de los archivos de datos corresponde a una revisión individual (delimitada por tabulaciones, sin comillas ni caracteres de escape).

Cada conjunto de datos contiene las siguientes columnas: mercado: código de país de 2 letras del mercado donde se escribió la reseña. customer_id: identificador aleatorio que se puede usar para agregar reseñas escritas por un solo autor. review_id: el ID único de la reseña. product_id: el ID de producto único al que pertenece la reseña. En el conjunto de datos multilingüe, las reseñas del mismo producto en diferentes países se pueden agrupar por el mismo product_id. product_parent: identificador aleatorio que se puede usar para agregar reseñas para el mismo producto. product_title: título del producto. product_category: categoría de producto amplia que se puede usar para agrupar reseñas (también se usa para agrupar el conjunto de datos en partes coherentes). star_rating: la calificación de 1 a 5 estrellas de la reseña. helpful_votes: número de votos útiles. total_votes: número total de votos que recibió la reseña. vine: la reseña se escribió como parte del programa Vine. Verified_purchase: la reseña corresponde a una compra verificada. review_headline: el título de la reseña. review_body: el texto de la reseña. review_date: la fecha en que se escribió la revisión.

FeaturesDict({
    'data': FeaturesDict({
        'customer_id': tf.string,
        'helpful_votes': tf.int32,
        'marketplace': tf.string,
        'product_category': tf.string,
        'product_id': tf.string,
        'product_parent': tf.string,
        'product_title': tf.string,
        'review_body': tf.string,
        'review_date': tf.string,
        'review_headline': tf.string,
        'review_id': tf.string,
        'star_rating': tf.int32,
        'total_votes': tf.int32,
        'verified_purchase': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
        'vine': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    }),
})

amazon_us× / Wireless_v1_00 (configuración predeterminada)

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Wireless_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión como se especifica con él.

  • Tamaño del paquete: 1.59 GiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 9,002,021

amazon_us× / Watches_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Watches_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión como se especifica con él.

  • Tamaño del paquete: 155.42 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 960,872

amazon_us× / Video_Games_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Video_Games_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión según lo especificado.

  • Tamaño del paquete: 453.19 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 1,785,997

amazon_us× / Video_DVD_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Video_DVD_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión según lo especificado.

  • Tamaño del paquete: 1.41 GiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 5,069,140

amazon_us× / Video_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Video_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión según lo especificado.

  • Tamaño del paquete: 132.49 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 380,604

amazon_us× / Toys_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Toys_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión como se especifica con él.

  • Tamaño del paquete: 799.61 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 4.864.249

amazon_us× / Tools_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Tools_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión según lo especificado.

  • Tamaño del paquete: 318.32 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 1,741,100

amazon_us× / Sports_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Sports_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión según lo especificado.

  • Tamaño del paquete: 832.06 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 4.850.360

amazon_us× / Software_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Software_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión según lo especificado.

  • Tamaño del paquete: 89.66 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 341,931

amazon_us larger / Zapatos_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Shoes_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión como se especifica con él.

  • Tamaño del paquete: 612.50 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 4.366.916

amazon_us× / Pet_Products_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Pet_Products_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión como se especifica con él.

  • Tamaño del paquete: 491.92 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 2,643,619

amazon_us× / Personal_Care_Appliances_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Personal_Care_Appliances_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión como se especifica con él.

  • Tamaño del paquete: 16.82 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 85,981

amazon_us× / PC_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon PC_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión como se especifica con él.

  • Tamaño del paquete: 1.41 GiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 6,908,554

amazon_us× / Outdoors_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Outdoors_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión como se especifica con él.

  • Tamaño del paquete: 428.16 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 2.302.401

amazon_us× / Office_Products_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Office_Products_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión como se especifica con él.

  • Tamaño del paquete: 488.59 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 2,642,434

amazon_us larger / Instrumentos_musicales_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Musical_Instruments_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión según lo especificado.

  • Tamaño del paquete: 184.43 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 904,765

amazon_us× / Music_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Music_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión como se especifica con él.

  • Tamaño del paquete: 1.42 GiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 4.751.577

amazon_us× / Mobile_Electronics_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Mobile_Electronics_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión como se especifica con él.

  • Tamaño del paquete: 21.81 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 104,975

amazon_us× / Mobile_Apps_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Mobile_Apps_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión como se especifica con él.

  • Tamaño del paquete: 532.11 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 5,033,376

amazon_us× / Major_Appliances_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Major_Appliances_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión como se especifica con él.

  • Tamaño del paquete: 23.23 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 96,901

amazon_us× / Luggage_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Luggage_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión como se especifica con él.

  • Tamaño del paquete: 57.53 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 348,657

amazon_us 0000- / Lawn_and_Garden_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Lawn_and_Garden_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión según lo especificado.

  • Tamaño del paquete: 464.22 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 2,557,288

amazon_us김 / Cocina_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Kitchen_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión como se especifica con él.

  • Tamaño del paquete: 887.63 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 4.880.466

amazon_us× / Jewelry_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Jewelry_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión como se especifica con él.

  • Tamaño del paquete: 235.58 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 1,767,753

amazon_us 0000- / Mejora_del_Home_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Home_Improvement_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión según lo especificado.

  • Tamaño del paquete: 480.02 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 2,634,781

amazon_us 0000- / Home_Entertainment_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Home_Entertainment_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión según lo especificado.

  • Tamaño del paquete: 184.22 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 705,889

amazon_us went / Home_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Home_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión como se especifica con él.

  • Tamaño del paquete: 1.01 GiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 6.221.559

amazon_us 0000- / Health_Personal_Care_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Health_Personal_Care_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión como se especifica con él.

  • Tamaño del paquete: 964.34 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 5.331.449

amazon_us× / Grocery_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Grocery_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión como se especifica con él.

  • Tamaño del paquete: 382.74 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 2.402.458

amazon_us× / Gift_Card_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Gift_Card_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión según lo especificado.

  • Tamaño del paquete: 11.57 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 149.086

amazon_us× / Furniture_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Furniture_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión como se especifica con él.

  • Tamaño del paquete: 142.08 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 792,113

amazon_us× / Electronics_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Electronics_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión como se especifica con él.

  • Tamaño del paquete: 666.45 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 3,093,869

amazon_us× / Digital_Video_Games_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Digital_Video_Games_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión como se especifica con él.

  • Tamaño del paquete: 26.17 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 145,431

amazon_ustitis / Digital_Video_Download_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Digital_Video_Download_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión como se especifica con él.

  • Tamaño del paquete: 483.49 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 4.057.147

amazon_us× / Digital_Software_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Digital_Software_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión como se especifica con él.

  • Tamaño del paquete: 18.12 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 102,084

amazon_us larger / Digital_Music_Purchase_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Digital_Music_Purchase_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión como se especifica con él.

  • Tamaño del paquete: 241.82 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 1,688,884

amazon_us larger / Digital_Ebook_Purchase_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Digital_Ebook_Purchase_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión según lo especificado.

  • Tamaño del paquete: 2.51 GiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 12,520,722

amazon_us× / Camera_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Camera_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión como se especifica con él.

  • Tamaño del paquete: 422.15 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 1.801.974

amazon_us× / Books_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Books_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión como se especifica con él.

  • Tamaño del paquete: 2.55 GiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 10,319,090

amazon_us× / Beauty_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Beauty_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión como se especifica con él.

  • Tamaño del paquete: 871.73 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 5.115.666

amazon_us× / Baby_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Baby_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión como se especifica con él.

  • Tamaño del paquete: 340.84 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 1,752,932

amazon_us× / Automotive_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Automotive_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión como se especifica con él.

  • Tamaño del paquete: 555.18 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 3,514,942

amazon_us× / Apparel_v1_00

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Apparel_v1_00 en el mercado de Estados Unidos. Cada producto tiene su propia versión como se especifica con él.

  • Tamaño del paquete: 618.59 MiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 5,906,333

amazon_us larger / Digital_Ebook_Purchase_v1_01

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Digital_Ebook_Purchase_v1_01 en el mercado de Estados Unidos. Cada producto tiene su propia versión según lo especificado.

  • Tamaño del paquete: 1.21 GiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 5.101.693

amazon_us× / Books_v1_01

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Books_v1_01 en el mercado de Estados Unidos. Cada producto tiene su propia versión según lo especificado.

  • Tamaño del paquete: 2.51 GiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 6,106,719

amazon_us× / Books_v1_02

  • Descripción config: Un conjunto de datos que consiste en una revisión de los productos de Amazon Books_v1_02 en el mercado de Estados Unidos. Cada producto tiene su propia versión como se especifica con él.

  • Tamaño del paquete: 1.24 GiB

  • Fraccionamientos:

Separar Ejemplos de
'train' 3,105,520