- Descripción :
Amazon Customer Reviews (también conocido como Product Reviews) es uno de los productos icónicos de Amazon. En un período de más de dos décadas desde la primera revisión en 1995, millones de clientes de Amazon han contribuido con más de cien millones de revisiones para expresar opiniones y describir sus experiencias con respecto a los productos en el sitio web de Amazon.com. Esto convierte a Amazon Customer Reviews en una rica fuente de información para los investigadores académicos en los campos del procesamiento del lenguaje natural (NLP), la recuperación de información (IR) y el aprendizaje automático (ML), entre otros. En consecuencia, estamos publicando estos datos para futuras investigaciones en múltiples disciplinas relacionadas con la comprensión de las experiencias de productos de los clientes. Específicamente, este conjunto de datos se construyó para representar una muestra de las evaluaciones y opiniones de los clientes, la variación en la percepción de un producto entre regiones geográficas y la intención promocional o el sesgo en las reseñas.
Más de 130 millones de reseñas de clientes están disponibles para los investigadores como parte de este lanzamiento. Los datos están disponibles en archivos TSV en el depósito amazon-reviews-pds S3 en la región EE. UU. Este de AWS. Cada línea en los archivos de datos corresponde a una revisión individual (separada por tabuladores, sin comillas ni caracteres de escape).
Cada conjunto de datos contiene las siguientes columnas: mercado: código de país de 2 letras del mercado donde se escribió la reseña. customer_id: identificador aleatorio que se puede usar para agregar reseñas escritas por un solo autor. review_id: el ID único de la reseña. product_id: el ID de producto único al que pertenece la reseña. En el conjunto de datos multilingüe, las revisiones del mismo producto en diferentes países se pueden agrupar por el mismo product_id. product_parent: identificador aleatorio que se puede usar para agregar revisiones para el mismo producto. product_title - Título del producto. product_category: categoría de producto amplia que se puede usar para agrupar reseñas (también se usa para agrupar el conjunto de datos en partes coherentes). star_rating: la calificación de 1 a 5 estrellas de la reseña. útil_votos - Número de votos útiles. total_votes: número total de votos que recibió la reseña. vine: la reseña se escribió como parte del programa Vine. Verified_purchase: la reseña se encuentra en una compra verificada. review_headline: el título de la reseña. review_body - El texto de la reseña. review_date: la fecha en que se escribió la reseña.
Página de inicio: https://s3.amazonaws.com/amazon-reviews-pds/readme.html
Código fuente :
tfds.structured.AmazonUSReviews
Versiones :
-
0.1.0
(predeterminado): Sin notas de la versión.
-
Tamaño del conjunto de datos :
Unknown size
Auto-caché ( documentación ): Desconocido
Estructura de características :
FeaturesDict({
'data': FeaturesDict({
'customer_id': tf.string,
'helpful_votes': tf.int32,
'marketplace': tf.string,
'product_category': tf.string,
'product_id': tf.string,
'product_parent': tf.string,
'product_title': tf.string,
'review_body': tf.string,
'review_date': tf.string,
'review_headline': tf.string,
'review_id': tf.string,
'star_rating': tf.int32,
'total_votes': tf.int32,
'verified_purchase': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
'vine': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
datos | CaracterísticasDict | |||
datos/id_cliente | Tensor | tf.cadena | ||
datos/votos_útiles | Tensor | tf.int32 | ||
datos/mercado | Tensor | tf.cadena | ||
datos/categoría_producto | Tensor | tf.cadena | ||
datos/id_producto | Tensor | tf.cadena | ||
datos/producto_padre | Tensor | tf.cadena | ||
datos/título_producto | Tensor | tf.cadena | ||
datos/cuerpo_de_la_revisión | Tensor | tf.cadena | ||
datos/revisión_fecha | Tensor | tf.cadena | ||
datos/review_headline | Tensor | tf.cadena | ||
datos/review_id | Tensor | tf.cadena | ||
datos/clasificación por estrellas | Tensor | tf.int32 | ||
datos/total_votos | Tensor | tf.int32 | ||
datos/compra_verificada | Etiqueta de clase | tf.int64 | ||
datos/vid | Etiqueta de clase | tf.int64 |
Claves supervisadas (Ver
as_supervised
doc ):None
Figura ( tfds.show_examples ): no compatible.
Ejemplos ( tfds.as_dataframe ): Falta.
Cita :
amazon_us_reviews/Wireless_v1_00 (configuración predeterminada)
Descripción de configuración : un conjunto de datos que consta de revisiones de productos Amazon Wireless_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de descarga :
1.59 GiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 9,002,021 |
amazon_us_reviews/Relojes_v1_00
Descripción de configuración : un conjunto de datos que consta de revisiones de productos Amazon Watches_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de la descarga :
155.42 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 960,872 |
amazon_us_reviews/Video_Games_v1_00
Descripción de configuración : un conjunto de datos que consta de reseñas de productos de Amazon Video_Games_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de la descarga :
453.19 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 1.785.997 |
amazon_us_reviews/Video_DVD_v1_00
Descripción de configuración : un conjunto de datos que consta de reseñas de productos de Amazon Video_DVD_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de descarga :
1.41 GiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 5,069,140 |
amazon_us_reviews/Video_v1_00
Descripción de configuración : un conjunto de datos que consta de reseñas de productos de Amazon Video_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de la descarga :
132.49 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 380,604 |
amazon_us_reviews/Juguetes_v1_00
Descripción de configuración : un conjunto de datos que consta de revisiones de productos Amazon Toys_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de la descarga :
799.61 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 4,864,249 |
amazon_us_reviews/Herramientas_v1_00
Descripción de configuración : un conjunto de datos que consta de reseñas de productos de Amazon Tools_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de la descarga :
318.32 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 1,741,100 |
amazon_us_reviews/Deportes_v1_00
Descripción de configuración : un conjunto de datos que consta de revisiones de productos Amazon Sports_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de la descarga :
832.06 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 4,850,360 |
amazon_us_reviews/Software_v1_00
Descripción de configuración : un conjunto de datos que consta de reseñas de productos de Amazon Software_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de la descarga :
89.66 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 341,931 |
amazon_us_reviews/Zapatos_v1_00
Descripción de configuración : un conjunto de datos que consta de revisiones de productos Amazon Shoes_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de la descarga :
612.50 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 4,366,916 |
amazon_us_reviews/Pet_Products_v1_00
Descripción de configuración : un conjunto de datos que consta de revisiones de productos Amazon Pet_Products_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de la descarga :
491.92 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 2,643,619 |
amazon_us_reviews/Personal_Care_Appliances_v1_00
Descripción de configuración : un conjunto de datos que consta de revisiones de productos Amazon Personal_Care_Appliances_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de la descarga :
16.82 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 85,981 |
amazon_us_reviews/PC_v1_00
Descripción de configuración : un conjunto de datos que consta de revisiones de productos Amazon PC_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de descarga :
1.41 GiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 6,908,554 |
amazon_us_reviews/Exteriores_v1_00
Descripción de configuración : un conjunto de datos que consta de reseñas de productos de Amazon Outdoors_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de la descarga :
428.16 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 2,302,401 |
amazon_us_reviews/Office_Products_v1_00
Descripción de configuración : un conjunto de datos que consta de reseñas de productos de Amazon Office_Products_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de la descarga :
488.59 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 2,642,434 |
amazon_us_reviews/Instrumentos_musicales_v1_00
Descripción de configuración : un conjunto de datos que consta de reseñas de productos de Amazon Musical_Instruments_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de la descarga :
184.43 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 904,765 |
amazon_us_reviews/Music_v1_00
Descripción de configuración : un conjunto de datos que consta de reseñas de productos de Amazon Music_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de descarga :
1.42 GiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 4,751,577 |
amazon_us_reviews/Mobile_Electronics_v1_00
Descripción de configuración : un conjunto de datos que consta de revisiones de productos Amazon Mobile_Electronics_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de la descarga :
21.81 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 104,975 |
amazon_us_reviews/Mobile_Apps_v1_00
Descripción de configuración : un conjunto de datos que consta de revisiones de productos Amazon Mobile_Apps_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de la descarga :
532.11 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 5,033,376 |
amazon_us_reviews/Major_Appliances_v1_00
Descripción de configuración : un conjunto de datos que consta de revisiones de productos Amazon Major_Appliances_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de descarga :
23.23 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 96,901 |
amazon_us_reviews/Equipaje_v1_00
Descripción de configuración : un conjunto de datos que consta de reseñas de productos Amazon Luggage_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de la descarga :
57.53 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 348,657 |
amazon_us_reviews/Lawn_and_Garden_v1_00
Descripción de configuración : un conjunto de datos que consiste en revisiones de productos Amazon Lawn_and_Garden_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de la descarga :
464.22 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 2,557,288 |
amazon_us_reviews/Cocina_v1_00
Descripción de configuración : un conjunto de datos que consta de revisiones de productos Amazon Kitchen_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de la descarga :
887.63 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 4,880,466 |
amazon_us_reviews/Jewelry_v1_00
Descripción de configuración : un conjunto de datos que consta de revisiones de productos Amazon Jewelry_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de la descarga :
235.58 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 1,767,753 |
amazon_us_reviews/Home_Improvement_v1_00
Descripción de configuración : un conjunto de datos que consta de revisiones de productos Amazon Home_Improvement_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de la descarga :
480.02 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 2,634,781 |
amazon_us_reviews/Home_Entertainment_v1_00
Descripción de configuración : un conjunto de datos que consta de revisiones de productos Amazon Home_Entertainment_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de la descarga :
184.22 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 705,889 |
amazon_us_reviews/Inicio_v1_00
Descripción de configuración : un conjunto de datos que consta de revisiones de productos Amazon Home_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de descarga :
1.01 GiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 6,221,559 |
amazon_us_reviews/Health_Personal_Care_v1_00
Descripción de configuración : un conjunto de datos que consta de revisiones de productos Amazon Health_Personal_Care_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de la descarga :
964.34 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 5,331,449 |
amazon_us_reviews/comestibles_v1_00
Descripción de configuración : un conjunto de datos que consta de revisiones de productos Amazon Grocery_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de la descarga :
382.74 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 2,402,458 |
amazon_us_reviews/Gift_Card_v1_00
Descripción de configuración : un conjunto de datos que consta de revisiones de productos Amazon Gift_Card_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de la descarga :
11.57 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 149,086 |
amazon_us_reviews/Muebles_v1_00
Descripción de configuración : un conjunto de datos que consta de reseñas de productos de Amazon Furniture_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de la descarga :
142.08 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 792,113 |
amazon_us_reviews/Electrónica_v1_00
Descripción de configuración : un conjunto de datos que consta de revisiones de productos Amazon Electronics_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de la descarga :
666.45 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 3.093.869 |
amazon_us_reviews/Digital_Video_Games_v1_00
Descripción de configuración : un conjunto de datos que consiste en revisiones de productos Amazon Digital_Video_Games_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de la descarga :
26.17 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 145,431 |
amazon_us_reviews/Digital_Video_Download_v1_00
Descripción de configuración : un conjunto de datos que consta de revisiones de productos Amazon Digital_Video_Download_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de la descarga :
483.49 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 4,057,147 |
amazon_us_reviews/Digital_Software_v1_00
Descripción de configuración : un conjunto de datos que consta de revisiones de productos Amazon Digital_Software_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de la descarga :
18.12 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 102,084 |
amazon_us_reviews/Digital_Music_Purchase_v1_00
Descripción de configuración : un conjunto de datos que consta de revisiones de productos Amazon Digital_Music_Purchase_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de la descarga :
241.82 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 1,688,884 |
amazon_us_reviews/Digital_Ebook_Purchase_v1_00
Descripción de configuración : un conjunto de datos que consta de revisiones de productos Amazon Digital_Ebook_Purchase_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de descarga :
2.51 GiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 12,520,722 |
amazon_us_reviews/Camera_v1_00
Descripción de configuración : un conjunto de datos que consta de revisiones de productos Amazon Camera_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de la descarga :
422.15 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 1,801,974 |
amazon_us_reviews/Books_v1_00
Descripción de configuración : un conjunto de datos que consta de reseñas de productos de Amazon Books_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de descarga :
2.55 GiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 10,319,090 |
amazon_us_reviews/Belleza_v1_00
Descripción de configuración : un conjunto de datos que consta de revisiones de productos Amazon Beauty_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de la descarga :
871.73 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 5,115,666 |
amazon_us_reviews/Baby_v1_00
Descripción de configuración : un conjunto de datos que consta de revisiones de productos Amazon Baby_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de la descarga :
340.84 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 1,752,932 |
amazon_us_reviews/Automoción_v1_00
Descripción de configuración : un conjunto de datos que consta de revisiones de productos Amazon Automotive_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de la descarga :
555.18 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 3.514.942 |
amazon_us_reviews/Ropa_v1_00
Descripción de configuración : un conjunto de datos que consta de revisiones de productos Amazon Apparel_v1_00 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de la descarga :
618.59 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 5,906,333 |
amazon_us_reviews/Digital_Ebook_Purchase_v1_01
Descripción de configuración : un conjunto de datos que consta de revisiones de productos Amazon Digital_Ebook_Purchase_v1_01 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de descarga :
1.21 GiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 5,101,693 |
amazon_us_reviews/Books_v1_01
Descripción de configuración : un conjunto de datos que consta de reseñas de productos de Amazon Books_v1_01 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de descarga :
2.51 GiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 6,106,719 |
amazon_us_reviews/Books_v1_02
Descripción de configuración : un conjunto de datos que consta de reseñas de productos de Amazon Books_v1_02 en el mercado de EE. UU. Cada producto tiene su propia versión como se especifica con él.
Tamaño de descarga :
1.24 GiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 3,105,520 |