Pomoc chronić Wielkiej Rafy Koralowej z TensorFlow na Kaggle Dołącz Wyzwanie

obiektyw filmowy

  • opis:

Ten zestaw danych zawiera zestaw ocen filmów z witryny MovieLens, usługi rekomendacji filmów. Ten zestaw danych zebrano i utrzymywane przez GroupLens , grupy badawczej na Uniwersytecie Minnesota. Dostępnych jest 5 wersji: "25m", "najnowsza-mała", "100k", "1m", "20m". We wszystkich zestawach danych dane filmów i dane ocen są połączone w „movieId”. Zestaw danych o długości 25 m, najnowszy mały zestaw danych i zestaw danych o długości 20 m zawiera tylko dane dotyczące filmów i dane ocen. Zbiór danych 1m i zbiór danych 100k zawiera dane demograficzne oprócz danych dotyczących filmów i ocen.

  • „25m”: to najnowsza stabilna wersja zestawu danych MovieLens. Zalecany do celów badawczych.
  • „latest-small”: jest to mały podzbiór najnowszej wersji zestawu danych MovieLens. Z czasem jest zmieniany i aktualizowany przez GroupLens.
  • „100k”: to najstarsza wersja zestawów danych MovieLens. Jest to mały zbiór danych z danymi demograficznymi.
  • „1m”: to największy zbiór danych MovieLens zawierający dane demograficzne.
  • „20m”: jest to jeden z najczęściej używanych zestawów danych MovieLens w artykułach akademickich wraz z zestawem danych 1m.

W przypadku każdej wersji użytkownicy mogą wyświetlać tylko dane filmów, dodając sufiks „-movies” (np. „25m-movies”) lub dane ocen połączone z danymi filmów (oraz dane użytkowników w zestawach danych 1m i 100k), dodając przyrostek „-ratings” (np. „25m-ratings”).

Poniższe funkcje są zawarte we wszystkich wersjach z przyrostkiem „-oceny”.

  • „movie_id”: unikalny identyfikator ocenianego filmu
  • "movie_title": tytuł ocenianego filmu z rokiem wydania w nawiasach
  • „movie_genres”: sekwencja gatunków, do których należy oceniany film
  • "user_id": unikalny identyfikator użytkownika, który dokonał oceny
  • „user_rating”: wynik oceny w pięciogwiazdkowej skali
  • „znacznik czasowy”: znacznik czasowy ocen wyrażony w sekundach od północy uniwersalnego czasu koordynowanego (UTC) 1 stycznia 1970 r.

Wersje „100k-ratings” i „1m-ratings” dodatkowo zawierają następujące cechy demograficzne.

  • "user_gender": płeć użytkownika, który dokonał oceny; prawdziwa wartość odpowiada mężczyźnie
  • "bucketized_user_age": zbiorcze wartości wieku użytkownika, który dokonał oceny, wartości i odpowiadające im zakresy to:
    • 1: „Poniżej 18 lat”
    • 18: „18-24”
    • 25: "25-34"
    • 35: "35-44"
    • 45: „45-49”
    • 50: "50-55"
    • 56: „56+”
  • „user_occupation_label”: zawód użytkownika, który dokonał oceny, reprezentowany przez etykietę zakodowaną w liczbach całkowitych; etykiety są wstępnie przetwarzane, aby były spójne w różnych wersjach
  • "user_occupation_text": zawód użytkownika, który dokonał oceny w oryginalnym ciągu; różne wersje mogą mieć różne zestawy surowych etykiet tekstowych
  • "user_zip_code": kod pocztowy użytkownika, który dokonał oceny

Ponadto zbiór danych „100k-ratings” miałby również funkcję „raw_user_age”, która jest dokładnym wiekiem użytkowników, którzy dokonali oceny

Zestawy danych z sufiksem „-movies” zawierają tylko funkcje „movie_id”, „movie_title” i „movie_genres”.

@article{10.1145/2827872,
author = {Harper, F. Maxwell and Konstan, Joseph A.},
title = {The MovieLens Datasets: History and Context},
year = {2015},
issue_date = {January 2016},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
volume = {5},
number = {4},
issn = {2160-6455},
url = {https://doi.org/10.1145/2827872},
doi = {10.1145/2827872},
journal = {ACM Trans. Interact. Intell. Syst.},
month = dec,
articleno = {19},
numpages = {19},
keywords = {Datasets, recommendations, ratings, MovieLens}
}

movielens/25m-ratings (konfiguracja domyślna)

  • Opis config: Ten zestaw danych zawiera ocen 25,000,095 całej 62,423 filmach, stworzony przez 162,541 użytkowników między 09 stycznia 1995 a 21 listopada,
  • Ten zestaw danych to najnowsza stabilna wersja zestawu danych MovieLens, wygenerowana 21 listopada 2019 r.

Każdy użytkownik ocenił co najmniej 20 filmów. Oceny są w przyrostach co pół gwiazdki. Ten zbiór danych nie zawiera danych demograficznych.

  • Wielkość pliku: 249.84 MiB

  • Zestaw danych rozmiar: 3.89 GiB

  • Auto-buforowane ( dokumentacja ): Nie

  • dzieli:

Podział Przykłady
'train' 25 000 095
  • Cechy:
FeaturesDict({
    'movie_genres': Sequence(ClassLabel(shape=(), dtype=tf.int64, num_classes=21)),
    'movie_id': tf.string,
    'movie_title': tf.string,
    'timestamp': tf.int64,
    'user_id': tf.string,
    'user_rating': tf.float32,
})

film/25m-filmy

  • Opis config: Ten zestaw danych zawiera dane o 62,423 filmów ocenianych w zbiorze 25m.

  • Wielkość pliku: 249.84 MiB

  • Zbiór danych Rozmiar: 5.71 MiB

  • Auto-buforowane ( dokumentacja ): Tak

  • dzieli:

Podział Przykłady
'train' 62,423
  • Cechy:
FeaturesDict({
    'movie_genres': Sequence(ClassLabel(shape=(), dtype=tf.int64, num_classes=21)),
    'movie_id': tf.string,
    'movie_title': tf.string,
})

obiektywy filmowe/ostatnie-małe-oceny

  • Opis config: Ten zestaw danych zawiera ocen 100,836 całej 9,742 filmów, stworzonych przez 610 użytkowników między 29 marca 1996 a 24 września 2018. Ten zestaw danych jest generowany na 26 września 2018 roku i jest podzbiorem pełnego najnowszej wersji zestawu danych MovieLens . Ten zbiór danych jest zmieniany i aktualizowany w czasie.

Każdy użytkownik ocenił co najmniej 20 filmów. Oceny są w przyrostach co pół gwiazdki. Ten zbiór danych nie zawiera danych demograficznych.

  • Wielkość pliku: 955.28 KiB

  • Zbiór danych rozmiar: 15.82 MiB

  • Auto-buforowane ( dokumentacja ): Tak

  • dzieli:

Podział Przykłady
'train' 100 836
  • Cechy:
FeaturesDict({
    'movie_genres': Sequence(ClassLabel(shape=(), dtype=tf.int64, num_classes=21)),
    'movie_id': tf.string,
    'movie_title': tf.string,
    'timestamp': tf.int64,
    'user_id': tf.string,
    'user_rating': tf.float32,
})

obiektywy filmowe/ostatnie-małe-filmy

  • Opis config: Ten zestaw danych zawiera dane o 9,742 filmów ocenianych w najnowszej małym zbiorze.

  • Wielkość pliku: 955.28 KiB

  • Zbiór danych rozmiar: 910.64 KiB

  • Auto-buforowane ( dokumentacja ): Tak

  • dzieli:

Podział Przykłady
'train' 9742
  • Cechy:
FeaturesDict({
    'movie_genres': Sequence(ClassLabel(shape=(), dtype=tf.int64, num_classes=21)),
    'movie_id': tf.string,
    'movie_title': tf.string,
})

obiektywy filmowe/100k-ratings

  • Opis config: Ten zestaw danych zawiera 100.000 ocen od 943 użytkowników 1,682 filmów. Ten zestaw danych jest najstarszą wersją zestawu danych MovieLens.

Każdy użytkownik ocenił co najmniej 20 filmów. Oceny są podawane w odstępach pełnych gwiazdek. Ten zbiór danych oprócz danych o filmach i ocenach zawiera dane demograficzne użytkowników.

  • Wielkość pliku: 4.70 MiB

  • Zbiór danych rozmiar: 32.41 MiB

  • Auto-buforowane ( dokumentacja ): Tak

  • dzieli:

Podział Przykłady
'train' 100 000
  • Cechy:
FeaturesDict({
    'bucketized_user_age': tf.float32,
    'movie_genres': Sequence(ClassLabel(shape=(), dtype=tf.int64, num_classes=21)),
    'movie_id': tf.string,
    'movie_title': tf.string,
    'raw_user_age': tf.float32,
    'timestamp': tf.int64,
    'user_gender': tf.bool,
    'user_id': tf.string,
    'user_occupation_label': ClassLabel(shape=(), dtype=tf.int64, num_classes=22),
    'user_occupation_text': tf.string,
    'user_rating': tf.float32,
    'user_zip_code': tf.string,
})

obiektywy filmowe/100k-filmy

  • Opis config: Ten zestaw danych zawiera dane o 1,682 filmów ocenianych w zbiorze 100k.

  • Wielkość pliku: 4.70 MiB

  • Zbiór danych rozmiar: 150.35 KiB

  • Auto-buforowane ( dokumentacja ): Tak

  • dzieli:

Podział Przykłady
'train' 1,682
  • Cechy:
FeaturesDict({
    'movie_genres': Sequence(ClassLabel(shape=(), dtype=tf.int64, num_classes=21)),
    'movie_id': tf.string,
    'movie_title': tf.string,
})

obiektyw filmowy/1m-oceny

  • Opis config: Ten zestaw danych zawiera 1,000,209 ocen Anonimowi około 3900 filmów wykonanych przez 6,040 MovieLens użytkowników, którzy przystąpili w MovieLens
  • Ten zbiór danych jest największym zbiorem danych, który zawiera dane demograficzne.

Każdy użytkownik ocenił co najmniej 20 filmów. Oceny są podawane w odstępach pełnych gwiazdek. W danych demograficznych wartości wieku są podzielone na przedziały, a w danych zamiast wartości rzeczywistych stosowana jest najniższa wartość wieku dla każdego przedziału.

  • Wielkość pliku: 5.64 MiB

  • Zbiór danych rozmiar: 308.42 MiB

  • Auto-buforowane ( dokumentacja ): Nie

  • dzieli:

Podział Przykłady
'train' 1 000 209
  • Cechy:
FeaturesDict({
    'bucketized_user_age': tf.float32,
    'movie_genres': Sequence(ClassLabel(shape=(), dtype=tf.int64, num_classes=21)),
    'movie_id': tf.string,
    'movie_title': tf.string,
    'timestamp': tf.int64,
    'user_gender': tf.bool,
    'user_id': tf.string,
    'user_occupation_label': ClassLabel(shape=(), dtype=tf.int64, num_classes=22),
    'user_occupation_text': tf.string,
    'user_rating': tf.float32,
    'user_zip_code': tf.string,
})

film/obiektyw/1m-filmy

  • Opis config: Ten zestaw danych zawiera dane dotyczące około 3900 filmów ocenianych w zbiorze 1m.

  • Wielkość pliku: 5.64 MiB

  • Zbiór danych rozmiar: 351.12 KiB

  • Auto-buforowane ( dokumentacja ): Tak

  • dzieli:

Podział Przykłady
'train' 3883
  • Cechy:
FeaturesDict({
    'movie_genres': Sequence(ClassLabel(shape=(), dtype=tf.int64, num_classes=21)),
    'movie_id': tf.string,
    'movie_title': tf.string,
})

obiektyw filmowy/ocena 20m

  • Opis config: Ten zestaw danych zawiera ocen 20,000,263 całej 27,278 filmów, stworzonych przez 138,493 użytkowników między 09 stycznia 1995 a 31 marca 2015. Ten zestaw danych została utworzona na 17 października 2016 r.

Każdy użytkownik ocenił co najmniej 20 filmów. Oceny są z dokładnością do pół gwiazdki. Ten zbiór danych nie zawiera danych demograficznych.

  • Wielkość pliku: 189.50 MiB

  • Zbiór danych rozmiar: 3.10 GiB

  • Auto-buforowane ( dokumentacja ): Nie

  • dzieli:

Podział Przykłady
'train' 20 000 263
  • Cechy:
FeaturesDict({
    'movie_genres': Sequence(ClassLabel(shape=(), dtype=tf.int64, num_classes=21)),
    'movie_id': tf.string,
    'movie_title': tf.string,
    'timestamp': tf.int64,
    'user_id': tf.string,
    'user_rating': tf.float32,
})

obiektywy filmowe/filmy 20m

  • Opis config: Ten zestaw danych zawiera dane o 27,278 filmów ocenianych w zbiorze 20m

  • Wielkość pliku: 189.50 MiB

  • Zbiór danych Rozmiar: 2.55 MiB

  • Auto-buforowane ( dokumentacja ): Tak

  • dzieli:

Podział Przykłady
'train' 27 278
  • Cechy:
FeaturesDict({
    'movie_genres': Sequence(ClassLabel(shape=(), dtype=tf.int64, num_classes=21)),
    'movie_id': tf.string,
    'movie_title': tf.string,
})