• Deskripsi :

GAP adalah kumpulan data seimbang gender yang berisi 8.908 pasangan berlabel koreferensi (kata ganti ambigu, nama anteseden), diambil sampelnya dari Wikipedia dan dirilis oleh Google AI Language untuk evaluasi resolusi koreferensi dalam aplikasi praktis.

• Dokumentasi Tambahan :

• Kode sumber : `tfds.text.Gap`

• Versi :

• `0.1.0` : Rilis awal.
• `0.1.1` (default): Memperbaiki penguraian bidang boolean `A-coref` dan `B-coref` .
• Ukuran unduhan : `2.29 MiB`

• Ukuran dataset : `2.96 MiB`

• Di-cache otomatis ( dokumentasi ): Ya

• Perpecahan :

Membelah Contoh
`'test'` 2.000
`'train'` 2.000
`'validation'` 454
• Struktur fitur :
``````FeaturesDict({
'A': Text(shape=(), dtype=string),
'A-coref': bool,
'A-offset': int32,
'B': Text(shape=(), dtype=string),
'B-coref': bool,
'B-offset': int32,
'ID': Text(shape=(), dtype=string),
'Pronoun': Text(shape=(), dtype=string),
'Pronoun-offset': int32,
'Text': Text(shape=(), dtype=string),
'URL': Text(shape=(), dtype=string),
})
``````
• Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
SEBUAH Teks rangkaian
A-coref Tensor bool
A-offset Tensor int32
B Teks rangkaian
B-coref Tensor bool
B-offset Tensor int32
PENGENAL Teks rangkaian
Kata ganti Teks rangkaian
Kata ganti-offset Tensor int32
Teks Teks rangkaian
URL Teks rangkaian
