para_crawl

  • תיאור :

תאגיד מקביל בקנה מידה אינטרנט לשפות אירופאיות רשמיות.

@misc {paracrawl,
    title  = "ParaCrawl",
    year   = "2018",
    url    = "http://paracrawl.eu/download.html."
}

para_crawl/enbg (תצורת ברירת המחדל)

  • תיאור תצורה : מערך נתונים תרגום מאנגלית ל-bg.

  • גודל הורדה : 98.94 MiB

  • גודל ערכת נתונים: 362.46 MiB

  • שמירה אוטומטית במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 1,039,885
  • מבנה תכונה :
Translation({
    'bg': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
תִרגוּם
bg טֶקסט חוּט
he טֶקסט חוּט

para_crawl/encs

  • תיאור תצורה : מערך נתונים תרגום מאנגלית ל-cs.

  • גודל הורדה : 187.31 MiB

  • גודל מערך נתונים : 666.34 MiB

  • שמירה אוטומטית במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 2,981,949
  • מבנה תכונה :
Translation({
    'cs': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
תִרגוּם
cs טֶקסט חוּט
he טֶקסט חוּט

para_crawl/enda

  • תיאור תצורה : מערך נתונים של תרגום מאנגלית ל-da.

  • גודל הורדה : 174.34 MiB

  • גודל ערכת נתונים: 619.77 MiB

  • שמירה אוטומטית במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 2,414,895
  • מבנה תכונה :
Translation({
    'da': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
תִרגוּם
דה טֶקסט חוּט
he טֶקסט חוּט

para_crawl/ende

  • תיאור תצורה : מערך נתונים של תרגום מאנגלית ל-de.

  • גודל הורדה : 1.22 GiB

  • גודל מערך נתונים : 4.04 GiB

  • שמירה אוטומטית במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 16,264,448
  • מבנה תכונה :
Translation({
    'de': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
תִרגוּם
דה טֶקסט חוּט
he טֶקסט חוּט

para_crawl/enel

  • תיאור תצורה : מערך נתונים תרגום מאנגלית ל-el.

  • גודל הורדה : 184.59 MiB

  • גודל ערכת נתונים: 698.75 MiB

  • שמירה אוטומטית במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 1,985,233
  • מבנה תכונה :
Translation({
    'el': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
תִרגוּם
אל טֶקסט חוּט
he טֶקסט חוּט

para_crawl/enes

  • תיאור תצורה : מערך נתונים תרגום מאנגלית ל-es.

  • גודל הורדה : 1.82 GiB

  • גודל מערך נתונים : 6.23 GiB

  • שמירה אוטומטית במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 21,987,267
  • מבנה תכונה :
Translation({
    'en': Text(shape=(), dtype=string),
    'es': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
תִרגוּם
he טֶקסט חוּט
es טֶקסט חוּט

para_crawl/enet

  • תיאור תצורה : מערך נתונים של תרגום מאנגלית ל-et.

  • גודל הורדה : 66.91 MiB

  • גודל ערכת נתונים: 209.16 MiB

  • שמור אוטומטי במטמון ( תיעוד ): רק כאשר shuffle_files=False (רכבת)

  • פיצולים :

לְפַצֵל דוגמאות
'train' 853,422
  • מבנה תכונה :
Translation({
    'en': Text(shape=(), dtype=string),
    'et': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
תִרגוּם
he טֶקסט חוּט
et טֶקסט חוּט

para_crawl/enfi

  • תיאור תצורה : מערך נתונים של תרגום מאנגלית ל-fi.

  • גודל הורדה : 151.83 MiB

  • גודל מערך נתונים : 543.85 MiB

  • שמירה אוטומטית במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 2,156,069
  • מבנה תכונה :
Translation({
    'en': Text(shape=(), dtype=string),
    'fi': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
תִרגוּם
he טֶקסט חוּט
fi טֶקסט חוּט

para_crawl/enfr

  • תיאור תצורה : מערך נתונים תרגום מאנגלית ל-fr.

  • גודל הורדה : 2.63 GiB

  • גודל מערך נתונים : 9.04 GiB

  • שמירה אוטומטית במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 31,374,161
  • מבנה תכונה :
Translation({
    'en': Text(shape=(), dtype=string),
    'fr': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
תִרגוּם
he טֶקסט חוּט
fr טֶקסט חוּט

para_crawl/enga

  • תיאור תצורה : מערך נתונים של תרגום מאנגלית ל-ga.

  • גודל הורדה : 28.03 MiB

  • גודל מערך נתונים : 107.09 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 357,399
  • מבנה תכונה :
Translation({
    'en': Text(shape=(), dtype=string),
    'ga': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
תִרגוּם
he טֶקסט חוּט
ga טֶקסט חוּט

para_crawl/enhr

  • תיאור תצורה : מערך נתונים תרגום מאנגלית ל-hr.

  • גודל הורדה : 80.97 MiB

  • גודל ערכת נתונים: 256.37 MiB

  • שמירה אוטומטית במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 1,002,053
  • מבנה תכונה :
Translation({
    'en': Text(shape=(), dtype=string),
    'hr': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
תִרגוּם
he טֶקסט חוּט
שעה טֶקסט חוּט

para_crawl/enhu

  • תיאור תצורה : מערך נתונים של תרגום מאנגלית ל-hu.

  • גודל הורדה : 114.24 MiB

  • גודל מערך נתונים : 421.40 MiB

  • שמירה אוטומטית במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 1,901,342
  • מבנה תכונה :
Translation({
    'en': Text(shape=(), dtype=string),
    'hu': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
תִרגוּם
he טֶקסט חוּט
hu טֶקסט חוּט

para_crawl/enit

  • תיאור תצורה : תרגום מערך נתונים מאנגלית אליו.

  • גודל הורדה : 1017.30 MiB

  • גודל מערך נתונים : 3.36 GiB

  • שמירה אוטומטית במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 12,162,239
  • מבנה תכונה :
Translation({
    'en': Text(shape=(), dtype=string),
    'it': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
תִרגוּם
he טֶקסט חוּט
זה טֶקסט חוּט

para_crawl/enlt

  • תיאור תצורה : מערך נתונים תרגום מאנגלית ל-lt.

  • גודל הורדה : 63.28 MiB

  • גודל ערכת נתונים: 204.70 MiB

  • שמור אוטומטי במטמון ( תיעוד ): רק כאשר shuffle_files=False (רכבת)

  • פיצולים :

לְפַצֵל דוגמאות
'train' 844,643
  • מבנה תכונה :
Translation({
    'en': Text(shape=(), dtype=string),
    'lt': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
תִרגוּם
he טֶקסט חוּט
לט טֶקסט חוּט

para_crawl/enlv

  • תיאור תצורה : מערך נתונים תרגום מאנגלית ל-lv.

  • גודל הורדה : 45.17 MiB

  • גודל מערך נתונים : 147.09 MiB

  • שמור אוטומטי במטמון ( תיעוד ): רק כאשר shuffle_files=False (רכבת)

  • פיצולים :

לְפַצֵל דוגמאות
'train' 553,060
  • מבנה תכונה :
Translation({
    'en': Text(shape=(), dtype=string),
    'lv': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
תִרגוּם
he טֶקסט חוּט
lv טֶקסט חוּט

para_crawl/enmt

  • תיאור תצורה : מערך נתונים תרגום מאנגלית ל-mt.

  • גודל הורדה : 18.15 MiB

  • גודל ערכת נתונים: 54.36 MiB

  • שמור אוטומטי במטמון ( תיעוד ): כן

  • פיצולים :

לְפַצֵל דוגמאות
'train' 195,502
  • מבנה תכונה :
Translation({
    'en': Text(shape=(), dtype=string),
    'mt': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
תִרגוּם
he טֶקסט חוּט
הר טֶקסט חוּט

para_crawl/ennl

  • תיאור תצורה : מערך נתונים של תרגום מאנגלית ל-nl.

  • גודל הורדה : 400.63 MiB

  • גודל מערך נתונים : 1.40 GiB

  • שמירה אוטומטית במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 5,659,268
  • מבנה תכונה :
Translation({
    'en': Text(shape=(), dtype=string),
    'nl': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
תִרגוּם
he טֶקסט חוּט
nl טֶקסט חוּט

para_crawl/enpl

  • תיאור תצורה : מערך נתונים של תרגום מאנגלית ל-pl.

  • גודל הורדה : 257.90 MiB

  • גודל ערכת נתונים: 885.63 MiB

  • שמירה אוטומטית במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 3,503,276
  • מבנה תכונה :
Translation({
    'en': Text(shape=(), dtype=string),
    'pl': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
תִרגוּם
he טֶקסט חוּט
pl טֶקסט חוּט

para_crawl/enpt

  • תיאור תצורה : מערך נתונים תרגום מאנגלית ל- pt.

  • גודל הורדה : 608.62 MiB

  • גודל מערך נתונים : 2.05 GiB

  • שמירה אוטומטית במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 8,141,940
  • מבנה תכונה :
Translation({
    'en': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
תִרגוּם
he טֶקסט חוּט
pt טֶקסט חוּט

para_crawl/enro

  • תיאור תצורה : מערך נתונים של תרגום מאנגלית ל-ro.

  • גודל הורדה : 153.24 MiB

  • גודל ערכת נתונים: 534.34 MiB

  • שמירה אוטומטית במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 1,952,043
  • מבנה תכונה :
Translation({
    'en': Text(shape=(), dtype=string),
    'ro': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
תִרגוּם
he טֶקסט חוּט
ro טֶקסט חוּט

para_crawl/ensk

  • תיאור תצורה : מערך נתונים תרגום מאנגלית ל-sk.

  • גודל הורדה : 96.61 MiB

  • גודל ערכת נתונים: 352.91 MiB

  • שמירה אוטומטית במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 1,591,831
  • מבנה תכונה :
Translation({
    'en': Text(shape=(), dtype=string),
    'sk': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
תִרגוּם
he טֶקסט חוּט
sk טֶקסט חוּט

para_crawl/ensl

  • תיאור תצורה : מערך נתונים תרגום מאנגלית ל-SL.

  • גודל הורדה : 62.02 MiB

  • גודל ערכת נתונים: 187.66 MiB

  • שמור אוטומטי במטמון ( תיעוד ): רק כאשר shuffle_files=False (רכבת)

  • פיצולים :

לְפַצֵל דוגמאות
'train' 660,161
  • מבנה תכונה :
Translation({
    'en': Text(shape=(), dtype=string),
    'sl': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
תִרגוּם
he טֶקסט חוּט
sl טֶקסט חוּט

para_crawl/ensv

  • תיאור תצורה : מערך נתונים תרגום מאנגלית ל-sv.

  • גודל הורדה : 262.76 MiB

  • גודל מערך נתונים : 905.72 MiB

  • שמירה אוטומטית במטמון ( תיעוד ): לא

  • פיצולים :

לְפַצֵל דוגמאות
'train' 3,476,729
  • מבנה תכונה :
Translation({
    'en': Text(shape=(), dtype=string),
    'sv': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
תִרגוּם
he טֶקסט חוּט
sv טֶקסט חוּט