لدي سؤال؟ تواصل مع المجتمع في منتدى زيارة منتدى TensorFlow

ai2_arc

  • الوصف :

مجموعة بيانات جديدة تتكون من 7787 سؤالًا علميًا على مستوى المدرسة الابتدائية ، أسئلة علمية متعددة الخيارات ، تم تجميعها لتشجيع البحث في الإجابة على الأسئلة المتقدمة. يتم تقسيم مجموعة البيانات إلى مجموعة تحديات ومجموعة سهلة ، حيث تحتوي الأولى على أسئلة تمت الإجابة عليها بشكل غير صحيح عن طريق كل من خوارزمية قائمة على الاسترداد وخوارزمية التكرار المشترك للكلمات. نقوم أيضًا بتضمين مجموعة من أكثر من 14 مليون جملة علمية ذات صلة بالمهمة ، وتنفيذ ثلاثة نماذج أساسية عصبية لمجموعة البيانات هذه. نحن نعتبر ARC بمثابة تحدٍ للمجتمع.

FeaturesDict({
    'answerKey': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
    'choices': Sequence({
        'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=5),
        'text': Text(shape=(), dtype=tf.string),
    }),
    'id': Text(shape=(), dtype=tf.string),
    'question': Text(shape=(), dtype=tf.string),
})
@article{allenai:arc,
      author    = {Peter Clark  and Isaac Cowhey and Oren Etzioni and Tushar Khot and
                    Ashish Sabharwal and Carissa Schoenick and Oyvind Tafjord},
      title     = {Think you have Solved Question Answering? Try ARC, the AI2 Reasoning Challenge},
      journal   = {arXiv:1803.05457v1},
      year      = {2018},
}

ai2_arc / ARC-Challenge (التكوين الافتراضي)

  • وصف التكوين : مجموعة التحدي المكونة من 2590 سؤالاً "صعبًا" (تلك الأسئلة التي يفشل أسلوب الاسترداد والتواجد المشترك في الإجابة عليها بشكل صحيح)

  • حجم مجموعة البيانات : 939.91 KiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 1،172
'train' 1119
'validation' 299

ai2_arc / ARC-Easy

  • وصف التكوين : مجموعة سهلة من 5197 سؤالاً لتحدي ARC.

  • حجم مجموعة البيانات : 1.63 MiB

  • الانقسامات :

انشق، مزق أمثلة
'test' 2،376
'train' 2،251
'validation' 570