sci_tail

  • বর্ণনা :

SciTail ডেটাসেট হল একটি এনটেইলমেন্ট ডেটাসেট যা একাধিক পছন্দের বিজ্ঞান পরীক্ষা এবং ওয়েব বাক্য থেকে তৈরি করা হয়েছে। প্রতিটি প্রশ্ন এবং সঠিক উত্তর পছন্দকে অনুমান গঠনের জন্য একটি দৃঢ় বিবৃতিতে রূপান্তরিত করা হয়। তথ্য পুনরুদ্ধার ব্যবহার করা হয় ওয়েব বাক্যের একটি বৃহৎ টেক্সট কর্পাস থেকে প্রাসঙ্গিক টেক্সট পেতে, এবং এই বাক্যগুলিকে একটি ভিত্তি P হিসাবে ব্যবহার করা হয়। এই ধরনের প্রিমিস-অনুমান জোড়ার টীকা ক্রাউডসোর্স করা হয় সমর্থন (এনটেইল) বা না (নিরপেক্ষ), ক্রমানুসারে। SciTail ডেটাসেট তৈরি করতে। ডেটাসেটে 27,026টি উদাহরণ রয়েছে যার 10,101টি এনটেল লেবেল সহ এবং 16,925টি নিরপেক্ষ লেবেল সহ উদাহরণ রয়েছে৷

বিভক্ত উদাহরণ
'test' 2,126
'train' 23,097
'validation' 1,304
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'hypothesis': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'premise': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
অনুমান পাঠ্য স্ট্রিং
লেবেল ক্লাসলেবেল int64
ভিত্তি পাঠ্য স্ট্রিং
  • উদ্ধৃতি :
@inproceedings{khot2018scitail,
    title={Scitail: A textual entailment dataset from science question answering},
    author={Khot, Tushar and Sabharwal, Ashish and Clark, Peter},
    booktitle={Proceedings of the 32th AAAI Conference on Artificial Intelligence (AAAI 2018)},
    url = "http://ai2-website.s3.amazonaws.com/publications/scitail-aaai-2018_cameraready.pdf",
    year={2018}
}