c4_wsrs

  • বর্ণনা :

একটি মেডিকেল সংক্ষিপ্ত বিবরণ সম্প্রসারণ ডেটাসেট যা C4 ডেটাসেটে ওয়েব-স্কেল রিভার্স প্রতিস্থাপন (wsrs) প্রয়োগ করে, যা কমন ক্রলের ওয়েব ক্রল কর্পাসের একটি বিশাল, পরিষ্কার সংস্করণ।

মূল উৎস হল কমন ক্রল ডেটাসেট: https://commoncrawl.org

বিভক্ত উদাহরণ
'train' 9,575,852
'validation' 991,422
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'abbreviated_snippet': Text(shape=(), dtype=string),
    'original_snippet': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
সংক্ষিপ্ত_স্নিপেট পাঠ্য স্ট্রিং
original_snippet পাঠ্য স্ট্রিং
  • উদ্ধৃতি :

c4_wsrs/ডিফল্ট (ডিফল্ট কনফিগারেশন)