एमएल समुदाय दिवस 9 नवंबर है! TensorFlow, JAX से नई जानकारी के लिए हमसे जुड़ें, और अधिक जानें

हिला देेंगे

  • विवरण:

इस डेटासेट में 14,344,391 पासवर्ड हैं जो विभिन्न साइटों से लीक या चोरी हुए थे। इस डेटासेट के लेखक का कहना है कि "मैं उन्हें होस्ट कर रहा हूं क्योंकि ऐसा लगता है कि कोई और नहीं करता है (उम्मीद है कि ऐसा इसलिए नहीं है क्योंकि उन्हें होस्ट करना अवैध है :))। स्वाभाविक रूप से, मैं वह नहीं हूं जिसने इन्हें चुराया है; मैंने बस पाया उन्हें ऑनलाइन किया, किसी भी नाम/ईमेल पते/आदि को हटा दिया।"

इस डेटासेट का उपयोग पासवर्ड अनुमान लगाने और क्रैक करने के लिए मशीन लर्निंग मॉडल को प्रशिक्षित करने के लिए किया जाता है।

विभाजित करना उदाहरण
'train' १४,३४४,३९१
  • विशेषताएं:
FeaturesDict({
    'password': Text(shape=(), dtype=tf.string),
})
  • प्रशस्ति पत्र: