केडीडीकप99

  • विवरण :

यह तीसरे अंतर्राष्ट्रीय ज्ञान खोज और डेटा खनन उपकरण प्रतियोगिता के लिए उपयोग किया जाने वाला डेटा सेट है, जो ज्ञान खोज और डेटा खनन पर KDD-99 पांचवें अंतर्राष्ट्रीय सम्मेलन के संयोजन में आयोजित किया गया था। प्रतियोगिता का कार्य एक नेटवर्क घुसपैठ डिटेक्टर का निर्माण करना था, जो 'खराब' कनेक्शन, जिसे घुसपैठ या हमले कहा जाता है, और 'अच्छे' सामान्य कनेक्शन के बीच भेद करने में सक्षम एक भविष्य कहनेवाला मॉडल है। इस डेटाबेस में ऑडिट किए जाने वाले डेटा का एक मानक सेट होता है, जिसमें एक सैन्य नेटवर्क वातावरण में सिम्युलेटेड घुसपैठ की एक विस्तृत विविधता शामिल होती है।

विभाजित करना उदाहरण
'test' 311,029
'train' 4,898,431
  • फ़ीचर संरचना :
FeaturesDict({
    'count': int32,
    'diff_srv_rate': float32,
    'dst_bytes': int32,
    'dst_host_count': int32,
    'dst_host_diff_srv_rate': float32,
    'dst_host_rerror_rate': float32,
    'dst_host_same_src_port_rate': float32,
    'dst_host_same_srv_rate': float32,
    'dst_host_serror_rate': float32,
    'dst_host_srv_count': int32,
    'dst_host_srv_diff_host_rate': float32,
    'dst_host_srv_rerror_rate': float32,
    'dst_host_srv_serror_rate': float32,
    'duration': int32,
    'flag': ClassLabel(shape=(), dtype=int64, num_classes=11),
    'hot': int32,
    'is_guest_login': bool,
    'is_hot_login': bool,
    'label': ClassLabel(shape=(), dtype=int64, num_classes=40),
    'land': bool,
    'logged_in': bool,
    'num_access_files': int32,
    'num_compromised': int32,
    'num_failed_logins': int32,
    'num_file_creations': int32,
    'num_outbound_cmds': int32,
    'num_root': int32,
    'num_shells': int32,
    'protocol_type': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'rerror_rate': float32,
    'root_shell': bool,
    'same_srv_rate': float32,
    'serror_rate': float32,
    'service': ClassLabel(shape=(), dtype=int64, num_classes=71),
    'src_bytes': int32,
    'srv_count': int32,
    'srv_diff_host_rate': float32,
    'srv_rerror_rate': float32,
    'srv_serror_rate': float32,
    'su_attempted': int32,
    'urgent': int32,
    'wrong_fragment': int32,
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
गिनती करना टेन्सर int32
diff_srv_rate टेन्सर फ्लोट32
dst_बाइट्स टेन्सर int32
dst_host_count टेन्सर int32
dst_host_diff_srv_rate टेन्सर फ्लोट32
dst_host_rerror_rate टेन्सर फ्लोट32
dst_host_same_src_port_rate टेन्सर फ्लोट32
dst_host_same_srv_rate टेन्सर फ्लोट32
dst_host_serror_rate टेन्सर फ्लोट32
dst_host_srv_count टेन्सर int32
dst_host_srv_diff_host_rate टेन्सर फ्लोट32
dst_host_srv_rerror_rate टेन्सर फ्लोट32
dst_host_srv_serror_rate टेन्सर फ्लोट32
समयांतराल टेन्सर int32
झंडा क्लासलेबल int64
गरम टेन्सर int32
is_guest_login टेन्सर बूल
is_hot_login टेन्सर बूल
लेबल क्लासलेबल int64
भूमि टेन्सर बूल
में लॉग इन टेन्सर बूल
num_access_files टेन्सर int32
num_compromised टेन्सर int32
num_failed_logins टेन्सर int32
num_file_creations टेन्सर int32
num_outbound_cmds टेन्सर int32
num_root टेन्सर int32
num_shells टेन्सर int32
प्रोटोकॉल_प्रकार क्लासलेबल int64
rerror_rate टेन्सर फ्लोट32
root_shell टेन्सर बूल
समान_एसआरवी_दर टेन्सर फ्लोट32
serror_rate टेन्सर फ्लोट32
सेवा क्लासलेबल int64
src_बाइट्स टेन्सर int32
srv_count टेन्सर int32
srv_diff_host_rate टेन्सर फ्लोट32
srv_rerror_rate टेन्सर फ्लोट32
srv_serror_rate टेन्सर फ्लोट32
su_कोशिश की टेन्सर int32
अति आवश्यक टेन्सर int32
गलत_टुकड़ा टेन्सर int32
  • उद्धरण :
@misc{Dua:2019 ,
  author = "Dua, Dheeru and Graff, Casey",
  year = 2017,
  title = "{UCI} Machine Learning Repository",
  url = "http://archive.ics.uci.edu/ml",
  institution = "University of California, Irvine, School of Information and
Computer Sciences"
}