kddcup99

  • 설명 :

KDD-99 The Fifth International Conference on Knowledge Discovery and Data Mining과 함께 개최된 The Third International Knowledge Discovery and Data Mining Tools Competition에 사용된 데이터 세트입니다. 경쟁 작업은 침입 또는 공격이라고 하는 '나쁜' 연결과 '좋은' 정상 연결을 구별할 수 있는 예측 모델인 네트워크 침입 탐지기를 구축하는 것이 었습니다. 이 데이터베이스에는 감사할 표준 데이터 세트가 포함되어 있으며 여기에는 군사 네트워크 환경에서 시뮬레이션된 다양한 침입이 포함됩니다.

나뉘다
'test' 311,029
'train' 4,898,431
  • 기능 구조 :
FeaturesDict({
    'count': int32,
    'diff_srv_rate': float32,
    'dst_bytes': int32,
    'dst_host_count': int32,
    'dst_host_diff_srv_rate': float32,
    'dst_host_rerror_rate': float32,
    'dst_host_same_src_port_rate': float32,
    'dst_host_same_srv_rate': float32,
    'dst_host_serror_rate': float32,
    'dst_host_srv_count': int32,
    'dst_host_srv_diff_host_rate': float32,
    'dst_host_srv_rerror_rate': float32,
    'dst_host_srv_serror_rate': float32,
    'duration': int32,
    'flag': ClassLabel(shape=(), dtype=int64, num_classes=11),
    'hot': int32,
    'is_guest_login': bool,
    'is_hot_login': bool,
    'label': ClassLabel(shape=(), dtype=int64, num_classes=40),
    'land': bool,
    'logged_in': bool,
    'num_access_files': int32,
    'num_compromised': int32,
    'num_failed_logins': int32,
    'num_file_creations': int32,
    'num_outbound_cmds': int32,
    'num_root': int32,
    'num_shells': int32,
    'protocol_type': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'rerror_rate': float32,
    'root_shell': bool,
    'same_srv_rate': float32,
    'serror_rate': float32,
    'service': ClassLabel(shape=(), dtype=int64, num_classes=71),
    'src_bytes': int32,
    'srv_count': int32,
    'srv_diff_host_rate': float32,
    'srv_rerror_rate': float32,
    'srv_serror_rate': float32,
    'su_attempted': int32,
    'urgent': int32,
    'wrong_fragment': int32,
})
  • 기능 문서 :
특징 수업 모양 D타입 설명
풍모Dict
세다 텐서 int32
diff_srv_rate 텐서 float32
dst_bytes 텐서 int32
dst_host_count 텐서 int32
dst_host_diff_srv_rate 텐서 float32
dst_host_rerror_rate 텐서 float32
dst_host_same_src_port_rate 텐서 float32
dst_host_same_srv_rate 텐서 float32
dst_host_serror_rate 텐서 float32
dst_host_srv_count 텐서 int32
dst_host_srv_diff_host_rate 텐서 float32
dst_host_srv_rerror_rate 텐서 float32
dst_host_srv_serror_rate 텐서 float32
지속 텐서 int32
깃발 클래스 레이블 int64
더운 텐서 int32
is_guest_login 텐서 부울
is_hot_login 텐서 부울
상표 클래스 레이블 int64
텐서 부울
로그인 텐서 부울
num_access_files 텐서 int32
num_compromised 텐서 int32
num_failed_logins 텐서 int32
num_file_creations 텐서 int32
num_outbound_cmds 텐서 int32
num_root 텐서 int32
num_shells 텐서 int32
protocol_type 클래스 레이블 int64
오류율 텐서 float32
root_shell 텐서 부울
same_srv_rate 텐서 float32
serror_rate 텐서 float32
서비스 클래스 레이블 int64
src_bytes 텐서 int32
srv_count 텐서 int32
srv_diff_host_rate 텐서 float32
srv_rerror_rate 텐서 float32
srv_serror_rate 텐서 float32
su_attempted 텐서 int32
긴급한 텐서 int32
wrong_fragment 텐서 int32
  • 인용 :
@misc{Dua:2019 ,
  author = "Dua, Dheeru and Graff, Casey",
  year = 2017,
  title = "{UCI} Machine Learning Repository",
  url = "http://archive.ics.uci.edu/ml",
  institution = "University of California, Irvine, School of Information and
Computer Sciences"
}