jojoon2786 님의 블로그

  • 홈
  • 태그
  • 방명록

2024/07/26 1

데이터 전처리 <IQR 이상치 제거>

프로젝트 진행 중 [마감 지연 건수] 컬럼 전처리 과정df['마감 지연 건수'].describe()min 값이 -3으로 건수가 음수인 건 말이 안됨. > 이상치라고 판단은행에 대한 도메인 지식이 부족하므로 다른 행들을 본 결과 음수로 잘못 입력됐다고 판단.def remove_minus(series):     if series         return (-series)     else: return (series) df['마감 지연 건수'] = df['마감 지연 건수'].apply(remove_minus)min 값이 0으로 바뀐 것을 확인 할 수 있다. 마감 지연 건수가 4399로 이상치라고 판단하였다.IQR을 통해 이상치 값을 제거하기로 하였다.q1=df['마감 지연 건수'].quantile(0.25)..

TIL/전처리, 시각화 2024.07.26
이전
1
다음
더보기
프로필사진

jojoon2786 님의 블로그

준혁 님의 블로그 입니다.

  • 분류 전체보기 (83)
    • 프로젝트 (0)
    • TIL (66)
      • Python (18)
      • SQL (28)
      • 전처리, 시각화 (5)
      • 머신러닝 (13)
      • 태블로 (2)
    • 아티클 (7)
    • WIL (3)

Tag

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2024/07   »
일 월 화 수 목 금 토
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바