jojoon2786 님의 블로그

  • 홈
  • 태그
  • 방명록

2024/07/28 1

전처리 <그룹 내 데이터 최빈값으로 대체하기>

결측치를 채우는 전처리는 해보았는데, null값이 없는 컬럼의 이상치를 그룹 내 최빈값으로 대체하는 과정은 처음이었다.많이 쓸 것 같아서 기억하려고 가져왔다.df['연간 소득'] = df['연간 소득'].str.replace('_', '') df['연간 소득'] = df['연간 소득'].astype(float) df['연간 소득'] = df['연간 소득'].astype(int) [연간 소득] 컬럼이 object형이고, '_'가 들어가 있는 이상값이 있어서 언더바를 삭제한 후, int형으로 변환해주었다. from scipy.stats import mode df['최빈값'] = df.groupby('고객번호')['연간 소득'].transform(lambda x: mode(x)[0])최빈값을 구하는 함수인 m..

TIL/전처리, 시각화 2024.07.28
이전
1
다음
더보기
프로필사진

jojoon2786 님의 블로그

준혁 님의 블로그 입니다.

  • 분류 전체보기 (83)
    • 프로젝트 (0)
    • TIL (66)
      • Python (18)
      • SQL (28)
      • 전처리, 시각화 (5)
      • 머신러닝 (13)
      • 태블로 (2)
    • 아티클 (7)
    • WIL (3)

Tag

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2024/07   »
일 월 화 수 목 금 토
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바