2024/08/05 3

데이터 분석과 통계2

1. 모집단과 표본모집단(Population) : 관심의 대상이 되는 전체 집단. ex) 한 국가의 모든 성인표본(Sample) : 모집단에서 추출한 일부. ex) 그 국가의 성인 중 일부를 조사 표본을 사용하는 이유 ?1) 현실적인 제약비용과 시간접근성2) 대표성표본의 대표성 : 잘 설계된 표본은 모집단의 특성을 반영할 수 있음. 이를 모집단 전체에 일반화3) 데이터 관리데이터 처리의 용이성 : 작은 표본은 데이터 처리와 분석이 훨씬 용이함.데이터 품질 관리 : 작은 표본에서는 데이터 품질을 더 쉽게 관리하고, 오류나 이상값을 식별하여 수정 가능4) 모델 검증 용이모델 적합도 테스트 : 표본 데이터를 사용하여 통계적 모델을 검증할 수 있음. 모델이 표본 데이터에 잘 맞는다면, 모집단에도 잘 맞을 가능성..

카테고리 없음 2024.08.05

프로그래머스| 명예의 전당(1) (Python3)

문제 설명 "명예의 전당"이라는 TV 프로그램에서는 매일 1명의 가수가 노래를 부르고, 시청자들의 문자 투표수로 가수에게 점수를 부여합니다. 매일 출연한 가수의 점수가 지금까지 출연 가수들의 점수 중 상위 k번째 이내이면 해당 가수의 점수를 명예의 전당이라는 목록에 올려 기념합니다. 즉 프로그램 시작 이후 초기에 k일까지는 모든 출연 가수의 점수가 명예의 전당에 오르게 됩니다. k일 다음부터는 출연 가수의 점수가 기존의 명예의 전당 목록의 k번째 순위의 가수 점수보다 더 높으면, 출연 가수의 점수가 명예의 전당에 오르게 되고 기존의 k번째 순위의 점수는 명예의 전당에서 내려오게 됩니다. 이 프로그램에서는 매일 "명예의 전당"의 최하위 점수를 발표합니다. 예를 들어, k = 3이고, 7일 동안 진행된 가수..

TIL/Python 2024.08.05

프로그래머스| 오프라인/온라인 판매 데이터 통합하기(My SQL)

문제 설명 다음은 어느 의류 쇼핑몰의 온라인 상품 판매 정보를 담은 ONLINE_SALE 테이블과 오프라인 상품 판매 정보를 담은 OFFLINE_SALE 테이블 입니다. ONLINE_SALE 테이블은 아래와 같은 구조로 되어있으며, ONLINE_SALE_ID, USER_ID, PRODUCT_ID, SALES_AMOUNT, SALES_DATE는 각각 온라인 상품 판매 ID, 회원 ID, 상품 ID, 판매량, 판매일을 나타냅니다.동일한 날짜, 회원 ID, 상품 ID 조합에 대해서는 하나의 판매 데이터만 존재합니다. OFFLINE_SALE 테이블은 아래와 같은 구조로 되어있으며, OFFLINE_SALE_ID, PRODUCT_ID, SALES_AMOUNT, SALES_DATE는 각각 오프라인 상품 판매 ID, ..

TIL/SQL 2024.08.05