평균/중앙값/최빈값 계산기
데이터의 기본 통계량을 계산합니다.
데이터 입력
숫자를 쉼표, 공백, 또는 줄바꿈으로 구분하여 입력하세요
입력 예시
- • 쉼표로 구분: 1, 2, 3, 4, 5
- • 공백으로 구분: 1 2 3 4 5
- • 줄바꿈으로 구분: 각 숫자를 새 줄에 입력
- • 혼합 사용 가능
통계량 설명
평균 (Mean)
모든 값의 합을 데이터 개수로 나눈 값입니다. 산술평균이라고도 합니다.
평균 = 합계 ÷ 개수
중앙값 (Median)
데이터를 크기 순으로 정렬했을 때 가운데 위치하는 값입니다.
홀수 개: 가운데 값
짝수 개: 가운데 두 값의 평균
최빈값 (Mode)
데이터에서 가장 자주 나타나는 값입니다. 여러 개일 수도 있습니다.
범위 (Range)
최댓값에서 최솟값을 뺀 값으로, 데이터의 분산 정도를 나타냅니다.
범위 = 최댓값 - 최솟값
기술통계학의 역사와 발전
고대부터 현대까지
통계학의 기원은 고대 이집트와 바빌로니아의 인구 조사로 거슬러 올라갑니다. 현대적 의미의 기술통계는 17세기 존 그론트(John Graunt)의 생명표 연구에서 시작되었으며, 19세기 아돌프 케틀레(Adolphe Quetelet)가 '평균인' 개념을 도입하면서 발전했습니다.
데이터 사이언스 시대의 기술통계
- • 탐색적 데이터 분석(EDA): 데이터의 기본 특성 파악
- • 데이터 전처리: 이상치 탐지 및 데이터 품질 평가
- • 특성 엔지니어링: 새로운 변수 생성을 위한 기초 정보
- • 모델 성능 평가: 예측 결과의 분포 특성 분석
비즈니스 인텔리전스에서의 활용
현대 기업에서는 KPI 대시보드, 고객 세분화, 매출 분석, 품질 관리 등 모든 영역에서 기술통계가 핵심적으로 사용됩니다. 특히 실시간 분석과 자동화된 리포팅에서 중요한 역할을 합니다.
각 통계량의 실무 활용
평균의 활용
- • 고객 평균 구매액 계산
- • 웹사이트 평균 체류시간 분석
- • 제품 평균 수명 예측
- • 직원 평균 생산성 측정
중앙값의 활용
- • 소득 분포 분석 (이상치 영향 최소화)
- • 부동산 가격 분석
- • 응답 시간 성능 지표
- • 고객 만족도 중간값
최빈값의 활용
- • 가장 인기 있는 제품 식별
- • 고객 선호 카테고리 분석
- • 오류 코드 빈도 분석
- • 설문조사 응답 패턴
범위의 활용
- • 품질 관리 허용 범위 설정
- • 가격 정책 범위 결정
- • 성과 평가 등급 구간
- • 리소스 사용량 변동폭
고급 분석으로의 확장
추론통계학으로의 발전
기술통계는 추론통계의 기초가 됩니다. 표본의 기술통계량을 통해 모집단의 특성을 추정하고, 가설검정의 기초 자료로 활용됩니다.
머신러닝과의 연계
기술통계는 머신러닝 모델의 특성 선택, 데이터 전처리, 모델 해석에 필수적입니다. 특히 설명 가능한 AI에서 중요한 역할을 합니다.
시각화와의 결합
히스토그램, 박스플롯, 바이올린 플롯 등 다양한 시각화 기법과 결합하여 데이터의 분포와 특성을 직관적으로 이해할 수 있습니다.
실시간 분석의 미래
스트리밍 데이터 환경에서 실시간으로 통계량을 계산하고 업데이트하는 기술이 점점 중요해지고 있습니다.