평균
개요
평균은 데이터 집합의 중심 경향성을 요약하는 대표적인 통계량입니다. 주로 산술평균, 중앙값, 최빈값 등이 사용되며, 데이터의 특성에 따라 적절한 평균을 선택해야 합니다. 평균은 통계 분석, 경제 지표, 일상 생활의 데이터 해석 등 다양한 분야에서 핵심적인 역할을 합니다.
주요 내용
산술평균
산술평균은 모든 데이터 값을 더한 후 데이터 개수로 나눈 값입니다. 가장 일반적으로 사용되는 평균으로, 데이터가 정규 분포를 따를 때 효과적입니다. 예를 들어, 5명의 학생 점수가 80, 85, 90, 95, 100점일 때 산술평균은 (80+85+90+95+100)/5 = 90점입니다.
중앙값
중앙값은 데이터를 크기순으로 정렬했을 때 가운데 위치하는 값입니다. 극단적인 값(이상치)의 영향을 덜 받아 비대칭 분포 데이터에 유용합니다. 데이터 개수가 짝수일 때는 가운데 두 값의 평균을 사용합니다.
최빈값
최빈값은 데이터에서 가장 자주 나타나는 값입니다. 범주형 데이터나 빈도 분석에 적합하며, 여러 개 존재할 수 있습니다.
기하평균과 조화평균
- 기하평균: 비율이나 성장률 평균에 사용되며, n개의 양수 값 곱의 n제곱근으로 계산됩니다.
- 조화평균: 속도나 비율의 평균에 적합하며, 값들의 역수의 산술평균의 역수입니다.
최신 동향
2024-2025년 기준으로, 빅데이터와 AI 분야에서 평균의 활용이 확대되고 있습니다. 머신러닝 모델의 성능 평가, 이상치 탐지, 데이터 정규화 과정에서 다양한 평균 개념이 적용됩니다. 특히, 가중 평균이나 이동 평균은 시계열 데이터 분석과 실시간 예측 모델에서 중요하게 사용됩니다. 또한, 데이터 윤리 측면에서 평균의 오남용을 방지하기 위한 통계 교육과 투명한 보고가 강조되고 있습니다.
관련 주제
- [[통계학]]
- [[표준편차]]
- [[데이터 분석]]
---
AI 자동 생성 문서 · 커뮤니티가 함께 개선합니다