학습 개요
- 엑셀을 활용하면 그래프를 손쉽게 작성할 수 있고, 이를 통해서 데이터가 갖고 있는 정보를 시각적으로 나타낼 수 있음
- 히스토그램, 산점도 작성 법에 대하여 엑셀 실습과 함께 살펴봄
- 히스토그램을 그리기 위한 기초 작업인 도수 분포 표 작성 법을 공부하고, 상관 분석을 통해서 두 변수 사이의 연관성 분석에 대해서 공부 함
학습 목표
- 도수 분포를 작성할 수 있음
- 엑셀을 이용하여 히스토그램을 작성할 수 있음
- 산점도를 작성하여 두 변수의 연관성을 설명할 수 있음
- 상관 분석의 개념과 분석 결과를 해석할 수 있음
주요 용어
- 도수 분포 표(frequency table)
- 겹치지 않는 몇 개의 범주 즉, 계급에 속한 관측 치의 개수를 요약하여 작성한 표
- 정성적 데이터뿐만 아니라 정량적 데이터에도 적용할 수 있음
- 히스토그램(histogram)
- 연속 형 데이터에 대해서 데이터의 특징이나 분포 모양을 살펴볼 때 널리 이용되는 그래프
- 수평 축 위에 계급 구간을 표시하고 그 위로 각 계급의 상대 도수에 비례하는 넓이의 직사각형을 그린 것
- 산점도(scatter plot)
- 두 연속형 변수 사이의 관계를 그래프를 통해서 살펴보고자 할 때 사용되는 그래프
- 두 변수 사이의 연관성 정도를 살펴보기 위한 분석의 첫 단계임
- 상관 계수
- 두 변수간의 선형 관계(직선 관계)의 정도를 나타내 주는 측도임
- 상관 계수는 -1과 1사이의 값을 갖고, 절대 값이 1에 가까울수록 두 변수는 강한 선형 연관성, 상관 계수의 절대 값이 0에 가까울수록 약한 선형 연관성이 있다고 함
강의록
히스토그램
도수 분포 표(frequency table)
- 겹치지 않는 몇 개의 범주 즉, 계급에 속한 관측 치의 개수를 요약하여 작성한 표
- 정성적 데이터뿐만 아니라 정량적 데이터에도 적용할 수 있음
- 정량적 데이터에 대한 도수 분포 표를 작성할 때는 사용되는 범주(계급)정의에 세심한 고려가 필요함
도수 분포 표 작성 방법
- 데이터 수를 세고 데이터의 최대 값과 최소 값을 구함
- 계급의 수 결정
- √n ± 2~3 (보통 5에서 20개)
- 계급의 폭 결정
- 계급의 폭 = (최대 값 - 최소 값)/계급의 수
- 계급의 경계 값과 중앙 값을 구함
- 첫 번째 하한 경계 값 = 최소 값 - (측정의 최소 단위/2)
- 첫 번째 상한 경계 값 = 하한 경계 값 + 계급의 폭
- 계급 값 = (하한 경계 값 + 상한 경계 값) / 2
- 도수 분포 표 작성
히스토그램(histogram)
- 연속형 데이터에 대하여 데이터의 특징이나 분포 모양을 살펴볼 때 널리 이용되는 그래프
- 수평 축 위에 계급 구간을 표시하고 그 위로 각 계급의 상대 도수에 비례하는 넓이의 직사각형을 그린 것
히스토그램 그리기 절차
- [데이터] 탭의 [분석] 그룹의 [데이터 분석] 명령을 선택
분석 도구 중 ‘히스토그램‘을 선택하고 [확인]을 선택
![image.png]()
- 만약 [데이터 분석] 명령이 없으면 [파일] 단추를 클릭한 후 [옵션]에서 [추가 기능]을 선택하여 분석 도구 항목을 선택함
대화 상자에서 ‘입력 범위‘에 데이터 범위 지정
![image.png]()
‘출력 옵션’에서 히스토그램을 출력할 셀 주소를 입력하거나 ‘새로운 워크시트’를 선택한 후 ‘차트 출력‘을 클릭
![image.png]()
히스토그램 수정
히스토그램의 여러 막대 중 하나를 선택하고, 마우스의 오른쪽 단추를 클릭
![image.png]()
- [단축 메뉴]에서 [데이터 계열 서식]을 선택 후 데이터 계열 서식 대화 상자에서 [계열 옵션] 탭을 선택
‘간격 너비(W)’ 입력란에 150 대신에 0을 입력하고 [확인]을 선택
![image.png]()
- <참고> 참고>
- 차트 도구 모음에서 히스토그램 그리기
![image.png]()
산점도와 상관 분석
산점도(scatter plot)
- 두 연속 형 변수 사이의 관계를 그래프를 통해서 살펴보기 위해서 사용함
- 두 변수 사이의 연관성 정도를 살펴보기 위한 분석의 첫 단계

산점도 그리기
데이터를 선택하고, [삽입] 리본메뉴의 [차트] 그룹에서 ‘분산형’ 선택
![image.png]()
- ‘분산형’ 차트 유형 중에서 적합한 세부 차트 모양 결정
차트마법사 대화상자 제 2단계에서 ‘계열 위치‘를 지정
![image.png]()
출력 결과
![image.png]()
상관 분석
- 상관 계수
- 두 변수 간의 선형 관계(직선 관계)의 정도를 나타내 주는 측도
- 상관 계수 ρ는 -1과 1사이 값을 가짐
** ρ 의 값이 1에 가까울수록** 두 변수는 강한 선형 연관성 ** ρ 의 값이 0에 가까울수록** 두 변수는 약한 선형 연관성
산점도와 상관 계수

상관 분석 절차
- [데이터] 탭의 [분석] 그룹에서 [데이터 분석] 명령 선택
통계 데이터 분석 대화 상자에서 ‘상관 분석’ 항목을 선택
![image.png]()
- 대화 상자에 ‘입력 범위‘와 ‘데이터 방향‘을 지정함
‘첫째 행 이름표 사용’ 체크 박스는 첫째 행의 정보를 변수 이름으로 사용하고자 하는 가를 묻는 항목임
![image.png]()
- 출력 결과
- 두 변수 간의 상관 계수는 -0.82임
두 변수 간에 뚜렷한 음의 상관 관계가 있다고 할 수 있음
![image.png]()
실습 : 성적데이터

히스토그램 : 통계 분석 도구 이용
![image.png]()
히스토그램 : 차트 이용
![image.png]()
산점도 그리기
![image.png]()
상관 계수 구하기
![image.png]()
연습 문제 풀이
10명의 음식 전문가가 서울 시내 유명 양식 점 3곳을 조사하여 맛, 가격, 청결도, 서비스, 분위기의 5개 항목을 5점 척도(대단히 만족:5, 만족:4, 보통: 3, 불만족:2, 대단히 불만족:1) 조사함
![image.png]()
세 음식점의 질을 종합적으로 비교하기 위한 차트는?
![image.png]()
- 방사형 차트
연습 문제
두 연속인 변수 X와 Y 사이의 상관 계수를 구했더니 0.9가 나왔다. 올바른 해석은?
a. X 값이 커지면 Y 값은 직선 관계를 가지고 커진다.
도수 분포 표에 대한 다음 설명 중 옳지 않은 것은?
a. 정성적 데이터에 대한 분석에는 활용할 수 없다.
- 도수 분포 표에 대한 옳은 설명은?
- 겹치지 않는 몇 개의 범주 또는 계급에 속한 관측 치의 개수를 요약하여 작성한 표임
- 연속형 데이터에 대한 분석에서 도수 분포 표를 기초로 히스토그램을 그릴 수 있음
- 연속형 데이터에 대해 도수 분포 표를 작성할 때는 계급의 개수와 폭을 결정하는 것이 중요함
- 도수 분포 표에 대한 옳은 설명은?
두 변수들 사이의 관계를 살펴보기 위해 산점도를 그리고자 한다. 차트 마법사의 차트 종류 입력 상자에서 선택할 차트 종류는?
a. 분산 형
엑셀 함수를 이용하여 구한 시간의 흐름에 따른 전압 값을 다음과 같은 그래프로 표시하였다. 이와 같은 그래프를 얻기 위해서 사용된 엑셀 차트의 유형은 무엇인가?
![image.png]()
a. 분산형
다음의 산점도에 대한 상관계수로 가장 적합할 것으로 생각되는 값은?
![image.png]()
a. r = 0.92



















