Home [데이터 정보 처리 입문] 9강 - 엑셀을 이용한 그래프 그리기 2
Post
Cancel

[데이터 정보 처리 입문] 9강 - 엑셀을 이용한 그래프 그리기 2

💡해당 게시글은 방송통신대학교 김성수, 이기재 교수님의 '데이터 정보 처리 입문' 강의를 개인 공부 목적으로 메모하였습니다.



학습 개요


  • 엑셀을 활용하면 그래프를 손쉽게 작성할 수 있고, 이를 통해서 데이터가 갖고 있는 정보를 시각적으로 나타낼 수 있음
  • 히스토그램, 산점도 작성 법에 대하여 엑셀 실습과 함께 살펴봄
  • 히스토그램을 그리기 위한 기초 작업인 도수 분포 표 작성 법을 공부하고, 상관 분석을 통해서 두 변수 사이의 연관성 분석에 대해서 공부 함



학습 목표


  • 도수 분포를 작성할 수 있음
  • 엑셀을 이용하여 히스토그램을 작성할 수 있음
  • 산점도를 작성하여 두 변수의 연관성을 설명할 수 있음
  • 상관 분석의 개념과 분석 결과를 해석할 수 있음



주요 용어


  • 도수 분포 표(frequency table)
    • 겹치지 않는 몇 개의 범주 즉, 계급에 속한 관측 치의 개수를 요약하여 작성한 표
    • 정성적 데이터뿐만 아니라 정량적 데이터에도 적용할 수 있음
  • 히스토그램(histogram)
    • 연속 형 데이터에 대해서 데이터의 특징이나 분포 모양을 살펴볼 때 널리 이용되는 그래프
    • 수평 축 위에 계급 구간을 표시하고 그 위로 각 계급의 상대 도수에 비례하는 넓이의 직사각형을 그린 것
  • 산점도(scatter plot)
    • 두 연속형 변수 사이의 관계를 그래프를 통해서 살펴보고자 할 때 사용되는 그래프
    • 두 변수 사이의 연관성 정도를 살펴보기 위한 분석의 첫 단계임
  • 상관 계수
    • 두 변수간의 선형 관계(직선 관계)의 정도를 나타내 주는 측도임
    • 상관 계수는 -1과 1사이의 값을 갖고, 절대 값이 1에 가까울수록 두 변수는 강한 선형 연관성, 상관 계수의 절대 값이 0에 가까울수록 약한 선형 연관성이 있다고 함



강의록


히스토그램

도수 분포 표(frequency table)

  • 겹치지 않는 몇 개의 범주 즉, 계급에 속한 관측 치의 개수를 요약하여 작성한 표
  • 정성적 데이터뿐만 아니라 정량적 데이터에도 적용할 수 있음
  • 정량적 데이터에 대한 도수 분포 표를 작성할 때는 사용되는 범주(계급)정의에 세심한 고려가 필요함

도수 분포 표 작성 방법

  • 데이터 수를 세고 데이터의 최대 값과 최소 값을 구함
  • 계급의 수 결정
    • √n ± 2~3 (보통 5에서 20개)
  • 계급의 폭 결정
    • 계급의 폭 = (최대 값 - 최소 값)/계급의 수
  • 계급의 경계 값과 중앙 값을 구함
    • 첫 번째 하한 경계 값 = 최소 값 - (측정의 최소 단위/2)
    • 첫 번째 상한 경계 값 = 하한 경계 값 + 계급의 폭
    • 계급 값 = (하한 경계 값 + 상한 경계 값) / 2
  • 도수 분포 표 작성

히스토그램(histogram)

  • 연속형 데이터에 대하여 데이터의 특징이나 분포 모양을 살펴볼 때 널리 이용되는 그래프
  • 수평 축 위에 계급 구간을 표시하고 그 위로 각 계급의 상대 도수에 비례하는 넓이의 직사각형을 그린 것

히스토그램 그리기 절차

  1. [데이터] 탭의 [분석] 그룹의 [데이터 분석] 명령을 선택
  2. 분석 도구 중 ‘히스토그램‘을 선택하고 [확인]을 선택

    image.png

    • 만약 [데이터 분석] 명령이 없으면 [파일] 단추를 클릭한 후 [옵션]에서 [추가 기능]을 선택하여 분석 도구 항목을 선택함
  3. 대화 상자에서 ‘입력 범위‘에 데이터 범위 지정

    image.png

  4. ‘출력 옵션’에서 히스토그램을 출력할 셀 주소를 입력하거나 ‘새로운 워크시트’를 선택한 후 ‘차트 출력‘을 클릭

    image.png

히스토그램 수정

  1. 히스토그램의 여러 막대 중 하나를 선택하고, 마우스의 오른쪽 단추를 클릭

    image.png

  2. [단축 메뉴]에서 [데이터 계열 서식]을 선택 후 데이터 계열 서식 대화 상자에서 [계열 옵션] 탭을 선택
  3. 간격 너비(W)’ 입력란에 150 대신에 0을 입력하고 [확인]을 선택

    image.png

  • <참고>
    • 차트 도구 모음에서 히스토그램 그리기

    image.png

산점도와 상관 분석

산점도(scatter plot)

  • 두 연속 형 변수 사이의 관계를 그래프를 통해서 살펴보기 위해서 사용함
  • 두 변수 사이의 연관성 정도를 살펴보기 위한 분석의 첫 단계

image.png

산점도 그리기

  1. 데이터를 선택하고, [삽입] 리본메뉴의 [차트] 그룹에서 ‘분산형’ 선택

    image.png

  2. ‘분산형’ 차트 유형 중에서 적합한 세부 차트 모양 결정
  3. 차트마법사 대화상자 제 2단계에서 ‘계열 위치‘를 지정

    image.png

  4. 출력 결과

    image.png

상관 분석

  • 상관 계수
    • 두 변수 간의 선형 관계(직선 관계)의 정도를 나타내 주는 측도
  • 상관 계수 ρ는 -1과 1사이 값을 가짐
    • **ρ의 값이 1에 가까울수록** 두 변수는 강한 선형 연관성
    • **ρ의 값이 0에 가까울수록** 두 변수는 약한 선형 연관성

산점도와 상관 계수

image.png

상관 분석 절차

  1. [데이터] 탭의 [분석] 그룹에서 [데이터 분석] 명령 선택
  2. 통계 데이터 분석 대화 상자에서 ‘상관 분석’ 항목을 선택

    image.png

  3. 대화 상자에 ‘입력 범위‘와 ‘데이터 방향‘을 지정함
    • ‘첫째 행 이름표 사용’ 체크 박스는 첫째 행의 정보를 변수 이름으로 사용하고자 하는 가를 묻는 항목임

      image.png

  4. 출력 결과
    • 두 변수 간의 상관 계수는 -0.82
    • 두 변수 간에 뚜렷한 음의 상관 관계가 있다고 할 수 있음

      image.png

실습 : 성적데이터

image.png

  • 히스토그램 : 통계 분석 도구 이용

    image.png

  • 히스토그램 : 차트 이용

    image.png

  • 산점도 그리기

    image.png

  • 상관 계수 구하기

    image.png

연습 문제 풀이

  • 10명의 음식 전문가가 서울 시내 유명 양식 점 3곳을 조사하여 맛, 가격, 청결도, 서비스, 분위기의 5개 항목을 5점 척도(대단히 만족:5, 만족:4, 보통: 3, 불만족:2, 대단히 불만족:1) 조사함

    image.png

    • 세 음식점의 질을 종합적으로 비교하기 위한 차트는?

      image.png

      • 방사형 차트



연습 문제


  1. 두 연속인 변수 X와 Y 사이의 상관 계수를 구했더니 0.9가 나왔다. 올바른 해석은?

    a. X 값이 커지면 Y 값은 직선 관계를 가지고 커진다.

  2. 도수 분포 표에 대한 다음 설명 중 옳지 않은 것은?

    a. 정성적 데이터에 대한 분석에는 활용할 수 없다.

    • 도수 분포 표에 대한 옳은 설명은?
      • 겹치지 않는 몇 개의 범주 또는 계급에 속한 관측 치의 개수를 요약하여 작성한 표임
      • 연속형 데이터에 대한 분석에서 도수 분포 표를 기초로 히스토그램을 그릴 수 있음
      • 연속형 데이터에 대해 도수 분포 표를 작성할 때는 계급의 개수와 폭을 결정하는 것이 중요함
  3. 두 변수들 사이의 관계를 살펴보기 위해 산점도를 그리고자 한다. 차트 마법사의 차트 종류 입력 상자에서 선택할 차트 종류는? 

    a. 분산 형

  4. 엑셀 함수를 이용하여 구한 시간의 흐름에 따른 전압 값을 다음과 같은 그래프로 표시하였다. 이와 같은 그래프를 얻기 위해서 사용된 엑셀 차트의 유형은 무엇인가?

    image.png

    a. 분산형

  5. 다음의 산점도에 대한 상관계수로 가장 적합할 것으로 생각되는 값은?

    image.png

    a. r = 0.92

[유비쿼터스 컴퓨팅 개론] 8강 - 클라우드 컴퓨팅

[Java 프로그래밍] 9강 - java.io 패키지와 스트림