학습 개요
- 데이터 분석의 시작은 데이터를 이해하는 것에서 출발함
- 단순히 데이터를 처리하는 것을 넘어, 분석 대상 데이터를 통해 의미 있는 패턴과 통찰을 발견하고 이를 기반으로 문제를 해결하거나 의사 결정을 지원할 수 있어야 함
- 이를 위해 데이터 분석이 수행되는 절차와 분석 방법론에 대한 명확한 이해가 필요함
- 데이터 분석의 정의와 필요성, 그리고 분석 과정의 순환적 흐름에 대해 학습함
- 데이터 분석의 발전 과정(규칙 기반 분석, 통계적 모형, 기계 학습, 딥 러닝)과 특징을 비교함
- 탐색적 데이터 분석(EDA)의 중요성과 자동화 도구의 활용 방안을 통해, 실무 분석에서 데이터를 어떻게 바라보고 접근할 것인 지에 대해 학습함
학습 목표
- 데이터 분석의 개념과 필요성을 이해할 수 있음
- 데이터 분석의 주요 과정에서 수행되는 작업을 설명할 수 있음
- EDA의 중요성을 이해하고 기본적인 기법을 활용할 수 있음
강의록
데이터 분석의 이해
데이터 분석의 이해
- 데이터에서 의미 있는 패턴과 통찰을 발견하여 합리적인 의사 결정을 지원하는 기술
- 데이터 분석의 필요성
- 의사 결정의 질을 향상
- 비즈니스 문제의 근본 원인 파악
- 미래 예측 능력
- 데이터 분석 응용 분야 예
- 비즈니스 환경
- 고객 행동 이해, 시장 트렌드 파악, 운영 효율성 개선, 리스크 관리 등
- 공공 부문
- 정책 효과 평가, 자원 배분 최적화, 사회 문제 해결 등
- 비즈니스 환경
데이터 분석의 어려움과 과제
- 결측치, 오류, 중복, 불일치 등 다양한 품질 문제 존재
- 규모와 복잡성
- 빅데이터 시대의 5V(Volume, Velocity, Variety, Veracity, Value) 문제
- 기존 분석 도구와 방법론의 한계 초과
- 구조화된 데이터 뿐 아니라 비구조화 데이터 처리의 어려움과 고성능 컴퓨팅 환경 요구
- 방법론 선택의 난제
- 다양한 분석 방법론 중 최적 선택의 어려움
- 과도하게 복잡하거나 단순한 모델 적용의 위험성
- 데이터 특성과 분석 목적에 맞는 방법 결정 필요
데이터 분석의 과정

데이터 분석 과정
데이터 분석 방법론이 발전
- 1960년대: 규칙 기반 분석의 시작
- 1980년대: 통계적 방법론의 발전
- 2000년대 초: 기계 학습의 출현
- 2010년대 초: 딥 러닝의 혁신
- 2015년대: 자동화된 기계 학습
- 2020년대: 대규모 언어 모델의 발전
규칙 기반 분석
- 전문가의 경험과 직관에 기반한 분석 방식
- 특정 조건과 규칙을 명시적으로 프로그래밍
- ‘if-then’ 형태의 논리적 규칙 적용
- 분석가의 도메인 지식이 직접적으로 분석 과정에 반영
- 규칙 기반 분석의 장점
- 투명성과 해석 가능성이 높음
- 복잡한 통계나 수학적 지식 없이도 구현 가능
- 규칙 기반 분석의 단점
- 복잡하고 비선형적인 패턴 포착 어려움
- 새로운 상황이나 예외적 경우에 대한 일반화 능력 부족
규칙 기반 분석의 예
class="highlight">

