-
[정보처리기사] 016 정규화 (Normalization)자격증/정보처리계열 2015. 4. 29. 18:02반응형
016. 정규화 (Normalization)
정규화의 개요
- 함수적 종속성 등의 종속성 이론을 이용하여 잘못 설계된 관계형 스키마를 더 작은 속성의 세트로 쪼개어 바람직한 스키마로 만들어가는 과정
- 하나의 종속성이 하나의 릴레이션에 표현될 수 있도록 부해해가는 과정이라 할 수 있다
- 정규형에는 1,2,3, BCNF, 4, 5 정규형이 있으며 차수가 높아질수록 만족시켜야 할 제약 조건이 늘어난다.
- DB의 논리적 설계 단계에서 수행
- 논리적 처리 및 품질에 큰 영향을 미침
정규화의 목적
- 데이터 구조의 안정성 최대화
- 어떠한 릴레이션이라도 DB내에서 표현 가능하게 만듬
- 효과적인 검색 알고리즘 생성 가능
- 중복을 배제하여 삽입, 삭제, 갱신 이상의 발생을 방지
- 데이터 삽입 시 릴레이션을 재구성할 필요성을 줄인다
Anomaly (이상)의 개념 및 종류
- 정규화를 거치지 않으면 DB내에 데이터들이 불필요하게 중복되어 릴레이션 조작 시 예기치 못한 곤란한 현상이 발생하는데 이를 이상 이라 한다.
- 삽입 이상 (Insertion Anomaly) : 릴레이션에 데이터를 삽입할 때 의도와는 상관없이 원하지 않는 값도 함께 삽입되는 현상
- 삭제 이상 (Deletion Anomaly) : 릴레이션에서 한 튜플을 삭제할 때 의도와는 상관없는 값들도 함께 삭제되는 연쇄 삭제 현상이 일어나는 현상
- 갱신 이상 (Update Anomaly) : 릴레이션에서 튜플에 있는 속성값을 갱신할 때 일부 튜플의 정보만 갱신되어 정보에 모순이 생기는 현상
정규화 정리
- DB내에 데이터들이 불필요하게 중복되어 저장되면 릴레이션 조작 시 예기치 못한 이상 현상 발생 가능성이 높아짐
- 이상을 제거하기 위해서 중복성 및 종속성을 배제시키는 방법으로 사용됨
- 정규화되지 못한 릴레이션을 조작할 때 발생하는 이노멀리 현상의 근본 원인은 여러 종류의 사실들이 하나의 릴레이션에 모두 표현되어 있기 때문이다.
- 중복 및 종속 관계가 형성되어 릴레이션 조작 시 발생할 수 있는 이노멀리를 제거하기 위해서는 관계 모델로 표현한 릴레이션에 제한 사항들을 첨가해가면서 보다 더 정규화된 릴레이션으로 변환시켜 단순하게 만들어야 한다
정규화의 원칙
- 정보의 무손실 표현, 하나의 스키마를 다른 스키마로 변환할 때 정보의 손실이 있어서는 안된다.
- 분리의 원칙, 하나의 독립된 관계성은 하나의 독립된 릴레이션으로 분리시켜 표현해야 한다
- 데이터의 중복성이 감소되어야 한다
정규화 과정
1NF (제1정규형)
- 릴레이션에 속한 모든 도메인이 원자값으로만 되어있는 릴레이션
- 릴레이션의 모든 속성이 단순 영역에서 정의
2NF (제2정규형)
- 릴레이션 R이 1NF이고 키가 아닌 모든 속성이 기본키에 대하여 완전 함수적 종속 관계를 만족
3NF (제3정규형)
- 릴레이션 R이 2NF이고 키가 아닌 모든 속성이 기본키에 대해 이행적 종속 관계를 이루지 않도록 제한한 관계형
BCNF (Boyce-Codd 정규형)
- 릴레이션 R에서 결정자가 모두 후보키인 관계형
4NF (제4정규형)
- 다치 종속 (MVD : Multi Valued Dependency)
5NF (제5정규형, PJ/NF)
- 릴레이션 R의 모든 조인 종속성의 만족이 R의 후보키를 통해서만 만족될 떄 그 릴레이션 R은 제5정규형 또는 PJ/NF에 속한다
- 조인 종속
반응형'자격증 > 정보처리계열' 카테고리의 다른 글
[정보처리기사] 018 DDL (0) 2015.05.20 [정보처리기사] 017 SQL의 개념 (0) 2015.05.06 [정보처리기사] 015 관계대수 및 관계해석 (0) 2015.04.28 [정보처리기사] 014 관계형 데이터베이스의 제약 조건 (0) 2015.04.27 [정보처리기사] 013 관계형 데이터베이스의 구조 (0) 2015.04.27