IT CUBE
정보처리기사 실기 정리 - 3. 데이터 입출력 구현 본문
3. 데이터 입출력 구현
데이터 모델
현실 세계의 정보를 인간과 컴퓨터가 이해할 수 있도록 추상화하여 표현한 모델
데이터 모델 절차
요구사항 분석 -> 개념적 데이터 모델 -> 논리적 데이터 모델 -> 물리적 데이터 모델
논리적 데이터 모델링 종류
- 관계 데이터 모델: 테이블 형태
- 계층 데이터 모델: 트리 구조
- 네트워크 데이터 모델: 그래프
관계 대수 연산자의 종류
1. 일반 집합 연산자
- 합집합
- 교집합
- 차집합
- 카티션 프로덕트: 릴레이션에 속한 모든 튜플을 연결해 만들어진 새로운 튜플로 릴레이션을 구성
2. 순수 관계 연산자
- 셀렉트: 조건을 만족하는 튜플 반환
- 프로젝트: 주어진 속성들의 값으로만 구성된 튜플 반환
- 조인: 공통 속성을 이용해 릴레이션의 튜플들을 연결해 만들어진 튜플 반환
- 디비전: 릴레이션의 모든 튜플과 관련 있는 릴레이션의 튜플 반환
논리 데이터 모델링 속성
- 개체
- 속성
- 관계
E-R 다이어그램
현실 세계에 존재하는 데이터와 그들 간의 관계를 사람이 이해할 수 있는 형태로 명확하게 표현하기 위해
가장 널리 사용되고 있는 모델
E-R 다이어그램 기호
- 개체 - 사각형
- 관계 - 마름모
- 속성 - 타원
- 다중 값 속성 - 이중 타원
- 관계/속성 연결 - 선
정규화
데이터 모델에서 데이터의 중복성을 제거하여 이상현상을 방지하는 과정
이상 현상
데이터의 중복성으로 인해 릴레이션을 조작할 때 발생하는 현상
- 삽입 이상: 정보 저장 시 정보의 불필요한 세부 정보를 입력한 경우
- 삭제 이상: 정보 삭제 시 원치 않는 다른 정보가 같이 삭제되는 경우
- 갱신 이상: 중복 데이터 중에서 특정 부분만 수정되어 중복된 값이 모순을 일으키는 경우
정규화의 단계 (그림 보고 어떤 정규형인지 맞출 수 있어야 함)
- 1정규형(1NF): 원자 값으로 구성
- 2정규형(2NF): 부분 함수 종속 제거
- 3정규형(3NF): 이행 함수 종속 제거
- BCNF: 결정자 후보 키가 아닌 함수 종속 제거
- 4정규형(4NF): 다치(다중 값) 종속 제거
- 5정규형(5NF): 조인 종속 제거
반 정규화
정규화된 엔티티, 속성, 관계에 대해 성능 향상과 개발 운영의 단순화를 위해 중복, 통합, 분리하는 과정
참조 무결성 제약조건
참조하는 외래키의 값은 항상 참조되는 릴레이션에 기본키로 존재해야 한다.
- 제한: 참조 무결성 원칙을 위배하는 연산을 거절하는 옵션
- 연쇄: 참조되는 릴레이션에서 튜플을 삭제하고, 이 튜플을 참조하는 튜플들도 함께 삭제하는 옵션
- 널 값: 참조되는 릴레이션에서 튜플을 삭제하고, 해당 튜플을 참조하는 튜플들의 외래 키에 NULL값 적용
인덱스
전체 데이터의 검색 없이 필요한 정보에 대해 신속하게 조회 가능하게 해주는 데이터 구조
파티션의 종류
- 레인지 파티셔닝: 연속적인 숫자나 날짜를 기준으로 파티셔닝
- 해시 파티셔닝: 파티션 키의 해시 함수 값에 의한 파티셔닝
- 리스트 파티셔닝: 특정 파티션에 저장될 데이터에 대한 명시적 제어 가능한 파티셔닝
- 컴포지트 파티셔닝: 레인지, 해시, 리스트 중 2개 이상의 파티셔닝 결합
데이터베이스
다수의 인원, 시스템, 또는 프로그램이 사용할 목적으로 통합하여 관리되는 데이터의 집합
데이터베이스의 종류
1. 파일 시스템: 파일에 이름을 부여하고 저장이나 검색을 위해 논리적으로 정의하는 방식
2. 관계형 데이터베이스 관리시스템(RDBMS): 관계형 모델을 기반으로 하는 가장 보편화된 데이터베이스 관리 시스템
3. 계층형 데이터베이스 관리시스템(HDBMS): 데이터를 계층형으로 관리하는 데이터베이스
4. 네트워크 데이터베이스 관리시스템(NDBMS): 데이터의 구조를 망상 형태로 표현한 데이터 모델
DBMS 유형
- 키-값 DBMS
- 컬럼 기반 데이터 저장 DBMS
- 문서 저장 DBMS
- 그래프 DBMS
빅데이터
시스템, 서비스, 조직 등에서 주어진 비용, 시간 내에 처리가 가능한 데이터를 넘어서는 비정형 데이터
빅데이터의 특성
- 데이터의 양
- 데이터의 다양성
- 데이터의 속도
HDFS
대용량 데이터의 집합을 처리하는 프로그램에 적합하도록 설계된 하둡 분산 파일 시스템
맵 리듀스
구글에서 대용량 데이터 처리를 위한 목적으로 제작한 소프트웨어 프레임워크
NoSQL
전통적인 RDBMS와 다른 DBMS를 지칭하기 위한 용어로, 스키마가 필요하지 않고, 조인 연산을 사용할 수 없으며,
수평적으로 확장이 가능한 DBMS
NoSQL의 특성
- Basically Available: 언제든지 데이터에 접근 가능
- Soft-State: 노드의 상태는 외부에서 전송된 정보를 통해 결정
- Eventually Consistency: 일정 시간이 지나면 데이터의 일관성 유지
NoSQL 유형
- Key-Value Store
- Column Family Data Store
- Document Store
- Graph Store
시맨틱 웹
온톨로지를 활용하여 서비스를 기술하고, 서비스 검색, 조합, 중재 기능을 자동화하는 웹
온톨로지
실세계에 존재하는 모든 개념들과 속성, 관계를 컴퓨터가 이해할 수 있도록 서술해 놓은 지식 베이스
데이터 마이닝
대규모로 저장된 데이터 안에서 체계적이고 자동적으로 규칙이나 패턴을 찾아내는 기술
데이터 마이닝 주요 기법
- 분류 규칙
- 연관 규칙
- 연속 규칙
- 데이터 군집화
텍스트 마이닝
대량의 텍스트 데이터로부터 의미 있는 정보를 찾아내는 기법
웹 마이닝
웹으로부터 얻어지는 데이터로부터 분석하는 기법
Next
'정보처리기사 > 실기 정리' 카테고리의 다른 글
정보처리기사 실기 정리 - 5. 인터페이스 구현 (0) | 2021.10.05 |
---|---|
정보처리기사 실기 정리 - 4. 통합 구현 (0) | 2021.10.05 |
정보처리기사 실기 정리 - 2. 화면 설계 (0) | 2021.10.04 |
정보처리기사 실기 정리 - 1. 요구사항 확인 (0) | 2021.10.04 |
정보처리기사 실기 정리 List (0) | 2021.10.04 |