본문 바로가기

공부 기록/Database

Database 개론


DB & DBMS & DB system

 

-  Database

전자적으로 저장되고 사용되는 관련있는 데이터들의 조직화된 집합

-  DBMS (DataBase Management System)

사용자에게 DB를 정의, 만들고, 관리하는 기능을 제공하는 SW 시스템

 

DB를 정의하다 보면 부가적인 데이터가 발생(DB를 정의하거나 기술하는 data => )하는데, 이러한 metadata(=catalog) 또한 DBMS를 통해 저장, 관리된다.

-  Database System

Database + DBMS + 연관된 applications

 


Data models

DB의 구조를 기술하는 데 사용할 수 있는 개념들이 모인 집합으로, DB 구조(데이터 유형, 데이터 관계, 제약 사항 등)를 추상화해서 표현할 수 있는 수단을 제공한다. DB에서 읽고 쓰기 위한 기본적인 동작들(operations)도 포함한다.

 

-  Conceptual(high-level) data models

  • 일반 사용자들이 쉽게 이해할 수 있는 개념들로 이루어진 모델
  • 추상화 수준이 가장 높다.
  • 비즈니스 요구 사항을 추상화하여 기술할 때 사용한다.
  • 대표적으로 Entity-relationship model(E-R model)이 여기에 속한다.

-  Logical(representational) data models

  • 이해하기 어렵지 않으면서도 디테일하게 DB를 구조화할 수 있는 개념들을 제공한다.
  • 데이터가 컴퓨터에 저장될 때의 구조와 크게 다르지 않게 DB 구조화를 가능하게 한다.
  • 특정 DBMS나 storage에 종속되지 않는 수준에서(=>어느 정도 추상화되어 있음) DB를 구조화할 수 있는 모델
  • Relational data model, Object data model, Object-relational data model ...

-  Physical(low-level) data models

  • 컴퓨터에 데이터가 어떻게 파일 형태로 저장되는지를 기술할 수 있는 수단을 제공한다.
  • 데이터가 컴퓨터에 저장될 때와 가장 근접하게 DB 구조를 표현할 수 있다.

 


Schema

data model을 바탕으로 DB의 구조를 기술한 것

schema는 DB를 설계할 때 정해지며, 한 번 정해진 후에는 자주 바뀌지 않는다.

 

State(snapshot)

특정 시점에 DB에 있는 데이터, 혹은 DB에 있는 현재 instances의 집합

 

 


Three-schema architecture

  • DB system을 구축하는 아키텍처 중 하나
  • user application으로부터 물리적인 database를 분리시키는 목적으로 사용된다.
    => 물리적인 database에서의 구조가 조금씩 바뀔 때에도 실제 database를 사용하는 user application에 영향을 끼치지 않기 위함  
  • 안정적으로 DB system을 유지하기 위해 사용한다.
    => 각 레벨을 독립시켜서 어느 레벨에서의 변화가 상위 레벨에 영향을 주지 않기 위함
  • 대부분의 DBMS가 three level을 완벽하게 혹은 명시적으로 나누지는 않는다.
  • 데이터가 존재하는 곳은 internal level

  • Internal schemas at internal level : 물리적인 저장 장치와 가장 가까이 있는 schema. 물리적으로 데이터가 어떻게 저장되는지 physical data model을 통해 표현하며, 실체가 있는 내용을 기술한다(data storage, data structure, access path 등)
  • External schemas(user views, external views) at external(view) level : 특정 유저들이 필요로 하는 데이터만 logical data model을 통해 표현한다.
  • Conceptual schemas at conceptual level : 논리적으로 전체 DB에 대한 구조를 기술한다.(internal schemas를 한 단계 추상화) 물리적인 저장 구조에 관한 내용은 숨긴다. entities, data types, relationships, user operations, constriants에 집중하여 표현한다. logical data model을 통해 표현한다.

 


Database language

-  DDL(Data Definition Language, 데이터 정의어)

 

conceptual schemas를 정의하기 위해 사용되는 언어(internal schema까지 정의할 수 있는 경우도 있음)

테이블을 생성하고 변경·제거하는 기능을 제공한다.

 

-  DML(Data Manipulation Language, 데이터 조작어)

 

DB에 있는 데이터를 활용하기 위한 언어

테이블에 새 데이터를 삽입하거나, 테이블에 저장된 데이터를 수정·삭제·검색하는 기능을 제공한다.

 

-  DCL(Data Control Language, 데이터 제어어)

보안을 위해 데이터에 대한 접근 및 사용 권한을 사용자별로 부여하거나 취소하는 기능을 하는 언어다. 

데이터베이스 관리자가 주로 사용한다.

 

-  SDL(Storage Definition Language)

 

internal schemas를 정의하기 위해 사용되는 언어.

최근에는, 특히 RDBMS에서는 SDL이 거의 없고 파라미터 등의 설정으로 대체되었다.

 

-  VDL(View Definition Language)

 

external schemas를 정의하기 위해 사용되는 언어.

대부분의 DBMS에서는 DDL이 VDL의 역할까지 수행한다.

 

 

오늘날의 DBMS는 DML, VDL, DDL이 통합된 언어로 존재한다. 대표적인 예가 SQL!

 

SQL(Structured Query Language)

  • 현업에서 쓰이는 RDBMS의 표준 언어
  • RDBMS 관리 시스템에서 자료의 검색과 관리, DB 스키마 생성과 수정, DB 객체 접근 조정 관리를 위해 고안되었다.
  • DDL + DML + VDL
  • SQL에서 relation이란 multiset of tuples, 중복된 tuple을 허용한다.