DB System Concepts 7th 17

[DB] 12-6. Disk-Block Access

디스크 I/O에 대한 요청은 데이터베이스 시스템에 의해서 생성되며 쿼리를 처리하는 하위 시스템이 대부분의 디스크 I/O를 처리한다. 각 요청은 디스크 식별자와 디스크의 논리적 블록 번호를 지정한다. DB 데이터가 운영체제 파일에 저장된 경우, 요청은 파일 식별자와 파일 내의 블록 번호를 지정한다 데이터베이스 데이터가 운영 체제 파일에 저장된 경우, 요청은 파일 식별자와 파일 내의 블록 번호를 지정한다. 데이터는 디스크와 주 메모리 간에 블록 단위로 전송된다. 앞서 다뤘듯이, 디스크로 부터 블록을 요청하는 sequence는 순차 접근 패턴(sequential access pattern)과 무작위 접근 패턴(random access pattern)으로 나뉜다고 했다. 순차 접근 패턴 : 연속적인 요청은 연속..

[DB] Chapter 12-4. Flash Memory

Flash 메모리는 두 가지 유형이 있다. NOR flash와 NAND flash. NAND flash는 데이터 저장을 위해 주로 사용되는 variant(변형형)이다. NAND flash에서 읽기 작업(reading)은 흔히 4096바이트로 구성된 전체 페이지 데이터를 NAND flash로부터 메인메모리로 가져와야 한다. 즉, NAND 플래시에서 읽은 전체 페이지 데이터를 메인 메모리로 옮겨야 한다는 뜻이다. 그래서, NAND flash에 있는 페이지는 자기 디스크의 sector와 비슷하다. SSD는 NAND 플래시를 사용해서 만들어졌고 디스크 저장장치와 같이 똑같은 블록 기반의 인터페이스를 제공한다. SSD의 데이터 전송 속도는 자기식 디스크의 전송 속도보다 빠르고 보통은 연결 기술에 의해 속도가 제한..

[DB] Chapter 12-3. Magnetic Disks

자기 디스크(Magnetic Disks)는 현대 컴퓨터 시스템에서 secondary storage의 대부분을 제공한다. 자기 디스크의 용량은 해마다 점차 증가하고 있지만 거대한 응용 프로그램이 요구하는 용량은 더 빠르게 증가하고 있어서 어쩔 때는 디스크의 용량을 앞지를 때도 있다. 최근에 SSD 저장장치의 용량이 빠르게 증가했고 비용도 감소하고 있다. SSD가 속도와 용량이 같이 늘어나면서 자기 디스크의 경쟁자가 되었다. 하지만, SSD의 바이트 당 비용이 자기 디스크의 바이트당 비용보다 6~8배 비싸다는 사실 때문에 자기 디스크가 여전히 선택받고 있다. 물론 점차적으로 기업용 데이터에서 SSD도 선택받고 있다. 1. Physical Characteristics of Disks 12.2는 자기 디스크의 ..

[DB] Chapter 12-2. Storage Interfaces

자기 디스크 (a.k.a SSD)는 컴퓨터 시스템과 고속 연결을 통해 연결되어 있다. SATA 대표적으로 SATA(Serial ATA) 인터페이스와 SAS(Serial Attached SCSI 인터페이스를 제공한다. (보통 SAS는 서버에서만 사용된다) SATA-3는 명목적으로 초당 6GB를 지원하고 초당 600MB의 전송 속도를 지원한다. 반면, SAS 버전3은 초당 12 기가 비트의 전송 속도를 지원한다. NVMe NVMe(Non-Volatile Memory Express) 인터페이스는 SSD를 더 좋게 지원하기 위해서 논리적 인터페이스 표준이다. 그리고 주로 PCIe 인터페이스와 함께 사용된다. (PCIe 인터페이스는 내부 컴퓨터 시스템에서 고속 데이터 전송을 지원한다) SAN 디스크는 일반적으로 ..

[DB] Chapter 12-1. Overview of Physical Storage Media

컴퓨터 시스템에서 여러 유형의 데이터 스토리지가 존재한다. 이러한 저장 매체들은 다음과 같은 기준으로 분류된다. 데이터에 접근할 때 속도 매체를 구매할 때 비용 당 데이터 단위 (cost per unit of data) 매체의 신뢰성 전형적인 매체들은 다음과 같다. Cache : 가장 빠르고 비싼 저장 장치. 캐시 메모리는 상대적으로 작고 컴퓨터 시스템의 HW에 의해 운영된다. DB 시스템에서는 캐시 스토리지를 신경쓰지 않아도 되지만 자료구조와 알고리즘을 처리하는 쿼리를 디자인할 때 데이터베이스를 구현하는 사람이 캐시의 영향을 주의할 필요는 있다. 이후에 좀 더 얘기해보자. Main memory : 조작이 가능한 데이터에 사용되는 저장 매체는 주기억장치(main memory)이다. 범용적인 기계 명령어는..

[DB] Part 5. Storage Management and Indexing

데이터베이스 시스템이 데이터를 고수준의 관점에서 제공하지만, 결국 데이터는 하나 이상의 저장 장치에 비트 값으로 저장된다. 현재, 대다수의 데이터베이스 시스템은 자기(磁氣) 디스크에 데이터를 저장한다. 성능 요구가 높은 데이터는 플래시 기반의 SSD에 저장한다. 데이터베이스 시스템은 프로세싱을 위해 메인 메모리에서 데이터를 가져와서 지속성을 위해 데이터를 저장장치(storage)에 쓴다. 또한, 데이터는 보관을 위해서 테이프 또는 다른 백업 장치로 복사할 수도 있다. 저장 장치의 물리적인 특징은 데이터를 저장하는 방식에 중요한 역할을 한다. 왜냐하면, 자기(磁氣) 디스크에 있는 데이터에 접근하는 것이 메인 메모리에 접근하는 것 보다 훨씬 느리기 때문이다. Chapter 12에서는 물리적 저장장치(자기(磁..

[MySQL 성능 최적화] Day 1 (p.2 ~ 21)

01. MySQL 아키텍처 MySQL은 아키텍처의 특성 덕분에 광범위한 목적에 유용하게 사용된다. 작은 개인 웹 사이트에서부터 대규모 엔터프라이즈 애플리케이션에 이르기까지 크고 작은 환경에서 잘 동작할 만큼 유연하다. MySQL을 최대한 활용하려면 MySQL의 의도에 맞게 잘 활용할 수 있도록 해야 하고 그러기 위해서는 MySQL의 설계를 이해해야 한다 01장에서는 MySQL 서버 아키텍처를 살펴보고 스토리지 엔진 간의 주요한 차이점에 대해서 살펴볼 것이다. MySQL의 논리적 아키텍처 MySQL의 구성요소가 함께 작동하는 원리를 잘 이해하면 서버를 이해하는데 도움이 된다. 1번째 계층 (클라이언트) MySQL의 고유한 서비스보다는 대부분의 네트워크 기반 클라이언트/서버 도구 또는 서버에 필요한 연결 처..