본문 바로가기

Book

[대규모 시스템 설계 기초] 2장 개략적인 규모 추정

시스템 설계 면접 - 시스템 용량이나, 성능 요구사항을 개략적으로 추정해 보라는 요구

규모 확장성을 표현하는데 필요한 기본기에 능숙 해야 한다.

2의 제곱수, 응답지연 , 값, 가용성

 

 

고가용성 - 시스템이 오랜 시간 동안 지속적으로 중단 없이 운영될 수 있는 능력을 지칭

 

 

2장 핵심은 예제를 통한 QPS와 저장소 요구량 추정

예시) 트위터 사용자 3억 명 ,50%의 사용자가 매일 트위터 ,평균적으로 각 사용자는 매일 2개의 트윗을 올린다.

- 미디어를 포함하는 트윗은 10% 정도

- 데이터는 5년간 보관이 된다.

 

QPS(Query Per Second) 추정치

일간 능동 사용자 (Daily Active User DAU) = 3억 X 50% = 1.5억

QPS = 1.5억 x 2 트윗 / 24시간 / 3600초 = 3500

최대 QPS = 2 x QPS = 7000

 

미디어 저장을 위한 저장소 요구량

평균 트윗 크기

id 64byte

text 140byte

media 1mb

미디어 저장소 요구량 = 1.5억 * 2 * 10% * 1mb = 30TB/Day

 

5년간 미디어 보관하기 위한 저장소 요구량 = 30TB * 365 * 5 = 55PB (1PB, 2^50)

2의 제곱수

 

 

연산명 시간

L1 캐시 참조 0.5ns
분기 예측 오류 5ns
L2 캐시 참조 7ns
뮤텍스 락/언락 100ns
주 메모리 참조 100ns
Zippy로 1KB 압축 10,000ns=10us
1 Gbps 네트워크로 2KB 전송 20,000ns=20us
메모리에서 1 MB 순차적으로 read 250,000ns=250us
같은 데이터 센터 내에서의 메시지 왕복 지연시간 500,000ns=500us
디스크 탐색 10,000,000ns=10ms
네트워크에서 1 MB 순차적으로 read 10,000,000ns=10ms
디스크에서 1 MB 순착적으로 read 30,000,000ns=30ms
한 패킷의 캘리포니아로부터 네덜란드까지의 왕복 지연시간 150,000,000ns=150ms

 

대략적으로 프로젝트의 규모나 구조를 파악하기 위해선 이 정보들을 알아두는 것이 좋다.