Gumball12/19-2-h-ai.md

## 19-2-h-ai.md

      
    Raw
  

              19-2-h-ai.md
            
          
    탐색


탐색

상태공간 내에서
시작상태에서 목표상태까지의 경로를 찾는 것
각 상태를 생성하는 것을 연산자 라고 함


상태, 연산자, 그리고 상태 트리를 이용해 답을 찾아나가는 것

물론 이를 직접 프로그래밍 하지는 않으며, DFS/BFS 를 사용해 풀어나감


알고리즘

맹목적인 탐색

임의의 경로: BFS, DFS
최적의 경로: 균일 비용 탐색


경험적 탐색(휴리스틱)

임의의 경로: 언덕오르기, 최적 우선
최적 경로: A* 알고리즘


이를 8-Puzzle 예제를 통해 보도록 하겠다


8-Puzzle


8-puzzle에서의 시작, 목표 상태는 다음과 같음


연산자는 총 4개가 있으며, 다음과 같음

UP: 공백을 위로
RIGHT: 공백을 우측으로
BOTTOM: 공백을 아래로
LEFT: 공백을 좌측으로


DFS


Stack을 이용

알고리즘 보면 알겠지만, FIFO


// define arrays
open := [start]
closed := []

while (open != []) { // while open has items
  item := open.unshift() // get item (when left end of open)

  if (item == goal) { // check item is goal state
    return SUCCESS
  }

  closed.push(item) // put item on closed

  for(generated_item : generate_children(item)) { // generate children of item
    if ((open or closed) not contain generated_item) { // check duplicated
      open.shift(generated_item) // left end of open
    }
  }
}

맨왼쪽의 open item 얻어내고
이를 goal state와 비교하고
아니면 children generate하고
closed와 비교해 중복제거하며 open의 왼쪽에 넣고
마지막으로 item을 closed에 넣어주고

BFS


Queue 이용하는 것

LIFO


open := [start]
closed := []

while (open != []) {
  item := open.unshift()

  if (item == goal) {
    return SUCCESS
  }

  closed.push(item)

  for (generated_item : generate_children(item)) {
    if ((open or closed) not contain generated_item) {
      open.push(generated_item) // right end of open
    }
  }
}

알고리즘 나머지 다 같고
단지 generated_item을 open의 right에 넣는다는 차이점 만 있다
이건 LIFO로 구현해야 하니 이러하게 된 것


효율은 BFS가 더 좋다

경험적 탐색


그러나 이들은 가능한 노드를 모두 탐색해대니 느릴 수 밖에 없다

경험적 탐색은 경험적(휴리스틱) 정보 를 사용해 좀 더 효율적인 동작이 가능하다


8-puzzle에 대한 휴리스틱 정보는 다음 두 가지로 나눌 수 있다

h1: 현재 제 위치에 있지 않은 타일의 개수
h2: 각 타일의 목표 위치까지의 거리


이들을 이용해 각각의 휴리스틱 탐색을 진행할 수 있는 것

휴리스틱 정보. 즉, 평가함수의 값을 원하는 상태(goal)로 향하도록 진행하는 탐색
가령 h1은 값이 낮은 방향으로 진행하는... 그런 것을 말한다
이렇게 평가함수는 문제에 따라 종속적이라고 할 수 있음


이는 언덕오르기 알고리즘 을 이용해 진행한다

자신이 목표로 하는 상태에 더 가까운 것을 선택하는 알고리즘
선택되지 않은 상태는 저장되지 않음 = 중복허용
더 이상 선택할 것이 없을 때, 그 곳을 정상이라고 판단

이 때문에, local maxima 이슈가 발생될 수 있고


알고리즘은 다음과 같음


open := [{ start, eval_value }]
closed := []

while (open != []) {
  item :=  open.unshift()

  if (item == goal) {
    return SUCCESS
  }

  closed.push(item)

  for (generated_item : generate_children(item)) {
    if ((open or closed) not contain generated_item) {
      eval_value := calc_eval(generated_item) // calc eval_function value

      open.push({ generated_item, eval_value })

      open.sort('eval_value') // sort by 'eval_value'
    }
  }
}

그러나 local maxima같은 문제가 발생하게 된다

A* 알고리즘


너무 깊이는 들어가지 않도록 하는 것

평가함수 f(n) = g(n) + h(n)
h(n): 현재 노드에서 목표까지의 거리
g(n): 초기 상태에서 현재까지의 비용(깊이)


알고리즘은 비슷한


open := [{ start, eval_value }]
closed := []

while (open != []) {
  item := open.unshift()

  if (item == goal) {
    return SUCCESS
  }

  closed.push(item)

  for (generated_item : generate_children(item)) {
    if ((open or closed) not contain generated_item) {
      // eval_value = h + g
      eval_value := calc_h(generated_item) + calc_g(gengerated_item)

      open.push({ generated_item, eval_value })

      open.sort('eval_value') // sort by 'eval_value'
    }
  }
}
탐색의 방향


지금까지 한 탐색은 '전향추론'

전향추론: 초기상태 => 목표상태 탐색
후향추론: 목표상태 => 초기상태 탐색


문제에 따라 후향추론이 더 알맞은 경우도 있다


Mini-Max 알고리즘


두 명 이상의 상대가 서로 겨룰 때 사용할 수 있는 알고리즘

depth를 진행할 때 마다 서로 번갈아가며
자신에게 최적인(자신이 원하는) 결과를 취하도록 한다
위의 그림에서는 짝수는 Max, 홀수는 min 값을 취하도록 함


마지막 node에 도착해야만이 중간 node의 값을 알 수 있음

아래부터 올라오는 구조이기 때문
따라서 비효율적
또한, 너무 깊이 들어갈 수가 있기에 max-depth를 잡곤 함


alpha-beta 가지치기


a, b를 이용해 가지쳐서 Mini-Max 알고리즘을 좀 더 빠르게 진행할 수 있도록 하는 방법

a는 Max (init: a := -inf)
b는 min 을 가리킴 (init: b := inf)


진행하며 가지치는 것

방법은 유튜브 참고


전문가 시스템


생성규칙: IF-THEN 으로 표현한 문장

IF: 조건
THEN: 결과


전문가 시스템은 info와 생성 규칙을 이용하는 것

정보(info): 의미가 있게 체계화된 것
데이터: 의미가 없는 그냥 사실
지식(knowledge): 더욱 일반화되고 모호해진, 정제된 정보


이런 전문가 시스템은 사실로 새로운 사실을 만들어 내는 것이기에

결과에 대한 이유를 설명할 수 있다


전문가 시스템의 세 파트

지식 베이스
추론엔진
인터페이스


다음과 같이 동작하는 것


점화를 이용해 추론을 진행하는데

이 떄, 순방향/역방향이 가능


순방향 연결 추론


사실 Z를 찾는다고 하자

초기값은 다음과 같다고 가정하고
찾는 과정은 아래와 같음


기반지식 위에서부터 하나씩 진행한다

Y & D랑 X & B & E 이거 세 개는 없어서 건너뛴거


사실 A가 있으니, A -> X 진행하고

X를 사실DB에 넣으라는 말


C 있으니, C -> L
L & M은 없으니 일단 건너뛰고

다시 맨 위에서부터 시작


X & B & E 있으니, X & B & E -> Y 진행

L & M은 마찬가지로 없고


Y & D 있으니, Y & D -> Z 진행

이를 통해 Z를 찾아내지


이렇게 진행하는 것이다

단, 보다싶이 마구잡이로 사실을 막 생성하기에
좀 비효율적 ㅎ


역방향 연결 추론


얘는 목표 지향

쓸데없는 상태 만들지 않는다는 말
왜냐고? 애초에 goal에서 시작하걸랑
초기 상태는 동일


목표 사실 Z부터 시작해 역으로 추론을 시작한다
Y & C -> Z니까, Y와 C를 찾아줌

참고로 C는 이미 있으니, Y만 찾아주면 되겠지


X & A -> Y

A는 이미 있고, X만 찾아주면 된다


B -> X

이를 통해 Z가 추론가능함을 알 수 있겠지


그대로 추론진행

지식표현


AI의 핵심은 지식 인데, 이를 체계적으로 정제한 것


지식표현 종류

논리
규칙
의미망
프레임
OOR(Object-Oriented Representation)


규칙

앞서 전문가시스템에서 봤지
(A, B) -> (C, D, E) 로도 표현이 가능하댄다


의미망

카나리 is a 새
새 has 날개
배니 is a 카나리
뭐 이런 관계를 명시한 것
전문가 시스템과 함께 사용하곤 한다


프레임

속성과 메서드가 합쳐저 있는, 마치 Class 비슷한 애
전문가 시스템과 함께 사용하곤 한다


몀제논리의 추론


인공지능에서의 논리

명제논리: P, R 이런걸로 추상화하는거
술어논리: 전체 문장을 주어/목적어 이렇게 분리하는 것


이 중, 명제논리를 구현해보면 다음과 같음


C
D

C -> D


T
T

T


T
F

F


F
T

T


F
F

T


이게 뭘 의미하느냐?

조건 C가 참이면, 결과 D도 참
물론, C가 참이 아니어도, 결과 D는 참이 될 수 있음
그러나, C가 참이나 결과 D가 거짓일 수는 없음


기억해야하는 규칙들 (위의 구현과 함께 보면 좋겠지)

Modus Tollens(부정식)

A -> B일 때, ~B 면 ~A
결과가 false면, 가정도 false
(A -> B) and ~B => ~A


Modus Ponens

A -> B일 때, A면 B
가정이 true면, 결과도 true
(A -> B) and A => B


Chain Rule (삼단논법): A -> B, B -> C일 때, A -> C

A -> B and B -> C => A -> C


술어논리의 추론


명제논리를 술어논리로 변환


p
q

~p

~p v q

p -> q


T
T

F

T

T


T
F

F

F

F


F
T

T

T

T


F
F

T

T

T


그냥 뭐 그대로 대치되는 것

즉, ~p v q <=> p -> q


예시

forall(x): DOG(x) -> MAMML(x)
~DOG(x) v MAMML(x)


Fuzzy


fuzzy: 확실하지 않은... 확률의 세계 (0.0 ~ 1.0)

fuzzy logic: 명확히 정의할 수 없는 지식을 표현하는 방법
fuzzy set: 이런 애매모호한 값들의 집합을 나타내기 위한 방법


일반 집합

A = { x | x > 6 }


퍼지 집합

A = { x, u A(x) | x in A }

u는 비율


A = { u A (x_i) / x_i | x in A } (참고로 /는 나누는 게 아니라, 그냥 구분기호임)

A = {u_A (x_1) / x_1}, {u_A (x_2) / x_2}, ...
이렇게 비율별로 나타내는 것


연산


설정한 Fuzzy set에 대해, 이를 좀 더 집중화 할 수가 있다

이를 헤지 라고 하며, 좀 더 모호한?표현을 할 수 있도록 함


일반적인 퍼지 집합


헤지를 적용한 퍼지 집합(초록색)


이러한 헤지는 기존의 퍼지 집합에 대해 다음과 같은 연산을 통해 가능하겠지

[u_A (x)]^{n}
n < 1: 볼록해짐
n > 1: 오목해짐 (위 그림과 같음)


퍼지추론


규칙에 대해

OR: max
AND: min
NOT: 1 - value (여집합)


전건: IF


후건: THEN


소속 함수: u_A (x)


1. 뭐암튼 이렇게 해서 퍼지 값을 구하고 (퍼지화)


어떠한 일을 진행하는데 있어 정의된 평가 기준에 따라 퍼지값을 구한다


A

u(x = A2) = 0.2
u(x = A3) = 0.2


B

u(y = B1) = 0.1
u(y = B2) = 0.8


2. 이를 규칙에 따라 값을 구한다 (규칙 평가)


위와 같은 규칙 집합 및 아래와 같은 규칙들이 있다고 한다

이 역시 미리 정의된 규칙이겠지


규칙1 (C1): x가 A2 OR y가 B1

max(u(x = A2), u(y = B1)) = max(0.2, 0.1) = 0.2
즉, 규칙 C1 = 0.2


규칙2 (C2): x가 A2 AND y가 B2

min(u(x = A2), u(y = B2)) = min(0.2, 0.8) = 0.2
즉, 규칙 C2 = 0.2


규칙3 (C3): x가 A1

C3 = u(x = A1) = 0


이를 통해 위와 같이 구해지겠다

3. 통합 (규칙 후건의 통합)


이렇게 통합되고

4. 역퍼지화


다음 수식을 통해 무게중심을 구한다

무게중심의 값은 u_A (x) 안에 있다


해 보면 다음과 같음


즉, 35%의 확률로 어떠한 일이 발생된다는 것을 암시한다는 말

베이즈 추론


다음을 기반으로 한다


위를 통해 다음을 이끌어낼 수 있다

A와 B가 함께 일어날 확률은
B가 일어난 상태에서 A가 일어날 확률


여기서, 교집합의 교환법칙으로 인해 다음과 같음을 알 수 있다


따라서, 다음과 같다고 할 수 있다


응용


A가 일어날 확률을 다음과 같이도 표현할 수 있을 것이다

B가 일어난 상태에서 A가 일어날 확률 +
B가 일어나지 않은 상태에서 A가 일어날 확률
이를 수식으로 표현하면 다음과 같다


이를 통해 위의 식을 다음과 같이 표현할 수 있음


문제풀이

진화 알고리즘


인코딩 과정

평가
선택
교차
변이 (이후 다시 평가 반복)


참고

n-queen 경우의 수


노팅


지식, 정보, 데이터
낫피오큐
modus tollens
modus ponens
소속 함수
평가, 선택, 교차, 변이


## 19-2-h-compiler.md

      
    Raw
  

              19-2-h-compiler.md
            
          
    1. 컴파일러의 개요

1.1 컴파일러의 필요성


언어의 종류

형식언어 => 프로그래밍 언어
자연언어


매개변수


매개변수 종류

형식 매개변수: 파라미터
실 매개변수: 인자


매개변수 전달 방법

참조 호출: call by reference
값 호출: call by value
이름 호출: 파라미터 자체가 인자로 치환되는 것


매개변수 전달 방법 예제


다음을 각각 참조, 값, 이름 호출로 호출하면?

Begin Integer A, B:
  Procedure F(X, Y, Z); Integer X, Y, Z;
    Begin
      Y := Y + 2;
      Z := Z + X;
    End F;

  A := 3;
  B := 5;

  F(A + B, A, A);
  PRINT A         // <= 결과무엇?

END


참조

Y와 Z가 A를 가리킨다는 것만 잘 알고 있으면 된다
따라서 PRINT A는 13을 출력


값

이건 뭐... 당연히 3을 출력


이름

F(X, Y, Z)가 F((A + B), A, A)로 변하는 것
따라서 다음과 같아진다

Y := Y + 2 => A := A + 2 => A := 5 + 2
Z := Z + X => A := A + (A + B) => A := 5 + (5 + 5)


답은 15


1.3 번역기의 종류


어셈블러

대부분 two-pass-assembler 로 구성된다
first pass: 어셈블리 코드로 기호표를 작성
second pass: 이를 bit로 표시


2. 간단한 컴파일러의 구조

2.1 컴파일러의 논리적 구조


다음 순서로 진행되겠지

어휘분석: 토큰화
구문분석: 파스 트리
의미분석
중간코드 생성
최적화
목적코드 생성
목적 프로그램


구문분석에서 parse tree 만드는거 나온다고


## 19-2-h-network.md

      
    Raw
  

              19-2-h-network.md
            
          
    1.1 인터넷이란 무엇인가


구성 요소

물리

host (end-system)
link
switch (router)


논리

인터넷
프로토콜
인터넷 표준 (RFC, IETF)


ISP: Internet Service Provider


Switch는 host간의 연결을 위한 것


Router는 routing과 관련된 것


1.2 네트워크의 가장자리


네트워크 가장자리 (Edge)

여기서 호스트(클라이언트, 서버)가 있다


접속 네트워크 (Access Network)

유/무선 통신 link


코어 네트워크 (Core Network)

상호 연결된 라우터들
네트워크들의 네트워크


DSL: 기존의 전화선 사용한 통신 (돈애낄려고)


FTTH: 광케이블 (개빠름)


Ethernet: 내부 통신망

Ethernet Switch 라는 걸 이용한댄다


IP (Internet Protocol)

무수한 길이 있는 Internet에서 올바른 길을 찾기 위한 프로토콜


TCP: host에서 동작하는 프로토콜

Router는 이를 보내기만 하는 것
이 프로토콜을 통해 데이터가 섞여 들어와도 올바르게 통신이 가능하다


1.3 네트워크 코어


네트워크 코어(코어 네트워크) 란?

위 그림에서도 나오듯, 상호 연결된 라우터들의 연결망
패킷 스위칭 기법을 사용하여 데이터를 분할해 최대 전송률 속도로 전송

패킷 스위칭: 패킷이 어디로 가는지를 선택하는 것


라우터들을 거쳐 상대방 host로 도착하게 된다


네트워크 코어는 패킷에 대한 라우팅 그리고 전달 이 주요 기능

라우팅

Src에서 Dest까지 패킷 경로 결정 (라우팅 알고리즘에 따라)
이를 통해 라우팅 테이블이 만들어진다


전달

라우팅 테이블에 따라 패킷을 전달


네트워크 코어의 구성 방식은 패킷 교환 그리고 회선 교환 이 있음

패킷 교환이 더 효율적이다


패킷 교환 방식


호스트는 다음의 동작으로 송신한다

host는 message를 L bit 단위의 덩어리인 패킷 으로 분할
이를 link의 전송률(전송속도) R bits/sec 로 전송


이렇게 하나의 패킷을 전송하는데 걸리는 시간을 전송 지연 이라고 함

전송 지연 = link로 L bit를 전송하는데 걸리는 시간 = L / R


큐잉 지연 및 손실

만약 link 속도보다 패킷 들어오는 속도가 빠르면, Queue를 사용해 패킷을 버퍼링한다
만약 큐가 꽉 찼다면? 그대로 손실되는거

단, TCP에서 이러한 loss를 관리해 다시 보내게끔 한다


큐에 이렇게 쌓이는 것을 혼잡 이라고 함


전송 지연 및 Store-and-forward 전달


패킷 전송 시, 목표 라우터에 모두 도착해야 다음 라우터로 전송한다

이를 store-and-forward 전송 이라고 함
위 그림의 경우, 총 2 * L / R 전파 지연이 걸리겠지


전송 지연의 예시; L = 7.5 Mbits, R = 1.5 Mbps

전송 지연: 7.5 / 1.5 = 5 sec
총 전송 지연: 5 sec * 2 hop = 10 sec


회선 교환 방식


일정 시간동안 link 나눠 예약하는거

자원 공유 불가능하고
지속적으로 끊김 없이 연결되겠지
물론 사용하지 않는 경우, 그냥 그대로 낭비되는 것이겠지


FDM (Frequency-Division)

주파수 단위로 나눠 공유


TDM (Time-Division)

시간 단위로 나눠 공유


1.4 패킷 교환 네트워크에서의 지연, 손실과 처리율


패킷은 link 출력 용량 넘어서면 Queue에서 대기

큐잉지연: 패킷이 큐에서 대기하는 지연
전송지연: 패킷을 링크로 밀어내는 지연 (L / R)


패킷 지연 유형

큐잉 지연
전송(Transmission) 지연
전파(Propagation) 지연
노드 처리 지연
전체 노드 지연은 이를 모두 더한것: 큐잉 + 전송 + 전파 + 노드 처리


노드 처리 지연

라우터에서 패킷을 어디로 보낼까 조사하는 지연
일반적으로 ms 이하


전파 지연

link에 오르고, 다음 라우터까지 전파되기까지의 지연
FTTH 통해 거의 빛의 속도로 보낸다
라우터 간의 거리 / 전파 속도 = d / s


큐잉 지연은 다음과 같이 측정이 가능: La / R

L: 패킷 깃이, bit의 수
R: link로 나가는 속도
a: 큐로 패킷이 들어오는 비율
La: bit가 큐로 들어오는 비율
이 값이 1에 가까울수록 link의 처리율에 가까워진다는 의미고, 이는 즉 큐잉 지연이 개높아진다는 의미가 되겠지


전파 지연과 전송 지연의 차이 예제 1


가정

총 12대의 차

12대 = 패킷
여기서 각각의 차는 패킷의 bit를 의미


100km마다 놓여있는 톨게이트
톨게이트는 차 한 대당 10초 걸림
차의 속도는 100km/h


계산

전송 지연: 12대 * 10초 = 120초 = 2분

즉, 마지막 차가 보내지는 데 까지 2분


전파 지연: 100km / (100km / h) = 1시간 = 60분


총 지연: 62분

막차출발 + 전파지연


전파 지연과 전송 지연의 차이 예제 2


가정

총 12대의 차
100km마다 놓인 톨게이트
톨게이트는 차 한 대당 1분 걸림
차의 속도는 1000km/h


계산

전파 지연: 100km / (1000km / h) = 0.1시간 = 6분
전송 지연: 12대 * 1분 = 12분


7분 후에는 이미 두 번째 톨게이트에 차가 도착해 있는 상황

첫 번째 톨게이트에서 출발하지도 못한 차가 있는데 말이지
그러나 모든 차가 두 번째 톨게이트에 도착해야 하기에(store-and-forward) 두 번째 톨게이트에서 기다림


총 지연: 12분 + 6분 = 18분


처리율


host 간에 비트가 전송되는 비율

전송률이 아니다. 이건 node(router) 사이에 비트가 전송되는 비율을 의미


host 간의 처리율은 bandwidth가 더 작은 곳의 전송률을 따른다


이 경우 min(R_s, R_c) 가 된다는 말

제일 느린것을 찾는다는 말
이렇게 처리율을 제약하는 link를 병목 링크 라고 한다


처리율 예제


10개의 클라, 10개의 서버

중간의 링크는 10개의 다운로드에 대해 공평하게 처리한다고 가정


이 때의 처리율은?

min(R_s, R_c, R / 10)
마찬가지로 제일 느린걸로 처리율을 판단한다


1.5 프로토콜 계층과 서비스 모델


프로토콜에도 계층이 있다

이를 통해 side-effects 없이 Interface로 서로 통신이 가능


원래는 OSI 모델이었는데

물링네전세프응
여기서 세션, 프레젠테이션 부분 빠지고 아래의 형태로 간략화되었다

이를 application 계층에서 구현했기 때문


프레젠테이션: 압축, 암호화 등 데이터 의미 해석
세션: 데이터 교환 경계


인터넷 프로토콜 스택

애플리케이션: Message

네트워크 응용
Socket을 이용해 트랜스포트 계층과 데이터 주고받음
FTP, SMTP, HTTP


트랜스포트: Segment

프로세스간 데이터 전송
TCP, UDP


네트워크: Datagram

호스트간 데이터 전송
IP


링크: Frame

노드간 데이터 전송
Ethernet, WIFI


물리

매체 상 데이터 전송


캡슐화: 패킷 = 헤더 + 페이로드

헤더: 프로토콜 레이어 데이터
페이로드: 지금까지 붙은 데이터들


2.1 네트워크 애플리케이션의 원리


프로세스는 Socket을 통해 통신

Socket은 애플리케이션 계층과 트랜스포트 계층 사이의 인터페이스


애플리케이션 계층 프로토콜

메시지 타입이나 문법, 의미에 대한 규칙이겠지
HTTP같은 Open Protocol도 있고, Kakao같은 Private Protocol도 있고


여기서는 트랜스포트 계층에 다음을 요구한다

데이터 무결성
최대의 처리율
최소한의 지연
보안


이에 대해 Transport layer는 다음 서비스를 제공한다

TCP
UDP


TCP

연결지향형 (handshake)
신뢰성 (무결성)
흐름제어
혼잡제어
제공하지 않는 것들: 시간, 처리율, 보안


UDP

비연결형 (non-handshake)
비신뢰적

데이터가 도착하든말든 지 보낼것만 보냄


제공하지 않는 것들: 흐름제어, 혼잡제어, 시간, 처리율, 보안


SSL (보안 TCP)

암호화 없는 TCP와 UDP
때문에 Application layer에서는 SSL을 구현해 사용한다


2.2 웹과 HTTP


HTTP

애플리케이션 계층에서의 웹 프로토콜
클라이언트/서버 모델
TCP 사용해 통신한다 (port: 80)


HTTP는 State-less 프로토콜 (복잡해서)

이전 상태가 어떠했는지 정보를 유지하지 않는다는 말
이건 직접 구현하든가 해야만 한다는 의미이다


연결 방식

비지속 연결: 1연결 1객체 받아오기

Request/Response 서로 분리된 TCP 연결에서 진행
HTML 해석하다가 필요한 객체 있으면 그거 또 새로 연결해서 받아오고 하는거
비효율적


지속 연결: 1연결 n객체 받아오기

Request/Response 서로 같은 TCP 연결에서 진행
마찬가지로 필요 객체 있으면 그냥 연결된 TCP 이용해서 계속 받아오는거


RTT: 서버까지 왔다갔다 하는 총 시간

비지속 연결: 2RTT (초기화 + 파일요청)

이 때문에 종종 병렬로 요청하곤 한다고 함


지속 연결: 1RTT


HTTP는 두 가지 종류의 메시지가 있다.

Request, Response
메시지 포맷을 잘 알아두자


쿠키

사용자 상태를 추적하기 위해 사용함
이를 이용해 사용자 상태의 보존이 가능
다만 정보유출의 가능성이 있겠지


REST

웹을 활용한 분산 시스템 소프트웨어 아키텍쳐
CRUD


HTTP Request Message


method: GET, POST, OPTION, DELETE, ...
URL: File path
Version: HTTP/1.1, HTTP/2
header field name: Content-Type, Accept-Headers, User-Agent, ...

HTTP Response Message


version: HTTP/1.1, HTTP/2
status code: 200, 301, 400, 404, 505 ...

200: 성공
301: 객체 이동됨
400: 요청 이해 불가
404: 존재하지 않는 문서
505: 요청한 HTTP 버전을 지원하지 않음


phrase: 상태와 관련된 문장 (OK, ERR, ...)

웹 캐시 (프록시 서버)


Origin Server를 대신해 HTTP 요청을 처리하는 서버

브라우저는 웹 캐시에 요청하고, 있으면 그걸 사용하는 것 (혼잡제어)
없으면 뭐 프록시 서버가 Origin에서 가져와 줘야지


이런건 개인이 아니라 ISP가 설치한다

이를 이용하면 느린 네트웤에서도 어느정도 빠르게 가능할테니까


조건부 GET

프록시 서버는 일정 시간마다 Origin으로 GET 하는데
만약 이게 최신버전이다? 그럼 Body 보내지 않는 것


사용 예시; 웹 캐시가 없을 때


가정

내부 네트워크 전송률: 100Mbps
외부 네트워크로 나가는 link 전송률: 15Mbps
파일 크기: 1MB
요청 주기: 15 회 / 초


결과

LAN 이용률: (15회 * 1MB) / 100Mbps = 0.15, (15%)
link 이용률: (15회 * 1MB) / 15Mbps = 1, (100%)

문제발생


물론 link 증설하면 되겠지만, 돈이 많이 들고 웹 캐시보다 효율도 떨어진다


사용 예시; 웹 캐시가 있을 때


가정

내부 네트워크 전송률: 100Mbps
외부 네트워크로 나가는 link 전송률: 15Mbps
파일 크기: 1MB
요청 주기: 15 회 / 초
캐시 히트 확률: 40%


결과

회선 이용률 40% 감소


2.3 인터넷 전자메일


메일은 다음의 주 요소로 이루어짐

사용자 에이전트

메시지 읽고, 작성하고, 보내고


메일 서버

Mailbox: 메일 받은거 저장
Queue: 메일 보낼 때 큐잉


SMTP: 메일 주고받는 프로토콜

서버: 받는 메일 서버
클라이언트: 보내는 메일 서버


POP, IMAP, HTTP: 메일 꺼내오기


RFC 822: 텍스트 메시지 포맷 표준


SMTP


포맷(RFC 822) 구성

header

To, From, Subject


body

ASCII 메시지


3가지 전송 과정 (지속 연결 사용, HTTP의 그것)

handshake
메시지 전송
종료


SMTP
HTTP


Resource PUSH 프로토콜
Resource PULL 프로토콜


객체 자체를 하나의 메시지로
각 객체는 응답 메시지 안에 캡슐화됨


HTTP와의 차이점은 위와 같음

Resource PUSH: 말 그대로 서버에 리소스 밀어넣는거지
Resource PULL: 말 그대로 서버에서 리소스 가져오는거지


MIME


ASCII가 아닌 데이터를 보내기 위한 RFC 822 확장

텍스트 아닌 건 일단 ASCII로 인코딩하고
헤더에 타입 명시


보통 base64 인코딩 진행

'8bit * 3개' 이거를 '6bit * 4개' 이거로 바꿈
ASCII 표현을 위함


POP, IMAP, HTTP


이 프로토콜들을 이용해 메일 서버에서 메시지를 추출

요즘엔 HTTP를 사용해서 가져오곤 한다


POP

State-less
다운로드 후 바로 삭제 (말 그대로 POP)


IMAP

State 유지


2.4 DNS


Domain to IP

도메인(호스트 네임)을 들어가면 IP로 연결
반대는 성립하지 않음 (이름만으로는 접속할 수 없기에 IP랑 연결해줘야 하겠다)
계층구조


DNS는 해당 호스트 네임에 대해 여러 별칭을 만들어놓는다

이를 통해 부하 분산이 가능


이렇게 계층화시킨다

com의 DNS 서버를 찾기 위해 root 서버에 질의
amazon.com의 DNS 서버를 찾기 위해 com DNS 서버에 질의

TLD (Top-Level Domain) 서버


www.amazon.com의 IP 얻기 위해 amazon.com에 질의

책임 DNS 서버


우측의 것부터 하나하나씩 풀어나가는 것

TLD 서버: com, org, kr, uk 이런거에 대한 책임 서버
책임 DNS 서버: host name을 최종적으로 IP 주소로 매핑시키는, 기관 내 서버
로컬 DNS 서버: DNS 서버에 대한 프록시 서버


동작 예시

반복적 질의


gaia.cs.umass.edu를 질의


반복적 질의는 Local DNS Server가 IP 알아내는 것을 책임지는 것


IP 주소 알기 위해 Local DNS Server 로 질의

안타깝게도 Local DNS Server는 모른다고 가정


때문에, root 주소부터 알기 위해 Root DNS Server 로 질의
결과를 받고
결과를 이용해 TLD Dns Server 다음 질의
받고
결과 이용해 책임 DNS Server 로 IP 주소 질의
gaia.cs.umass.edu IP 주소 얻어나고
이를 클라이언트에게 반환

재귀적 질의


gaia.cs.umass.edu를 질의


재귀적 질의는 상위 DNS Server가 알아내는 것


Local DNS Server로 질의하고
Local DNS Server는 아는게 없으니 root부터 알기 위해 root DNS Server로 질의
Root는 자신이 아는걸 이용해 질의와 관련된 TLD DNS Server로 질의
TLD DNS Server는 이를 마찬가지로 질의와 관련된 책임 서버로 질의
책임 서버는 질의에 대한 IP 주소를 알아내고
이를 TLD DNS Server로 반환
이를 Local DNS Server로 반환
클라이언트에게 반환

DNS 레코드


DNS는 자원 레코드(Resource Record, RR) 를 관리하는 것

RR format: (name, value, type, ttl)


Types

A; host Address

name: 호스트 네임
value: IP 주소


NS; Name Server

name: 도메인 (e.g. foo.com)
value: 도메인에 대한 책임 서버 DNS의 호스트 이름


CNAME; Canonical NAME

name: 별칭 호스트 네임 (e.g. www.ibm.com)
value: 정식 호스트 네임 (e.g. servereast.backup2.ibm.com)


MX; Mail eXchange

value: 메일서버의 별칭 호스트 네임
name: 메일서버의 정식 호스트 네임


DNS 프로토콜의 메시지 포맷은 다음과 같음

질의 또는 응답 시 이런 포맷을 사용


message headers

Identification

질의를 식별 식별자
응답도 같은 식별자를 보냄


Flags

질의/응답 구분
재귀적인 질의 요청


Records

<n>은 레코드 개수를 의미
아래 record body와 중복되는 내용이기에, 구조가 크게 어렵지는 않음


2.5 P2P 파일분배


구조가 복잡

대신에 서버/클라 형태가 아니기에 대역폭이 작아도 서비스 가능


파일 분배 예시; 서버와 P2P 성능비교


파일크기: F
피어(클라이언트) 수: N
업로드 속도 u

클라-서버 모델


서버: 파일 복사본 N개를 클라에게 전송한다

1개 전송 시간: F / u
N개 전송 시간: N * F / u
참고로 서버가 분할적으로 클라이언트에게 뿌린다고 생각하자


클라이언트: 파일을 다운로드한다

d_min: 가장 낮은 다운로드 속도를 갖는 클라의 다운로드 속도
이 클라의 다운로드 시간: F / d_min


클라-서버 방식으로 N 개의 클라에게 F를 분배하는 시간 D

D >= max(N * F / u, F / d_min)
클라 수가 많아지면, 더 오래 걸릴 것이다


P2P 모델


서버: 복사본 1개만을 전송

1개 전송 시간: F / u


각 피어: 파일 다운로드

d_min: 가장 낮은 다운로드 속도를 갖는 피어의 다운로드 속도
이 피어의 다운로드 시간: F / d_min


모든 피어: 파일 업로드

피어 i의 업로드 속도: u_i
모든 피어의 업로드 속도: sum(u_i)
전체 업로드 속도: u + sum(u_i)

서버 + 피어 업로드 속도


N 피어에게 분배하는 시간: N * F / (u + sum(u_i))

피어 수 N이 증가할수록, 업로드 속도 u + sum(u_i)도 증가하겠지


P2P 방식으로 N개 의 피어에게 F를 분배하는 시간 D

D >= max(F / u, F / d_min, N * F / (u + sum(u_i))


2.6 비디오 스트리밍과 CDN

스트리밍


압축 기법

CBR: 일정한 속도의 인코딩
VBR: 공간, 시간적으로 가변적인 인코딩


DASH (Dynamic, Adaptive Streaming over HTTP)

멀티미디어 파일을 조각(blob)낸 다음
이를 대역폭에 따라 가변적인 품질로 보내는 것


CDN


다수의 분산된 서버

각 서버에 컨텐츠의 복사본이 저장되어있다
Origin Server에 CDN Manifest 요청하고, 이를 통해 CDN에서 데이터 가져오는 것


종류

enter deep: ISP 내부에 깊숙히 배치되어있는 CDN
bring home: ISP 근처에 구축한 CDN


OTT: 인터넷을 통해 미디어 컨텐츠를 제공하는 서비스

넷플릭스 이런거


CDN 컨텐츠 접근 동작


컨텐츠 받기 위해 Origin Server인 www.NetCinema.com 으로 접근

여기서 해당 컨텐츠의 URL을 얻어온다 (NetCinema.com/gk3RFq64)


NetCinema.com/gk3RFq64의 IP를 얻기 위해 Local DNS Server로 질의하고
NetCinema 책임 DNS Server를 찾아 질의한다

여기서 CDN URL 반환 (KingCDN.com/t4TnXZD32)


KingCDN.com/t4TnXZD32의 IP를 얻기 위해 KingCDN 책임 DNS Server를 찾아 질의
IP주소 얻어온다
이를 이용해 컨텐츠 요청 및 가져오기

2.7 소켓 프로그래밍


소켓을 이용해 트랜스포트 서비스를 이용할 수 있음

UDP: 비연결형
TCP: 연결형


UDP

초기 handshake가 없기에
요청 시마다 IP랑 Port 명시해줘야 함


TCP

초기 접속을 위한 socket 및 IP, Port 명시 필요
서버는 초기 접속 시, 해당 클라에 대한 요청을 처리하는 소켓 생성


3.1 트랜스포트 계층 서비스 개요


process 간의 논리적 통신을 위해 트랜스포트 프로토콜을 구현한다

TCP, UDP를 왜 구현(사용)하겠는가? 이를 위한 것이다


제공기능

TCP: 혼잡제어, 흐름제어, 연결
UDP: 데이터 전송
지연, 대역폭 보장은 없음


3.2 다중화(Multiplexing)와 역다중화(Demultiplexing)


다중화: 합치기 (여러 프로세스에서 하나의 데이터로)

소켓에서 데이터 모으고 헤더붙이기


역다중화: 나누기 (하나의 데이터에서 여러 프로세스로)

헤더 정보 사용해 분리된 세그먼트(메시지)를 올바른 소켓에 전달


역다중화


TCP/UDP의 Segment는 위와 같은 형태

Datagram은 이런 Segment를 하나씩 가지고 있으며, 여기에 추가로 IP 정보를 가짐
상대방 host는 이 IP, port를 사용하여 소켓으로 전달하는 것


비연결형 역다중화


UDP 말하는 것

UDP는 그냥 주기만 하면 되기에, 다음의 정보만 필요
Dest IP/port
물론 주는 건 source, dest 둘 다 주긴 함


동작은 마찬가지로 Dest IP/port 사용해 타겟 소켓으로 넘길 뿐임

Dest IP/port만 보기에
같은 목적지를 가지면, 클라이언트 구분 없이 같은 소켓으로 전달한다


연결지향형 역다중화


TCP 말하는 것

요청 받는 것 뿐만 아니라, 이에 대한 응답을 해 줘야 하기에 다음이 필요
Source IP/port, Dest IP/port


Source IP/port 그리고 Dest IP/port 사용해 타켓 소켓으로 넘긴다

같은 Dest IP/port 인 경우에도, Source IP/port가 다르다면 다른 소켓으로 넘긴다
즉, 클라이언트 구분해서 소켓으로 전달한다 는 의미


port가 소켓을 의미하지 않음을 유의한다


3.3 비연결형 트랜스포트: UDP


UDP의 기능

다중화, 역다중화
에러 검출
빠름 (혼잡지연 우회)


단점

손실 감내
순서 어긋남 감내


세그먼트 구조는 위와 같음

checksum 을 이용해 오류를 검출하는 것


3.4 신뢰성있는 데이터 전송의 원리


Unreliable한 Internet 환경에서의 데이터 전송은 많이 빡세다

이에 대한 방안이라고 RDT라는게 나왔다


RDT에서는 다음 네 개의 인터페이스를 사용함

rdt_send(): 상위계층(app-layer)에서 호출, 수신측의 상위계층으로 전송할 데이터 전달
udt_send(): 패킷을 수신 측에 전송하는 동작
rdt_rcv(): 패킷이 수신 측에 도착 시 호출
deliver_data(): 상위 계층에 데이터 전달될 때 호출 (에러없음을 의미)


RDT 1.0; 완전히 신뢰적인 채널 상의 신뢰적인 전송


다시말하지만, 하위 채널이 완전히 신뢰적인 채널에서의 전송을 의미

bit error 없고
packet loss 없고


sender에서 rdt_send() 실행되면

패킷 만들고(make_pkt())
이를 전송(udt_send())


receiver에서 데이터 들어와 rdt_rcv() 호출되면

에러 검출 필요가 없으니
바로 deliver_data() 호출해 app-layer로 데이터 전달


RDT 2.0; 비트 오류가 있는 채널


채널에서 bit error가 발생될 수 있음

checksum 사용해 오류를 검출할 수 있겠지


이를 위해, 데이터 도착 후 다음의 상태를 sender에게 보내는 것으로 정의함

ACK: 오류 없음
NAK: 오류 있고, 재전송 바람


rdt 2.0 사항들

오류 검출
피드백 전송


sender는 rdt_send() 호출되면

패킷만들고
전송하고 (udt_send())


receiver는 rdt_rcv() 확인하고

성공하면 그대로 sdt_send(ACK)
실패하면 udt_send(NAK)


sender에서는 상태 뭐오나 대기탔다가

ACK 오면 암것도안하고(Lambda)
NAK 오면 재전송 (udt_send())


그러나 ACK, NAK도 오류가 생길 수 있겠지

그럼 sender는 receiver의 상황을 제대로 알 수 없을테고
별 수 없이 패킷 재전송해버리면 중복 패킷 문제가 발생되겠지


RDT 2.1; ACK/NAK의 오류 고려


알아볼 수 없게 오면 어떡하지? 패킷이 중복되어버리는 건 어쩌나?


해결책

sender는 패킷 보낼 때 번호(0 and 1) 붙여서 전송한다
receiver는 상태 보내고, 여기서 에러가 뜬다고 가정하자
일단 에러 뜨면 재전송한다
sender는 새로운 번호 붙여서 재전송하겠지
receiver는 이걸로 다시 상태 보내고 말야


sender에서 rdt_send() 호출하면

했던 대로 패킷을 보내긴 하는데, 이번에는 번호(0 번)를 붙인다 (make_pkt(0, ...))
그리고 전송 (udt_send())


receiver는 받고 오류 있거나 0번 패킷이 아니면 #1, 없으면 #2 실행

#1: NAK 보냄. 재전송하라고
#2: 정상적으로 받았다고 ACK 보내고 deliver_data()


sender는 NAK 또는 ACK 기다렸다가 결과에 따라 행동하지

NAK거나 이상하게 오면 뭐 다시보내고, 아니면 넘어가고(Lambda)


다음 sender 전송(rdt_send()) 호출하면

패킷을 보내는데, 이번에는 1번 붙여서 전송 (make_pkt(1, ...))


receiver는 '2'에서와 마찬가지로

오류가 있거나 1번 패킷이 아니면 #3, 아니면 #4 실행


sender는 마찬가지로 NAK, ACK 기다리고 행동하고
다음 전송은 다시 0번으로 돌아간다


상태가 2배 늘어났는데, 이는 0과 1 둘 다를 표현해주기 위함이다

RDT 2.2; NAK 없는 프로토콜


놀랍게도 여기서 NAK는 빠질 수 있다고 함

receiver는 NAK 대신에, 마지막에 올바르게 수신된 패킷에 대한 ACK만을 보내면 되겠지
sender는 중복된 ACK 받았다? 그러면 재전송인거고 (NAK 받은듯이 행동)


sender 똑같이 행동은 하는데

번호붙이는거 동일


receiver에서는 ACK 줄 때, 번호를 붙여서 준다

#4: 정상적이면, 받은 데이터의 번호(0 번) 그대로 주고
#3: 아니면, 다른 번호(1 번) 주고


sender는 이거 확인해서 내가 보낸 번호와 다르다? 좀 이상한 번호다? 그러면 재전송(#1)

물론 ACK 에러나도 재전송


아니면 정상진행(#2)
이후 과정은 같음

RDT 3.0; 오류와 손실이 있는 채널


이제 bit error 뿐만 아니라, packet loss까지 고려해서 진행해보도록 하자

아예 오지 않으면 어떡하지?


해결책

sender는 충분한 시간 동안 ACK를 기다리다가... 안오면 재전송

중복 패킷 문제가 발생될 수 있지만, 이는 이미 rdt 2.1에서 해결되었다


근데 오지 않은게 아니라, 지연된 상황이었다면?

그럼 재전송은 중복 패킷이 되겠지만, 이는 앞서 말했듯이 solved 되었지


즉, Countdown timer가 필요하다


sender가 rdt_send() 호출하면 데이터를 전송하겠지

하던대로 하는데, 여기서 start_timer가 들어간다


일단 중복-ACK 또는 ACK 에러 뜨면 기다리고

어차피 Timer에서 잡아주니까


timeout 되어버리면 재전송

재전송하고 다시 start_timer로 돌리고


만약 정상적으로 오는 경우 stop_timer로 타이머 멈춰주지


참고로 receiver는 RDT 2.2와 다를 게 없다는 사실~

RDT 3.0의 동작; no loss


따로 설명은 필요없음

RDT 3.0의 동작; packet loss


처음엔 정상적으로 주고받다가
로스뜨면, 일단기다리고
timeout 되면 재전송

RDT 3.0의 동작; ACK loss


정상통신 하다가
ACK loss 뜨면?

그냥 뭐 timeout 기다린다


timeout 되면 재전송

RDT 3.0의 동작; 지연


하도 응답이 안와서 timeout되고, 재전송해버렸는데
지연된 ACK가 와버렸다?
이건 재전송된 패킷의 ACK라고 판단

다음 패킷 pkt0 보내고


receiver에서는 pkt1 이거 중복된거니 무시하고

상태도 보면 알겠지만, 이 경우에도 ACK 보내긴 하니 보내줌


ACK1 sender에서 받아봤자 중복된거 아니까 아무것도 안하고(Lambda)
receiver는 ptk0에 대한 응답 ACK0 보내주고

RDT 3.0의 성능 이슈


동작은 잘 하지만, 성능은 그리 좋지 못함

한 패킷씩 보내니까
그래서 한 번에 여러 패킷을 보내는 작업을 pipeline을 사용


가정

link: 1Gbps
RTT: 30ms
L: 8000bit


결과

D = 8000 / 10^9 = 8 microsec = 0.008ms
총 지연시간 t = RTT + D = 30ms + 0.008ms = 30.008ms
이는 30.008ms동안 8000bit밖에 못 보냈음을 의미하며, 1Gbps link에서 267kbps 처리밖에 못했음을 의미

1sec / 30.008ms * 8000bit = 1000ms / 30.008ms * 8000bit ~ 267kbit


Pipeline 프로토콜


Sender가 ACK를 기다리지 않고 여러 패킷을 전송

따라서 0과 1 뿐만 아니라, 추가적으로 더 많은 순서번호가 필요


종류는 GBN(Go-Back-N), SR(Selective Repeat) 두개가 있음

뭐가 왔는지 안왔는지 판별하고, 이에 따라 패킷을 어떻게 보내줄지에 대한 종류


GBN(Go-Back-N) 방식


sender는 N개의 패킷을 ACK 없이 연속전송

receiver는 들어온 패킷에 대해 마지막으로 성공한 ACK(누적 ACK) 만을 전송
만약 ACK 번호에 갭이 있다면 그건 실패한 것
sender는 timeout 시 가장 오래된 ACK 없는 애부터 ACK 없는 패킷 재전송

사실상 ACK 없는 애부터 모든 패킷이지


이건 sender 에서만 buffer가 필요하다


Sender는 위와 같은 buffer를 가짐

ACK 정상적으로 오면 window는 한 칸씩 우측으로 이동하겠지
window size N은 그대로고 말야
timeout 되면 window 안에 포함된거 보내는거구


이를 이용한 상태도는 다음과 같다.


sender는 일단 base = 1, nextseqnum = 1 초기화한다
이후 rdt_send() 호출되면

번호붙여서 패킷전송하지
타이머도 시작하고 (start_timer)


receiver는 일단 받으면 마지막 성공 보내고
정상인 경우 한번 더 넘기고 기대넘버++ 시키지

어차피 중복패킷은 무시할테니까


sender에서 ACK 받으면

base++ 해줘서 Already ACK'd 하나 늘려주고 (#1)
끝났는지 확인해서 끝나면 stop_timer 아니면 타이머 초기화(start_timer)


sender에서 에러뜨면 타이머 대기하고
timeout 시 타이머 초기화하고, 안온것부터 해서 모두 재전송하지

ACK 없는 제일 오래된 애부터


참고로 (그림 3.19)에서 Already ACK'd 이걸로 받은거 마치 저장된듯이 보여주는데

사실 저장 안된다. 성공된거는 그냥 신경안쓰고 제거함


pkt2부터 안온다? 그럼 모두 보내는거야

SR(Selective Repeat) 방식


sender는 N개의 패킷을 한꺼번에 보내는 것은 동일

단, 개별 패킷에 대해 receiver가 ACK 보내고
sender는 마찬가지로 개별 패킷에 대한 Timer를 가짐
timeout 시 해당 개별 패킷만 resend


얘는 비순차적이기에, sender/receiver 둘 다 buffer가 필요하다


생김새는 비슷하기에 뭐 따로 적지는 않겠다

그냥 개별 패킷에 대한 타이머가 있고없고 차이


문제점

buffer(window) 크기가 너무 크면 seq num에서 중복이 일어날 수 있다
따라서 window size <= seq num / 2 이어야 함


3.5 연결지향형 트랜스포트: TCP - 세그먼트 구조


흐름 제어

sender는 receiver의 수신 한계를 넘어서는 송신을 하지 않음
이를 위해 receiver는 sender에게 window size을 전송함


src port: 출발지 port
dest port: 도착지 port
seq num: 패킷 번호
ACK num: 기대 ACK 번호 (누적 ACK)
head len: length of header
R(RST), S(SYN), F(FIN): 연결 관련 상태
receive window: receiver의 window size

TCP 왕복시간 및 타임아웃


TCP는 GBN과 유사한 타임아웃/재전송 매커니즘을 이용함

모두 보내는 대신, 가장 오래된 ACK 못받은 패킷 하나만 보내는 것


이 때, 타임아웃 거는 주기를 적절하게 잡아야 하는데, 이게 힘들더라

그래서 공식을 사용함


공식 보기 전에, 용어들부터 정의하고 들어가겠다

SampleRTT: 실제 측정된 RTT
EstimatedRTT: 예측된 RTT
DevRTT: 여유값
TimeoutInterval: 실제 적용하는 타임아웃 값


공식은 위와 같고, 이해는 다음과 같다

EstimatedRTT: 이전의 값을 지수적으로 낮추고, 새로운 값을 비율로 넣는 것
DevRTT: 이전의 값을 지수적으로 낮추고, 새로운 값(오차)을 비율로 넣는 것
TimeInterval: 이거 두 개를 더하는데 DevRTT 값이 낮으니 4를 곱해서 더함


a랑 b는 일반적으로 주어짐


3.5 연결지향형 트랜스포트: TCP - 신뢰적인 데이터 전달


TCP는 비신뢰적 채널에서도 신뢰적으로 데이터를 전송하지

pipeline
누적 ACK
재전송은 하나만 (단일 재전송)

중복 ACK 또는
타임아웃 시점에 재전송


이를 위한 sender부터 보도록 한다

간소화된 TCP Sender
중복 ACK 무시, 흐름제어/혼잡제어 무시


이러한 구조를 갖게 되면 다음과 같은 동작이 가능하다

ACK 손실


ACK 손실 발생 시
sender는 못받았으니 재전송하고
receiver는 중복패킷이니 무시하고
마지막 성공 ACK 다시보낸다

지연 발생


receiver로 중복패킷 들어오면
무시하고 마지막 성공 ACK 전송한다
sender는 이를 보고 지 할거 하고

누적 ACK


pipelining 시
들어온 ACK가 지금 가지고 있는 것보다 높으면
그걸로 취한다는 동작

빠른 재전송


timeout 주기가 효율적이지 못하면

중복-ACK 사용해 손실된거 감지하고
해당 패킷 재전송하는거


이를 빠른 재전송 이라고 하고

일반적으로 중복-ACK는 3개로 정의함


연결지향형 트랜스포트: TCP - 흐름제어


흐름제어

receiver의 buffer overflow를 방지하는 것
receiver가 주체


Receiver는 앞서 본 TCP Segment의 헤더 부분에

rwnd(receive window?) 값을 넣어서
Sender에게 버퍼 여유공간을 알림


Sender는 이 값을 보고 얼마나 보내야겠다 판단하는 것

당연한 말이지만, 여유 공간보다 적게 보내겠지


연결지향형 트랜스포트: TCP - 연결설정


TCP는 handshake 한다고 했었지

여기서 buffer(window) size, seq number 이런거 교환하는 거
메시지 교환이 아니라


이 때, handshake는 2-way가 아니라, 3-way handshake를 진행한다

handshake 시 손실이나 에러, 지연, 순서 어긋남 등이 발생할 수 있기 때문


2-way handshake에서 문제가 발생되는 이유


서버에 연결은 되었는데

클라이언트는 없는 상황


따라서 3-way handshake를 사용하여 이를 방지해야만 한다


TCP 3-way handshake


server에서는 먼저 SYN listen
client에서 SYN 보내고
server에서 받으면 SYN + ACK 보냄
client에서 이거 받으면 마지막으로 ACK 보내고

이를 FSM으로 표현하면 다음과 같음

Close


client, server 각각 한 번씩 FIN을 보내게 됨
client는 마지막 FIN을 받아도 조금 기다리는데, 이는 지연된 데이터가 있을까봐 그러는 것

혼잡제어의 원리


receiver 주체의 흐름제어와는 달리

혼잡제어는 sender가 알아서 제어하는 것


왜 혼잡이 일어나느냐?

너무 많은 Source에서 너무 많은 데이터를 너무 빨리 송신
그 결과 라우터에서 이걸 다 처리할 수가 없게 되고,,,


그럼 혼잡이 일어나면 어떻게 되느냐?

패킷 손실
패킷 지연


혼잡 시나리오


이제부터 우린 '왜 혼잡이 일어나는지' 보도록 하겠다


송신률: lambda_in, lambda_out
라우터 처리량: R

시나리오 1 - 무한 크기의 버퍼


가정

무한 버퍼
재전송 없음


이 결과 다음과 같이 나타남


라우터는 최대 R만큼 처리할 수 있으며

link가 2개니, 결국 R / 2가 최대 처리량
이걸 넘어버리면 일단 큐에 저장해대고
계속 큐에만 쌓이니... 딜레이가 개 높아지기만 한다


시나리오 2 - 유한 버퍼 (손실 가능)


가정

유한 버퍼 = 손실 있음
Sender는 손실 패킷을 재전송함


lambda_in: 보낸 패킷

lambda_in': 보낸 패킷 + 재전송 패킷
결국 패킷 손실되면 lambda_in' > lambda_in가 되어버림


이는 두 가지 상황으로 분리가 가능

Sender는 R이 처리가능할 때만 패킷을 전송함
걍 계속 보냄


시나리오 2.1 - 처리가능 전송


다음과 같은 그래프가 나오며


이는 곧 손실은 없음 을 의미

그러나 실제로는 이렇게 동작하지 않지


시나리오 2.2 - 걍 계속 보냄


손실된 패킷은 한 번만 재전송


이건 무엇을 의미하는가? #1부터 받지 못하는 loss가 생긴다는 말

어쨌건 보내는 패킷은 모두 도착한다는 말
단, delay는 책임못진다


시나리오 2.3


손실된 패킷을 두 번 재전송

넘빠른타임아웃으로 인함


이는 곧 모든 패킷을 보낼 수 없음을 의미한다

시나리오 3 - 실제 상황


얼마나 끔찍한 상황인가, 근데 이게 실제 현실에서의 상황이다


패킷 재전송이 빈번하게 일어나

패킷 전송(lambda_in')을 아무리 해도
도착은 정말 일부만 되어버리지


TCP 혼잡제어


TCP에서는 AIMD 를 이용해 이런 혼잡을 제어

손실 감지될 때 까지 window++
손실 감지된다? 그럼 window /= 2
그리고 다시, 손실 감지될 때 까지 window++


이런 그래프가 나오겠지


window


혼잡 제어 시 다음과 같은 window를 사용한다


여기서 이 cwnd가 동적으로 변하는 window 크기

TCP 슬로 스타트


하나씩 늘리는 건 좀 느리기에, 'TCP 슬로 스타트' 라는 걸 사용한다

임계치(threshold)까지는 두 배씩 늘리고, 그 이후에는 하나씩 늘림
타임아웃(손실) 발생 시 두 가지 방식으로 이를 처리

TCP Reno, TCP Tahoe
threshold는 손실 시점의 반으로 줄어듦 (cwnd / 2)


TCP Reno


타임아웃이면 cwnd = 1
3개의 중복 ACK면 cwnd /= 2

이후 하나씩 늘림 (threshold 이후니까)


TCP Tahoe


구분 없이 걍 cwnd = 1

마찬가지로 threshold까지는 두 배, 그 이후에는 하나씩


평균 TCP 처리율


슬로스타트 없고, 언제나 데이터 send한다고 하면 다음과 같은 그래프가 만들어지고


평균은 그냥 다음과 같이 구할 수 있다

(w / 2 + w) / 2 = 3 / 4 w


TCP 공평성


N개의 hosts가 R 처리율을 갖는 라우터를 사용한다고 했을 때

이상적으로 각각의 host는 R / N의 처리율을 갖겠지
물론 현실은 그렇지 않음


UDP 는 TCP를 사용하지 않는다

즉, 혼잡제어 이런거 없다는 말
UDP는 가는데, TCP는 안가고 이런 일이 발생될 수 있다는 말이다


또한 TCP를 다중으로 연결할수도 있음

남들의 대역폭을 훔치는? 뭐 그런거라고도 할 수 있겠고


명시적 혼잡 제어

sending 시, router가 datagram의 ECN 이라고 혼잡제어 여부 나타내는 값을 넣어

receiver에게 알린다


receiver는 이를 segment의 ECE 이라는 혼잡 여부 나타내는 값을 넣어

sender에게 알려
조금만 보내라고 함으로써, 명시적으로 제어


## 19-2-system.md

      
    Raw
  

              19-2-system.md
            
          
    1.1 정보는 비트와 컨텍스트로 이루어짐


컴퓨터는 모두 bit(0, 1)로 저장

이를 어떻게 해석하느냐에 따라 의미가 달라지는 것


고급 언어: 프로그래머가 작성한 소스 프로그램(ASCII)


어셈블리 언어: 명령어를 기호로 표시


기계어: bit로 표현된 명령어


1.2 프로그램은 다른 프로그램에 의해 다른 형태로 번역됨


Source Program은 c-컴파일러에 의해 기계 명령어의 Object Program으로 번역됨

이는 실행 가능하며 디스크에 저장되어있다가 RAM에 올라가 실행되는거


컴파일 과정


컴파일은 source program에 대해 네 단계를 수행하며 기계어로 번역함

전처리기(CPP), 컴파일러, 어셈블러, 링커


컴파일 시 옵션들

-O: 배포 시
-g: 디버깅 시


CPP(전처리기) *.c -> *.i

지시어(directive, #)에 따라 source program에 대한 전처리 작업 시행
가령 #include <stdio.h>나 #define MAX 100 같은 것 말이지


컴파일러 *.i -> *.s

컴파일러는 어셈블리어 프로그램으로 변환하는 작업을 담당
여기까지는 text(ASCII)


어셈블러 *.s -> *.o

어셈블리 코드를 기계어 명령어로 변환하는 작업
재배치 가능한 프로그램 생성해 디스크에 저장
기계어기 때문에, 볼려면 objdump 툴 이용해 dis-assemble해야 함


링커 *.o -> runnable file

라이브러리 등을 결합한 파일 생성
이걸 메모리에 적재해 실행하는 것


1.4 프로세서는 메모리에 저장된 명령어를 읽고 해석함


명령어 해석기인 'Shell' 을 통해 명령을 받고 실행


Bus

하드웨어 구성 요소들 간의 정보 전달 배선
단위는 Word

32bit OS: 4byte
64bit OS: 8byte
=> 레지스터 사용 생각해보면 구분 쉽게 가능


IO device

시스템과 외부 장치와의 경계


Main Memory

실행되는 프로그램에 대한 데이터 저장


Processor: 리소스에 대한 추상화

Main Memory에 저장된 프로그램의 명령어 가져와 해독 및 실행
여기에 레지스터, PC, ALU 이런게 있음
명령의 요청으로 인해 프로세서는 주로 다음 작업들을 실행함

Load: 메모리를 레지스터로 가져옴
Store: 레지스터 값을 메모리에 저장
Operate: 레지스터에 대해 ALU에서 연산을 진행하고, 이를 다시 레지스터에 저장
Jump: PC를 덮어씌워 다음 실행 주소를 지정


Hello Program 실행

컴퓨터 구조를 극단적으로 단순하게 나타내면 다음과 같다.

이러한 구조를 가지고 있을 때, ./hello 프로그램을 실행한다고 하겠다.

1. 먼저 hello를 입력해야겠지
2. 이 문자열은 CPU를 거쳐 Memory에 저장됨

3. 디스크에서 hello 파일 찾아내 메모리에 적재

4. 프로그램을 실행한다. 내용은 "Hello"를 프린트 하라는 것
5. 이를 위해 "Hello" 문자열을 메모리에서 CPU의 레지스터로 이동
6. CPU 레지스터에서 디스플레이 장치로 이동해 화면에 표시
이렇게 진행한다. 참고로, 디스크에서 DMA 이용해 바로 메모리로 가지 않는 이상, 모두 CPU를 거쳐야 한다는 것을 유의.
1.5 캐시 중요, 1.6 저장장치들은 계층 구조를 이룸


시스템에서의 정보 이동으로 많은 시간을 소비

메모리 => CPU => 디스플레이
이를 빠르게 하는 방법으로 메모리가 계층 구조로 설계됨


레지스터, 캐시, 메모리, 디스크, 웹 서버


서로 겹치는 부분 두어 빠르게 접근할 수 있도록 함

특히 캐시 메모리를 도입하여 데이터 접근 속도를 매우 높임


1.7 운영체제는 하드웨어를 관리함


하드웨어와 소프트웨어 사이에 위치한 OS

SW로 HW를 조작할 수 있도록 함


이는 추상화 를 통해 가능해짐

파일(폴더): 입출력 장치의 추상화

USB 이런거를 폴더로 관리하는 걸 생각해보라


가상메모리: 메인 메모리와 디스크 입출력 장치의 추상화

마치 우리는 메모리를 다루는 듯이 프로그래밍하지만, 실제로는 그러하지 않음


프로세스: CPU, Main Memory, IO 모두의 추상화

프로세스는 실행중인 프로그램에 대한 추상화
이는 곧 위의 세 개에 대한 추상화라고도 할 수 있겠음


프로세스


하나의 Processor는 다수의 프로세스를 마치 동시에 실행되듯 관리함
프로세스가 실행되는데 필요한 모든 상태들을 문맥(Context) 이라 함
실행되지 않을 때 이 문맥을 저장하고, 다시 실행될 때 이 문맥을 복원해 실행하는 것
이를 문맥 전환 기법 이라고 함


문맥 전환(Context Switch) 동작

Process A가 실행되고 있다가
Process B를 실행할 때, 인터럽트 걸고 문맥전환
Process B 실행하다가
Process A를 실행할 때, 인터럽트 걸고 문맥전환


문맥 전환 동작 2; 쉘의 실행

처음에는 쉘이 제어권을 가짐
쉘에서 hello 쳐서 프로그램 실행하면
일단 system call 이라는 함수로 OS에게 제어권 넘기고
OS는 쉘의 context를 저장 후 hello의 context 생성하고 제어권을 hello로 넘김
hello가 끝나면 쉘의 context 복구하고
제어권을 쉘로 다시 넘김


스레드


하나의 프로세스에는 Thread라는 다수의 실행 유닛이 있음
동일한 코드와 전역 데이터를 공유
데이터(메모리) 공유 된다는 것이 중요
멀티-프로세서 환경에서의 Multi-Threading은 완전하게 동시에 실행되는 병렬(Parallel) 처리임.

가상메모리


메모리를 추상화시킨 것. 이를 통해 메모리를 독립적으로 사용하는 것 같은 효과를 줌.
물론 이는 실제 메모리의 구조가 아님
위 그림같이 코드, 힙, 라이브러리, 스택, 커널 이렇게 분리됨

파일


모든 IO 장치는 파일로 모델링됨
다양한 IO 장치에 대해 통일된 관점을 제공하지

1.8 시스템은 네트워크를 사용하여 다른 시스템과 통신함


컴퓨터 시스템은 네트워크를 통해 서로 연결됨

즉, 또 다른 IO 장치라고 할 수 있겠음
이를 그저 프로토콜에 따라 다르게 처리할 뿐이지


1.9 중요한 주제들

암달법칙


전체 성능의 증가는 성능 높이려는 부분의 비율에 따라 달라짐

가령 곱셈 부분이 50%인 프로그램에 대해, 곱셈기 성능 4배 하면, 전체 성능은 2배가 증가하는 것


성능 개선 후 실행 시간 = 영향 안받는 시간 + 영향 받는 시간 / 개선 배율


얼마나 개선되었는지 비율을 구하는 것은 간단히 이전 시간 / 개선 시간 으로 해 보면 되겠지


수행 시간의 60%를 소모하는 시스템의 일부를 3배 빠르게 개선하였다면, 전체 속도의 향상률은?


a 가 0.6 이라는 말
T_new = (1 - a) T_old + a / k * T_old = 0.4 T_old + 0.2 T_old = 0.6 T_old
S = T_old / T_new = 10 / 6 = 1.666...

1.67배 상승했다고 할 수 있음


소프트웨어를 4 배 성능개선 한다고 할 때, 90%의 시간을 소모하는 시스템의 한 부분을 얼마나 개선해야 하는가?


a = 0.9
T_new = 0.25 T_old = 0.1 T_old + 0.9 / k * T_old
0.15 = 0.9 / k
k = 6

90% 시간 소모하는 부분을 6배 개선해야 전체 4배 성능개선 된다고 할 수 있음


멀티프로세서


하나의 OS, 여러 CPU

여러 CPU를 하나의 칩에 내장한 것


하이퍼스레딩

하나의 CPU가 여러 스레드 제어


멀티프로세서 성능 개선

멀티프로그래밍: 하나의 CPU 여러 프로세스 (concurrent)
멀티스레드: 여러 CPU 하나의 프로세스 (parallel)


명령어 수준 병렬성

슈퍼스칼라 프로세서: 1클럭 / 하나 이상의 명령어 처리
SIMD: 1명령 / 여러 데이터 처리


추상화

파일: 입출력
가상메모리: 메모리
프로세스: 실행 중 프로그램 (프로세서, 메모리, 입출력장치 추상화)


암달법칙

T_new = (1 - a) T_old + a / k * T_old


2.1 정보의 저장


모든 정보는 bit

이를 어떻게 해석하느냐에 따라 의미가 달라지는 것


byte = 8bit (0x00 ~ 0xFF)

주소지정이 가능한 최소의 단위
이 단위로 주소지정한다는 말
또한 하나의 주소 안에는 하나의 byte가 들어감


word (32bit = 4 byte, 64bit = 8 byte)

CPU가 한 번에 처리할 수 있는 단위
데이터 타입 크기에도 영향을 끼침
특히 pointer의 경우 word의 크기와 같음 (그리고 pointer는 unsigned long 타입이지)

32bit: 0x 00 00 00 00 => 256^4 byte = 4GB
64bit: 0x 00 00 00 00 00 00 00 00 => 256^8 byte = 16EB


하나의 주소 안에는 하나의 byte가 들어있다

0x00 ~ 0xFF의 값이 들어있음


주소지정방식

빅 엔디안(MSB): 작은 주소부터 값이 들어가는 것 => SUN, 네트워크
리틀 엔디안(LSB): 큰 주소부터 값이 들어가는 것 => 인텔
하나의 주소 안에는 하나의 바이트가 들어간다는 것을 잊지 말자


포인터 저장방식

컴파일러, 머신 종류(회사)에 따라 다름


문자열 저장방식

알다시피 문자의 배열로 표현하는데
바이트 순서와 상관없이 항상 낮은 주소부터 저장


부울 대수


TRUE와 FALSE로 표현


다음과 같이 집합으로 표현이 가능

01101001 = {0, 3, 5, 6}
인덱스가 76543210 순서로 간다는 것을 주의


left shift: x << y

x를 ybit 만큼 좌측 이동
우측은 0으로 채움


right shift: x >> y

x를 ybit 만큼 우측 이동
논리 쉬프트: 좌측은 0으로 채움
산술 쉬프트: 좌측은 최상위 비트(sign bit)로 채움

수치가 변하지 않게 하는 것이 산술 쉬프트
C 컴파일러 기본값. 수치계산 좋아하는 듯


2.2 정수의 표시


정수는 다음과 같이 인코딩됨 (w-byte 워드에 대해)

Unsigned: 0 ≤ x ≤ 2^w - 1
Signed: -2^(w - 1) ≤ x ≤ 2^(w - 1) - 1


주의해야 할 것은 negative가 11..11에서부터 시작한다는 것

이는 그냥 2의 보수 구해보면 간단히 나오긴 함
참고로 0과 S_MIN의 경우 2의 보수 취해도 자기 자신이 나옴


뭐 근데 보다싶이 해석만 다르게 진행되는 것이지, bit는 같다는 것을 잊지 말자

따라서 unsigned <-> signed는 묵시적으로 형변환 가능히다
operand 중 어느 하나라도 unsigned면, 모든 operand와 결과값이 unsigned가 됨


signed type에 대해, bit 확장 시 부호 비트가 복사되어 확장됨

가령 1000 0000을 4bit 확장한다 하면 다음과 같음
1000 0000 => 1111 1000 0000
right shift를 생각해보면 된다. 기본값이 arithmetic shift니까...


팁

negative signed value에서 unsigend value로의 변환은 간단히 neg_signed_num + U_MAX + 1
-1은 항상 { 1111 11..11 1111 }(2)


2.3 정수의 산술연산


unsigned 덧셈

더하고 overflow되는 bit는 버림


signed 덧셈

마찬가지로 overflow되는 bit는 버리는데,
부호가 반대가 되겠지. 맨 아래서부터 다시시작하잖아


곱셈


Unsigned 곱셈: 0 * 0 ≤ x * y ≤ (2^w - 1) * (2^w - 1)

최소값: 0
최대값: (2^w - 1)^2


Signed 곱셈: -2^(w - 1) * (2^(w - 1) - 1) ≤ x * y ≤ -2^(w - 1) * -2^(w - 1)

최소값: -2^(2w - 2) + 2^(w - 1)
최대값: 2^(2w - 2)


이렇게 계산된 결과에서 overflow bits를 버린다.


2 멱승 곱셈은 shift를 사용해 쉽게 가능하겠지


나눗셈


shift 이용하면 나눗셈도 가능

당연히 기본값인 arithmetic shift가 적용됨


floating일 경우 방향이 반대인 반올림이 됨

13 >> 1 = 6 (origin: 6.5)
-13 >> 1 = -7 (origin: -6.5)


2.4 부동소수점


부동소수점의 이진 표현 (정규화)

+- 1.xxxx * 2^(yyyy) (x는 binary)
{ 110.1001 }_(2) = { 1.101001 }_(2) * 2^(2)


지수표기는 2^n으로 나눠떨어져야 유한소수로 표현됨

즉, 표현에 한계가 있고, 이걸 넘어가는 애들은 중간에 잘라 approximation 함
이 때문에 오차가 발생되는 것이고


2진수 부동소수점 to 10진수

그냥 2^(-i)로 진행하면 된다.
{ 110.1001 }_(2) = 2^2 * 1 + 2^1 * 1 + 2^(-1) * 1 + 2^(-4) * 1 = 6.5625


단일정밀도


단일정밀도 (single precision): 32bit

sign: 1bit
exp: 8bit
frac: 23bit
(-1)^<sign> * 1.<frac> * 2^<exp>


단일정밀도 인코딩; { -0.75 }_(10)을 기준으로


일단 이걸 2진수 부동소수점 형태로 바꿔줌

{ -0.75 }_(10) = { -0.11 }_(2) = -1 * { 1.1 }_(2) * 2^(-1)


이걸 통해 변환해주는 것

sign bit: 1 (negative)
frac bit: 1
exp bit: -1 + 127 = { 126 }_(10) = { 0111 1110 }_(2)


exp 부분은 음수 표현 못하게 +127을 해서 넣어준다는 것을 유의

이를 bias 라고 함


Q.E.D. 1 01111110 10000000000000000000000

exp는 우측부터 좌측으로 2^{i}가 증가하고
frac은 좌측부터 우측으로 2^{i}가 감소함
2진수 부동소수점 표현을 생각해보면 좋을 것


팁: 10진수 소수점을 2진수 소수점으로 바꾸기

수에 계속 2를 곱해줌
1이상이 나오면, 해당 자리에 1이 들어가고
안나오면, 0이 들어감
하다가 정확히 1이 나오면 1 넣고 끝


단일정밀도 디코딩; { 1 01111110 10000000000000000000000 }_(2)를 기준으로


일단 이를 통해 빼올 수 있는 정보 빼오고

sign bit: 1
frac binary: 1.1
exp: 126 - 127 = -1

{ 01111110 }_(2) = 126
위에서 음수표현땜에 +127 했기에, -127을 똑같이 해줌


이를 통해 2진수 부동소수점 형태로 정규화 한 담에, 소수점으로 풀어주고

(-1)^1 * { 1.1 }_(2) * 2^(-1) = { -0.11 }_(2)


이를 10진수로 바꾸어주면 되겠지

{ -0.11 }_(2) = -(0.5 + 0.25) = -0.75


최대 및 최소값


exp 값에 따라 달라질 수 있겠다

참고로 00000000, 11111111 이 둘은 예약됨


따라서,

최소값은: exp = 00000001, frac = 000...0000
최대값은: exp = 11111110, frac = 111...1111


이중정밀도


이중정밀도 (double precision): 64bit

sign: 1bit
exp: 11bit
frac: 52bit


참고로 bias = { 111 1111 1111 }_(2) = 1023

인코딩 또는 디코딩 시 +1023, -1023 해 줘야 한다는 말
모든 음수를 포용해야 하니 이렇게 수가 나오는 것


연산


지수를 맞춤
유효자리 부분 더함

지수부 제외 나머지 부분


정규화
이를 미리 정의한 유효자리 에 맞춤 (round)

overflow 발생 방지를 위해


예제1: 9.999 * 10^1 + 1.610 * 10^(-1) (유효자리 4자리 가정)


지수를 큰 수에 맞춤

9.999 * 10^1 + 0.016 * 10^1


유효자리 더함

(9.999 + 0.016) * 10^1 = 10.015 * 10^1


정규화

1.0015 * 10^2


유효자리에 맞춰 round

Q.E.D. 1.002 * 10^2


예제2: 0.5 + (-0.4375) (유효자리 4자리 가정)


정규화

0.5 = { 1.0 }_(2) * 2^(-1)
-0.4375 = { -0.0111 }_(2) = { -1.11 } * 2^(-2)


지수 맞춤

{ 1.0 }_(2) * 2^(-1) - { 0.111 }_(2) * 2^(-1)


유효자리 덧셈

{ 0.001 }_(2) * 2^(-1)


정규화 및 유효자리 round

Q.E.D. { 1.0 }_(2) * 2^(-4)


예제3: (1.110 * 10^(10)) * (9.200 * 10^(-5)) (유효자리 4자리)


곱셈의 경우는 지수부 맞출 필요 없고, 서로 더해주면 됨

10 + (-5) = 5


유효자리 곱셈

1.11 * 9.2 = 10.212


조합

10.212 * 10^5


정규화 및 유효자리 round

1.0212 * 10^6 => 1.021 * 10^6


부호 결정

Q.E.D. + 1.022 * 10^6


예제4: 0.5 * (-0.4375) (유효자리 4자리)


정규화

0.5 = { 1.0 }_(2) * 2^(-1)
-0.4375 = { -1.11 } * 2^(-2)


지수 덧셈

-1 + (-2) = -3


유효자리 곱셈

1.0 * 1.11 = 1.11


조합

{ 1.11 }_(2) * 2^(-3)


부호 결정 (pos * neg = neg)

Q.E.D. - 1.11 * 2^(-3)


3.1 역사적 관점


칩 종류

CISC: 많은 기계 명령어 (Complex)

호환성땜에 사용


RISC: 일부 명령어 (Reduced)
요즘은 CISC가 RICS 따라잡았다


3.2 프로그램의 인코딩


여러 상태들

PC: 프로그램 카운터 (또는 RIP)

다음 실행될 명령어 주소 저장


레지스터 파일

자주 사용되는 프로그램 데이터 저장


조건 코드

최근에 수행된 연산 결과에 대한 상태 저장
가령 a > b 연산 진행했을 때 a - b의 sign bit만 저장하고 있다던가...
이를 이용해 jump, if 등을 수행하는 것


메모리

프로그램의 코드와 데이터가 들어가는 곳


디버깅을 위한 최적화는 -Og를 사용

어셈블리어 코드 생성을 위한 -S 옵션
목적코드 생성을 위한 -c 옵션
실행파일 생성을 위한 -o 옵션


실제 실행파일 생성 시에는 linking 과정을 거치기에

메모리 위치도 달라지고
함수도 실제 위치로 연결된다


어셈블리어에서 소괄호(' () ')는 pointer를 의미한다

즉, 소괄호 안의 값을 메모리 주소삼아서...


3.3 데이터의 형식


C
Intel
Assembly
Size(byte)


char
Byte
b
1


short
Word
w
2


int
Double Word
l
4


long
Quad Word
q
8


char *
Quad Word
q
8


float
Single Precision
s
4


double
Double Precision
l
8


위의 것들이 명령어에 접미어로 붙어 타입을 명시하는 것

movq, leaq 등
참고로 q는 대부분 생략 한다고 함


3.4 정보 접근하기

레지스터


Usage
Name(64bit)
Name(32bit)


Return Value
%rax
%eax


Callee Saved
%rbx
%ebx


4th arg
%rcx
%ecx


3rd arg
%rdx
%edx


2nd arg
%rsi
%esi


1st arg
%rdi
%edi


Stack Pointer
%rsp
%esp


Callee Saved
%rbp
%ebp


5th arg
%r8
%r8d


6th arg
%r9
%r9d


Caller Saved
%r10
%r10d


Caller Saved
%r11
%r11d


Callee Saved
%r12
%r12d


Callee Saved
%r13
%r13d


Callee Saved
%r14
%r14d


Callee Saved
%r15
%r15d


레지스터 종류는 위와 같음 (16개로 한정됨)

args가 6개를 넘어가면 어쩔 수 없이 메모리를 이용해 저장
호환성을 위해 64bit 말고도 32bit, 심지어 16bit 8bit도 접근이 가능


일반적으로 명령은 하나 이상의 operand를 가짐

상수($~), 레지스터(%~) 또는 메모리 값((~))이 될 수 있겠지
소괄호가 pointer를 의미한다는 것을 다시 한 번 말한다


명령어 주소지정 형식


Type
Form
Value
Name


상수
$Imm
Imm
즉시값 (Immediate)


레지스터
r_a
R[r_a]
레지스터의 값


메모리
Imm
M[Imm]
절대 참조


(r_a)
M[R[r_a]]
간접 참조


Imm(r_b)
M[Imm + R[r_b]]
베이스(R[r_b]) + 오프셋(Imm)


(r_a, r_i)
M[R[r_a] + R[r_i]]
인덱스


Imm(r_a, r_i)
M[Imm + R[r_a] + R[r_i]]
인덱스


(r_b, r_i, s)
M[R[r_b] + R[r_i] * s]
인덱스


Imm(r_b, r_i, s)
M[Imm + R[r_b] + R[r_i] * s]
인덱스


(, r_i, s)
M[R[r_i] * s]
인덱스


Imm(, r_i, s)
M[Imm + R[r_i] * s]
인덱스


참고로 더해지는 Imm은 1 byte 단위

예제: operand 값 구하기


%rax = 0x100

참조 이런게 아니고, 그냥 레지스터 안의 값을 가져옴


0x104 = 0xAB

$가 붙지 않으면 절대참조(M[0x104])가 됨


$0x108 = 0x108

$가 붙는 건 상수


(%rax) = 0xFF

%rax = 0x100이고, 이를 값으로 주소참조하니...


4(%rax) = 0xAB

4(%rax) = M[4 + 0x100]


9(%rax, %rdx) = 0x11

참고로 9는 10진수
9(%rax, %rdx) = M[0x9 + 0x100 + 0x3]


260(%rcx, %rdx) = 0x13

260이 10진수 라는 것을 주의하자. 16진수로 바꾸면 0x104
260(%rcx, %rdx) = M[0x104 + 0x1 + 0x3]


0xFC(, %rcx, 4) = 0xFF

0xFC(, %rcx, 4) = M[0xFC + 0x1 * 4]


(%rax, %rdx, 4) = 0x11

(%rax, %rdx, 4) = M[0x100 + 0x3 * 4]


이동 명령을 통한 참조 기법


movq <src>, <dest> 명령과, 위의 명령어 주소지정 형식을 이용하면 간결하게 참조 및 대입을 할 수 있다


Assembly
C


movq $0x4, %rax
t1 = 0x4;


movq $-147, %rax
*t1 = -147;


movq %rax, %rdx
t2 = t1;


movq %rax, (%rdx)
*t2 = t1;


movq (%rax), %rdx
t2 = *t1;


꽤나 유용하고 자주 사용하는 기법

3.5 산술연산과 논리연산


여기서 q 생략한다


lea 명령은 pointed 되는 값이 아니라, 주소 자체를 적재하라는 말

lea 0xfffffbf4(%ebp), %eax => %eax := %ebp + 0xfffffbf4
이를 이용하면 위와 같이 매우 빠른 게산 및 적재를 진행할 수 있다.


헛갈리기 쉬운 일부 명령어에 대해서만 정리함

salq <src>, <dest> => dest <<= src
sarq <src>, <dest> => dest >>= src // Arithmetic
shrq <src>, <dest> => dest >>= src // Logical
incq <dest> => dest += 1
decq <dest> => dest -= 1
negq <dest> => dest = -dest
notq <dest> => dest = ~dest


문자열은 C에서도 그러하듯 어떤 값으로 나타낼 수 없기에, pointer를 통해 지정

register 내에서도 포인터 값이 들어가게 된다


일반적인 레지스터의 이용


temporary: %rax, %rdx, %rcx, ...


Location runtime stack: %rsp

local variable이 들어가는 스택


Location current code control point: %rip

Program Counter


Statuc of Recent Tests (Condition Codes): CF, OF, SF, ZF

CF: Crry Flag
OF: Overflow Flag
SF: Sign Flag
ZF: Zero Flag
이들은 아래에서 다룸


산술연산 번역의 예


다음의 코드에 대해

long arith(long x, long y, long z) {
  long t1 = x + y;
  long t2 = z + t1;
  long t3 = x + 4;
  long t4 = y * 48;
  long t5 = t3 + t4;
  long rval = t2 * t5;
  return rval;
}

어셈블리로 번역하면 다음과 같다.

arith:
  leaq (%rdi, %rsi), %rax       # t1
  addq %rdx, %rax               # t2
  leaq (%rsi, %rsi, 2), %rdx    # t4
  salq $4, %rdx
  leaq 4(%rdi, %rdx), %rcx      # t5
  imulq %rcx, %rax              # rval
  ret


이해가 안 된다면 직접 하나하나 연결하면서 해 보자

t3는 t5 연산 과정 안에 포함됨
t4 계산은 빠른 곱셈 계산을 위해 shift를 사용하려고 하다 변형된 것


참고로 반환이 int 타입일 경우 %rax가 아니라 %eax가 된다는 것을 유의


3.6 제어문


연산 결과를 Condition으로 지정하기 위해, Condition Code 라는 것을 도입했다

CF: Crry Flag

최근 연산 결과에서 올림수 발생 시 1
unsigned type의 overflow 검출 시 유용하게 사용

sign type에서는 다른 overflow가 발생된다
이는 OF를 참고


ZF: Zero Flag

최근 연산 결과가 ZERO 인 경우 1
연산 결과가 0이어야 ZF := 1이 된다는 것을 매우 조심하자


SF: Sign Flag

최근 연산 결과가 음수 인 경우 1
즉, sign type의 sign bit라고도 할 수 있겠다


OF: Overflow Flag

연산 결과로 2의 보수 overflow 발생 시 1
signed type에서 overflow 검출 시 유용하게 사용
물론 unsigned type에서도 사용은 가능하지만, 다음의 규칙이 있다.

Unsigned 일 때: CF == OF
Signed 일 때: CF != OF
CF는 그저 올림수가 발생되었는지 여부만을 따진다
Singed의 overflow는 올림수가 아니라, 부호가 뒤바뀌는 것이니까...


일반적인 명령의 결과로 Condition Code가 업데이트됨 (implicit 하게)


lea로 연산할 경우 Condition Code 업데이트 안된다

물론 explicit하게 할 수는 있음
cmp, test 명령을 사용하여 가능


cmpq <src2>, <src1>

순서 주의, 참고로 종종 setX와 함께 사용함
src1 - src2 결과로 Condition Code 업데이트
dest가 없기에, src 중 어떠한 곳도 값 업데이트가 되지 않음


test <src2>, <src1>

순서 주의
src1 & src2 결과로 Condition Code 업데이트
마찬가지로 dest 없으며, src 중 어떠한 곳도 값 업데이트 없음


주의사항들

unsigned 0x1 - 0x2 진행하면 U_MAX 나오는데, 이 때 CF := 1이 된다

물론 OF := 1


signed S_MAX + 0x1 해도 CF := 0

단, OF := 1


unsigned type에서 각각의 operand는 negative value를 가질 수 없다 는 것을 유의한다


setX <dest> 명령어


조건에 따라 dest의 값을 set


command
condition
description


sete
ZF
equal, zero


setne
~ZF
not equal, not zero


sets
SF
negative


setns
~SF
non-negative


setg
~(SF ^ OF) & ~ZF
greater (signed)


setge
~(SF ^ OF)
greater equal (signed)


setl
(SF ^ OF)
less (signed)


setle
`(SF ^ OF)
ZF`


seta
~CF & ~ZF
Above (unsigned)


setb
CF
Below (unsigned)


외우지 말자

sete, setne, sets, setns 이거 네 개는 설명 없어도 이해갈테니
나머지에 대한 예제를 보며 이해해보도록 하자


Signed type에 대한 setX 예제


command
condition
description


setg
~(SF ^ OF) & ~ZF
SF와 OF가 같고, ZF가 0이 아닌 경우


setge
~(SF ^ OF)
SF와 OF가 같음


setl
(SF ^ OF)
SF와 OF가 다름


setle
`(SF ^ OF)
ZF`


다음 명령에 대해 진행한다

cmpq b, a     # a - b

setg %al
setge %bl
setl %cl
setle %dl
Case 1; a := 0x10, b := 0x5 (a > b)


a - b = 0x5

CF := 0
ZF := 0
SF := 0
OF := 0


setg %al    # 1
setge %bl   # 1
setl %cl    # 0
setle %dl   # 0
Case 2; a := 0x10, b := 0x10 (a = b)


a - b = 0

CF := 0
ZF := 1
SF := 0
OF := 0


setg %al    # 0
setge %bl   # 1
setl %cl    # 0
setle %dl   # 1
Case 3; a := 0x5, b := 0x10 (a < b)


a - b = -0x5

CF := 0
ZF := 0
SF := 1
OF := 0


setg %al    # 0
setge %bl   # 0
setl %cl    # 1
setle %dl   # 1
Case 4; a := S_MAX, b := -0x1 (a - b = 'positive overflow')


a - b = S_MIN // positive overflow

CF := 0
ZF := 0
SF := 1
OF := 1


setg %al    # 1
setge %bl   # 1
setl %cl    # 0
setle %dl   # 0
Case 5; a := S_MIN, b := 0x1 (a - b = 'negative overflow')


a - b = S_MAX // negative overflow

CF := 0
ZF := 0
SF := 0
OF := 1


setg %al    # 0
setge %bl   # 0
setl %cl    # 1
setle %dl   # 1
Unsigned type에 대한 setX 예제


command
condition
description


seta
~CF & ~ZF
CF와 ZF 둘 다 0인 경우


setb
CF
CF가 1인 경우


다음 명령에 대해 진행한다

이 때, a와 b는 Unsigned type


cmpq b, a     # a - b

seta %al
setb %bl
Case 1; a := 0x10, b := 0x5 (a > b)


a - b = 0x5

CF := 0
ZF := 0
SF := 0
OF := 0


seta %al  # 1
setb %bl  # 0
Case 2; a := 0x5, b := 0x10 (a < b)


a - b = U_MAX - 0x5 // underflow

CF := 1
ZF := 0
SF := 0
OF := 1


seta %al  # 0
setb %bl  # 1
jX <dest> 명령어


조건에 따라 dest로 jump

규칙은 setX와 같다


command
condition
description


jmp
1
jump dest (unconditional)


je
ZF
equal, zero


jne
~ZF
not equal, not zero


js
SF
negative


jns
~SF
non-negative


jg
~(SF ^ OF) & ~ZF
greater (signed)


jge
~(SF ^ OF)
greater equal (signed)


jl
(SF ^ OF)
less (signed)


jle
`(SF ^ OF)
ZF`


ja
~CF & ~ZF
Above (unsigned)


jb
CF
Below (unsigned)


마찬가지로 외울 필요 없이 상황을 가정하고 잘 생각해본다

규칙에 대한 이해


greater

a가 b보다 큰 경우
a - b는 positive가 될 것이다 (SF := 0, OF := 0)
negative가 되는 경우는 overflow가 되는 것 밖에 없다 (SF := 1, OF := 1)


less

a가 b보다 작은 경우
a - b는 negative가 될 것이다 (SF := 1, OF := 1)
positive가 되는 경우는 overflow가 되는 것 밖에 없다 (SF := 0, OF := 1)


above

a가 b보다 큰 경우
a - b는 overflow가 될 수 없고 (~CF)
zero 값 역시 불가능하다 (~ZF)


below

a가 b보다 작은 경우
a - b는 무적권 overflow가 발생된다 (CF)


조건 분기


jump를 사용하여 조건 분기를 할 수 있다

long absdiff(long x, long y) {
  long result;

  if (x > y) {
    result = x - y;
  } else {
    result = y - x;
  }

  return result;
}

위 C 코드는 다음과 같이 번역된다

absdiff:
  cmpq %rsi, %rdi   # x와 y의 크기 비교 (x - y)
  jg .L4            # x > y 인 경우 L4로 jump

  # x <= y
  movq %rsi, %rax   # result = y
  subq %rdi, %rax   # result -= x
  ret               # return result

.L4:
  # x > y
  movq %rdi, %rax   # result = x
  subq %rsi, %rax   # result -= y
  ret               # return result

주의할 것은, goto처럼 해당 라벨로 이동한 다음 계속 명령을 진행하는 것이기에

중간의 ret 처럼 반드시 끊어주거나
아니면 다른 라벨로 jump 시켜줘야만 한다


cmovX <src>, <dest> 명령 (Conditional Move Instruction)


분기 명령은 솔직히 말해 좋지 못한 패턴

파이프라인 처리를 방해하여 병렬 처리 못하게 한댄다
이는 컴파일 시 -fif-conversion 옵션으로 cmovX 명령 사용하도록 할 수 있음


cmovX 명령은 조건에 따라 데이터 이동하는 명령

조건문 있으면, 각 상황의 값 모두를 계산해 놓고
condition 계산되면 해당 값으로 사용하는 것
참고로 X 보면 알 수도 있겠는데, 규칙은 setX나 jX와 같음


goto로 이를 표현해보면 다음과 같다


// common representation
val = Condition ? Then_Expr : Else_Expr;

// goto representation
true_val = Then_Expr;
result = Else_Expr;

if (Condition) result = true_val;

return result;

유의사항

과도한 계산 수행 자제

val = Test(x) ? HardWork_1(x) : HardWork_2(x);
모든 값을 계산하기에, 성능 이슈 발생 가능


위험한 계산 자제

val = p ? *p : 0
모든 값을 계산하기에, p가 null pointer인 경우 에러 발생 가능


side-effects 발생 가능

val = Test(x) ? x *= 10 : x *= 5;
모든 값을 계산한다는 의미는, 양쪽의 코드를 실행한다는 의미
즉, 위와 같을 경우, x *= 10과 x *= 5 둘 다 실행하게 되어서
의도치 않았던 결과를 내보일 수 있음
`p`	`q`	`~p`	`~p v q`	`p -> q`
`T`	`T`	`F`	`T`	`T`
`T`	`F`	`F`	`F`	`F`
`F`	`T`	`T`	`T`	`T`
`F`	`F`	`T`	`T`	`T`
SMTP	HTTP
Resource PUSH 프로토콜	Resource PULL 프로토콜
객체 자체를 하나의 메시지로	각 객체는 응답 메시지 안에 캡슐화됨
C	Intel	Assembly	Size(byte)
char	Byte	`b`	1
short	Word	`w`	2
int	Double Word	`l`	4
long	Quad Word	`q`	8
char *	Quad Word	`q`	8
float	Single Precision	`s`	4
double	Double Precision	`l`	8
Usage	Name(64bit)	Name(32bit)
Return Value	`%rax`	`%eax`
Callee Saved	`%rbx`	`%ebx`
4th arg	`%rcx`	`%ecx`
3rd arg	`%rdx`	`%edx`
2nd arg	`%rsi`	`%esi`
1st arg	`%rdi`	`%edi`
Stack Pointer	`%rsp`	`%esp`
Callee Saved	`%rbp`	`%ebp`
5th arg	`%r8`	`%r8d`
6th arg	`%r9`	`%r9d`
Caller Saved	`%r10`	`%r10d`
Caller Saved	`%r11`	`%r11d`
Callee Saved	`%r12`	`%r12d`
Callee Saved	`%r13`	`%r13d`
Callee Saved	`%r14`	`%r14d`
Callee Saved	`%r15`	`%r15d`
Type	Form	Value	Name
상수	`$Imm`	`Imm`	즉시값 (Immediate)
레지스터	`r_a`	`R[r_a]`	레지스터의 값
메모리	`Imm`	`M[Imm]`	절대 참조
	`(r_a)`	`M[R[r_a]]`	간접 참조
	`Imm(r_b)`	`M[Imm + R[r_b]]`	베이스(`R[r_b]`) + 오프셋(`Imm`)
	`(r_a, r_i)`	`M[R[r_a] + R[r_i]]`	인덱스
	`Imm(r_a, r_i)`	`M[Imm + R[r_a] + R[r_i]]`	인덱스
	`(r_b, r_i, s)`	`M[R[r_b] + R[r_i] * s]`	인덱스
	`Imm(r_b, r_i, s)`	`M[Imm + R[r_b] + R[r_i] * s`]	인덱스
	`(, r_i, s)`	`M[R[r_i] * s]`	인덱스
	`Imm(, r_i, s)`	`M[Imm + R[r_i] * s]`	인덱스
Assembly	C
`movq $0x4, %rax`	`t1 = 0x4;`
`movq $-147, %rax`	`*t1 = -147;`
`movq %rax, %rdx`	`t2 = t1;`
`movq %rax, (%rdx)`	`*t2 = t1;`
`movq (%rax), %rdx`	`t2 = *t1;`
command	condition	description
`sete`	`ZF`	equal, zero
`setne`	`~ZF`	not equal, not zero
`sets`	`SF`	negative
`setns`	`~SF`	non-negative
`setg`	`~(SF ^ OF) & ~ZF`	greater (signed)
`setge`	`~(SF ^ OF)`	greater equal (signed)
`setl`	`(SF ^ OF)`	less (signed)
`setle`	`(SF ^ OF)	ZF`
`seta`	`~CF & ~ZF`	Above (unsigned)
`setb`	`CF`	Below (unsigned)
command	condition	description
`setg`	`~(SF ^ OF) & ~ZF`	`SF`와 `OF`가 같고, `ZF`가 `0`이 아닌 경우
`setge`	`~(SF ^ OF)`	`SF`와 `OF`가 같음
`setl`	`(SF ^ OF)`	`SF`와 `OF`가 다름
`setle`	`(SF ^ OF)	ZF`
command	condition	description
`seta`	`~CF & ~ZF`	`CF`와 `ZF` 둘 다 `0`인 경우
`setb`	`CF`	`CF`가 `1`인 경우
command	condition	description
`jmp`	`1`	jump dest (unconditional)
`je`	`ZF`	equal, zero
`jne`	`~ZF`	not equal, not zero
`js`	`SF`	negative
`jns`	`~SF`	non-negative
`jg`	`~(SF ^ OF) & ~ZF`	greater (signed)
`jge`	`~(SF ^ OF)`	greater equal (signed)
`jl`	`(SF ^ OF)`	less (signed)
`jle`	`(SF ^ OF)	ZF`
`ja`	`~CF & ~ZF`	Above (unsigned)
`jb`	`CF`	Below (unsigned)