1. 네트워크 및 웹 지식 공부
이번 주에 웹 개발에 필수인 Http와 관련된 네트워크 지식들을 습득하게 되어 정리를 하려 한다.
[인터넷 네트워크]
- 인터넷 통신
- IP(Internet Protocol)
- TCP, UDP
- PORT
- DNS
인터넷
인터넷(Internet)은 인터넷 프로토콜 스위트(TCP/IP)를 기반으로 하여 전 세계적으로 연결되어있는 컴퓨터 네트워크 통신망을 일컫는 말이다. 출처: 나무위키
인터넷을 통해 클라이언트가 서버에 오기까지 여러 노드(인터넷 통신 서버)를 거치게 된다.
IP(인터넷 프로토콜)
인터넷 프로토콜 역할
- 지정한 IP주소(IP Address)에 데이터 전달
- 패킷(패키지 + 버킷)이라는 통신 단위로 데이터 전달
IP(인터넷 프로토콜)의 한계
- 비연결성
- 패킷을 받을 대산이 없거나 서비스 불능 상태여도 패킷 전송
- 비신뢰성
- 중간에 패킷이 사라지면?
- 패킷이 순서대로 안 오면?
- 프로그램 구분
- 같은 IP를 사용하는 서버에서 통신하는 애플리케이션이 둘 이상이면?
인터넷 프로토콜 스택의 4계층
4층 - 애플리케이션 계층 - HTTP, FTP => 1.프로그램이 메세지를 생성하여 SOCKET라이브러리를 통해 전당
3층 - 전송 계층 - TCP, UDP -> OS => 2. TCP 정보 생성, 메세지 데이터 포함
2층 - 인터넷 계층 - IP -> OS => 3. IP 패킷 생성, TCP 데이터 포함
1층 네트워크 인터페이스 계층 -> LAN 드라이버 LAN 장비 => 4. 인터넷으로 서버에게 전달
IP 패킷 정보
출발지 IP, 목적지 IP, 기타... ,전송 데이터
TCP/IP 패킷 정보
출발지 IP, 목적지 IP, 출발지 PORT, 목적지 PORT, 전송 제어, 순서, 검증 정보, 기타... ,전송 데이터
TCP 특징
전송 제어 프로토콜(Transmission Control Protocol)
- 연결 지향 - TCP 3way handshake(가상 연결)
- 데이터 전달 보증
- 순서 보장
신뢰할 수 있는 프로토콜, 현재 대부분 TCP 사용
TCP 3way handshake
SYN: 접속 요청
ACK: 요청 수락
1. SYN == (클라이언트 -> 서버)
2. SYN + ACK == (클라이언트 <- 서버)
3. ACK == (클라이언트 -> 서버)
참고: 3. ACK와 함께 데이터 전송 가능
UDP 특징
사용자 데이터그램 프로토콜(User Datagram Protocol)
- 하얀 도화지에 비유(기능이 거의 없음)
- 연결지향 - TCP 3way handshake X
- 데이터 전달 보증 X
- 순서 보장 X
- 데이터 전달 및 순서가 보장되지 않지만, 단순하고 빠름
- 정리
- IP와 거의 같다. + PORT + 체크섬 정도만 추가
- 애플리케이션에서 추가 작업 필요
PORT
컴퓨터 내에서 여러 연결을 해야할 떄 포트 번호를 지정하여 IP주소와 함께 사용
같은 IP 내에서 프로세스를 구분하기 위해 사용한다.
흔히 포트 번호라고 하는 걸 IP 주소 뒤에다 붙여서 구분한다.
IP주소를 아파트라 생각하고 포트 번호를 몇 동 몇 호라고 생각하면서 택배(패킷)를 받거나 보낸다고 생각하자
- 0 ~ 65535 할강 가능
- 0 ~ 1023: 잘 알려진 포트, 사용하지 않는 것이 좋음
- FTP - 20, 21
- TELENET - 23
- HTTP - 80
- HTTPS - 443
DNS
도메인 네임 시스템(Domain Name System)
IP주소는 기억하기 어렵고 변경될 수 있기 떄문에 임의의 도메인이라는 문자열을 사용한다.
- 전화번호부
- 도메인 명을 IP주소로 변환
인터넷 네트워크 정리
- 인터넷 통신
- IP(Internet Protocol)
- TCp, UDP
- PORT
- DNS
URI(Uniform Resource Identifier)
"URI는 Locator, Name 또는 둘 다 추가로 분류될 수 있다.
-> URI는 URL, URN 둘 다를 지칭하는 말이다. 하지만 URN은 거의 안 쓰인다.
scheme + authority + path + query + fragment
- Uniform: 리소스 식별하는 통일된 방식
- Resource: 자원, URI로 식별할 수 있는 모든 것(제한 없음)
- Identtifier: 다른 항목과 구분하는데 필요한 정보
- URL: Uniform Resource Locator
- URN: Uniform Resource Name
URL
전체 문법
- 프로토콜(https) -> 어떤 방식으로 자원에 접근할 것인가 하는 약속 규칙, 주로 http(80포트) 혹은 https(443포트)를 씀
- 호스트명(www.google.com) -> 호스트명, 도메인명 또는 IP주소 사용, 사용자 정보를 포함하여 인증하지만 거의 안 씀
- 포트 번호(443) -> 포트, 접속 포트, 일반적으로 생략, 생략시 http는 80, https는 443
- 패스(/search) -> 리소스 경로(path), 계층적 구조
- 쿼리 파라미터(q=hello&hl=ko) -> key = value 형태, ?로 시작, &로 추가 가능, ?keyA=valueA&keyB=valueB, 문자 형태
- 프래그먼트(fragment) -> html 내부 북마크 등에 사용, 서버에 전송하는 정보 아님
HTTP 메세지 전송
1. 웹 브라우저가 HTTP 메세지 생성
2. SOCKET 라이브러리를 통해 전달 - A: TCP/IP연결(IP, PORT) -B: 데이터 전달
2. TCP/IP 패킷 생성, HTTP 메세지 포함
HTTP
Hyper Text Transfer Protocol
- HTML, TEXT
- IMAGE, 음성, 영상, 파일
- JSON, XML(API)
- 거의 모든 형태의 데이터 전송 가능
- 서버 간에 데이터를 주고 받을 떄고 대부분 HTTP 사용
- 지금은 HTTP 시대이다.
HTTP 기반 프로토콜
- TCP: HTTP/1.1, HTTP/2
- UDP: HTTP/3
- HTTP/1.1을 주로 사용
HTTP 특징
- 클라이언트 서버 구조
- 무상태 프로토콜(스테이트리스), 비연결성
- HTTP 메세지
- 단순함, 확장 가능
클라이언트 - 서버 구조
- Request, Response 구조
- 클라이언트는 서버에 요청을 보내고, 응답을 대기
- 서버가 요청에 대한 결과를 만들어서 응답
무상태 프로토콜
스테이트리스(Stateless)
- 서버가 클라이언트의 상태를 보존 X
- 장점: 서버 확장성 높음(스케일 아웃)
- 단점: 클라이언트가 추가 데이터 전송
Stateful, Stateless 차이
정리
- 상태 유지(Stateful): 중간에 서버가 다른 서버로 바뀌면 안 된다. 서버가 바뀔 때 바뀌는 서버에게 정보를 전송해야한다.
- 무상태(Stateless): 중간에 다른 서버로 교체해도 된다.
- 갑자기 클라이언트가 증가해도 서버를 대거 투입할 수 있다.
- 무상태는 응답 서버를 쉽게 바꿀 수 있다. -> 무한한 서버 증설 가능
Stateless
실무 한계
- 모든 것을 무상태로 설계할 수 있는 경우도 있고 없는 경우도 있다.
- 무상태
- 예) 로그인이 필요없는 단순한 서비스 소개 화면
- 상태 유지
- 예) 로그인
- 로그인한 사용자의 경우 로그인했다는 상태를 서버에 유지
- 일반덕으로 브라우저 쿠키와 서버 세션 등을 사용해서 상태 유지
- 상태 유지는 최소한만 사용
비연결성
- HTTP는 기본이 연결을 유지하지 않는 모델
- 일반적으로 초 단위의 이하의 빠른 속도로 응답
- 1시간 동안 수천명이 서비스를 사용해도 실제 서버에서 동시에 처리하는 요청은 수십개 이하로 매우 작음
- 예) 웹 브라우저에서 계속 연속해서 검색 버튼을 누르지는 않는다.
- 서버 자원을 매우 효율적으로 사용할 수 있음
비연결성
한계와 극복
- TCP/IP 연결을 새로 맺어야 함 - 3way handshake 시간 추가
- 웹 브라우저로 사이트를 요청하면 HTML 뿐만 아니라 자바 스크립트, css, 추가 이미지 등등 수많은 자원이 함께 다운로드
- 지금은 HTTP 지속 연결(Persistent Connections)로 문제 해경
- HTTP/2, HTTP/3에서 더 많은 최적화
HTTP 초기 - 연결, 종료 낭비
-> HTTP 지속 연결(Persistent Connections) == 연결하고 모든 자원이 올 떄까지 유지하다 다 오면 끊기
스테이트리스를 기억하자
서버 개발자들이 어려워하는 업무
- 정말 같은 시간에 딱 맞추어 발생하는 대용량 트래픽
- 예) 티케팅, 선착순, 명절 KTX 등등
- Jmeter, Artillery등으로 확인 후 최적화 작업이 필요
HTTP 메세지(핵심)
HTTP Request 메세지와 HTTP Response 메세지로 나뉨
각 메세지는 메세지 헤더와 메세지 바디로 나뉜다!
HTTP 메세지 시작 라인
요청 메세지
=> GET /search?q=hello&hl=ko HTTP/1.1
Host: www.google.com
- start-line = request-line / status-line
- request-line = method SP(공백) request-target SP HTTP-version CRLF(엔터)
- HTTP 메서드(GET: 조회)
- 요청 대상 (/search?q=hello&hl=ko)
- HTTP Version
HTTP 메세지 시작 라인
요청 메세지 - HTTP 메서드
- 종류: GET, POST, PUT, DELETE...
- 서버가 수행해야할 동작 지정
- GET: 리소스 조회
- POST: 요청 내역 처리