챕터2_데이터
💡
컴퓨터가 이해하는 정보 단위 이해하기.
0과 1로 다양한 숫자를 표현하는 방법 이해.
0과 1로 다양한 문자를 표현하는 방법 이해.
0과 1로 숫자를 표현하는 방법
정보 단위
- 비트 (bit) : 0과 1을 나타내는 가장 작은 정보 단위
- 바이트 (byte) : 8bit
- 킬로바이트 (kB) : 1000byte
- 메가바이트(MB) : 1000kB
- 기가바이트 (GB) : 1000MB
- 테라바이트 (TB) : 1000GB
- 워드 (word)
- 하프 워드 (half word)
- 풀 워드 (full word)
- 더블 워드 (double word)
- 대부분 32bit/64bit.
- CPU가 한 번에 처리할 수 있는 데이터 크기
이진법
0과 1만으로 모든 숫자를 표현하는 방법
- 이진수의 표기
- 이진수 끝에 위와 같은 아래첨자 붙임 (수학적 표기)
- 이진수 앞에 0b 붙임 (코드 상 표기)
- 음수 표현
- 2의 보수를 구해 음수로 간주하는 방법
- 모든 0과 1을 뒤집고 1을 더한 값.
- 플래그
- 부가 정보. 숫자는 음수와 양수를 구분하는 플래그 가짐.
십육진법
15를 넘어가는 시점에 자리 올림하여 수를 표현하는 방법.
- 십육진수 표기
- 십육진수 끝에 위와 같은 아래첨자 붙임 (수학적 표기)
- 십육진수 앞에 0x 붙임 (코드 상 표기)
십육진수의 이진수 변환
십육진수를 이루는 숫자 하나를 이진수로 표현하려면 2^4 = 16 → 4bit 필요
이진수의 십육진수 변환
4 숫자씩 끊어 변환
0과 1로 문자를 표현하는 방법
문자 집합과 인코딩
문자 집합
- 컴퓨터가 인식하고 표현할 수 있는 문자의 모음
문자 인코딩
- 문자를 0과 1로 변환하는 과정
- 같은 문자 집합도 다양한 인코딩 방법 존재 가능
문자 디코딩
- 인코딩의 반대 과정
- 0과 1로 이루어진 문자 코드를 사람이 이해할 수 있는 문자로 변환하는 과정
아스키 코드
아스키 문자에 대응된 고유한 수.
아스키 문자들은 각각 7비트로 표현됨.
2^7 = 128로, 총 128개의 문자 표현 가능.
→ 아스키 문자는 대응된 고유한 수를 통해 아스키 코드로 인코딩 됨
- 단점
- 문자 집합 외의 문자 표현 불가능.
- → 확장 아스키(8비틀 표현한 문자) 등장 but 부족..
EUC-KR
한 한글 단어에 2byte 크기 부여
- 완성형 인코딩
- 하나의 글자에 고유한 코드 부여하는 방식
- 조합형 인코딩
- 초성, 중성, 종성을 위한 비트열의 조합으로 하나의 글자 코드 완성 방식
유니코드와 UTF-8
- 유니코드
- 모든 언어를 아우르는 문자 집합.
- UTF-8, UTF-16, UTF-32 등
- 통일된 표준 인코딩 방식. UTF-8이 가장 대중적.
'스터디 > 컴퓨터구조' 카테고리의 다른 글
[혼자 공부하는 컴퓨터구조와 운영체제] 6_메모리와 캐시 메모리 (0) | 2025.04.18 |
---|---|
[혼자 공부하는 컴퓨터구조와 운영체제] 5_CPU 성능 향상 기법 (0) | 2025.04.04 |
[혼자 공부하는 컴퓨터구조와 운영체제] 4_CPU의 작동 원리 (0) | 2025.03.12 |
[혼자 공부하는 컴퓨터구조와 운영체제] 3_명령어 (0) | 2025.03.07 |
[혼자 공부하는 컴퓨터구조와 운영체제] 1_컴퓨터 구조 시작하기 (0) | 2025.03.05 |