스터디/컴퓨터구조

[혼자 공부하는 컴퓨터구조와 운영체제] 2_데이터

왹져박사 2025. 3. 5. 19:57

챕터2_데이터

 

💡

컴퓨터가 이해하는 정보 단위 이해하기.

0과 1로 다양한 숫자를 표현하는 방법 이해.

0과 1로 다양한 문자를 표현하는 방법 이해.


0과 1로 숫자를 표현하는 방법

 

정보 단위

  • 비트 (bit) : 0과 1을 나타내는 가장 작은 정보 단위
    • 바이트 (byte) : 8bit
    • 킬로바이트 (kB) : 1000byte
    • 메가바이트(MB) : 1000kB
    • 기가바이트 (GB) : 1000MB
    • 테라바이트 (TB) : 1000GB
  • 워드 (word)
    • 하프 워드 (half word)
    • 풀 워드 (full word)
    • 더블 워드 (double word)
    워드 크기가 큰 CPU는 한 번에 처리할 수 있는 데이터가 많음.
  • 대부분 32bit/64bit.
  • CPU가 한 번에 처리할 수 있는 데이터 크기

 

이진법

0과 1만으로 모든 숫자를 표현하는 방법

  • 이진수의 표기
    • 이진수 끝에 위와 같은 아래첨자 붙임 (수학적 표기)
    • 이진수 앞에 0b 붙임 (코드 상 표기)
  • 음수 표현
    • 2의 보수를 구해 음수로 간주하는 방법
    • 모든 0과 1을 뒤집고 1을 더한 값.
    • 플래그
    • 부가 정보. 숫자는 음수와 양수를 구분하는 플래그 가짐.

 

십육진법

15를 넘어가는 시점에 자리 올림하여 수를 표현하는 방법.

  • 십육진수 표기
    • 십육진수 끝에 위와 같은 아래첨자 붙임 (수학적 표기)
    • 십육진수 앞에 0x 붙임 (코드 상 표기)

 

십육진수의 이진수 변환

십육진수를 이루는 숫자 하나를 이진수로 표현하려면 2^4 = 16 → 4bit 필요

 

이진수의 십육진수 변환

4 숫자씩 끊어 변환

 


 

0과 1로 문자를 표현하는 방법

 

문자 집합과 인코딩

문자 집합

  • 컴퓨터가 인식하고 표현할 수 있는 문자의 모음

문자 인코딩

  • 문자를 0과 1로 변환하는 과정
  • 같은 문자 집합도 다양한 인코딩 방법 존재 가능

문자 디코딩

  • 인코딩의 반대 과정
  • 0과 1로 이루어진 문자 코드를 사람이 이해할 수 있는 문자로 변환하는 과정

 

아스키 코드

아스키 문자에 대응된 고유한 수.

아스키 문자들은 각각 7비트로 표현됨.

2^7 = 128로, 총 128개의 문자 표현 가능.

→ 아스키 문자는 대응된 고유한 수를 통해 아스키 코드로 인코딩 됨

  • 단점
    • 문자 집합 외의 문자 표현 불가능.
    • → 확장 아스키(8비틀 표현한 문자) 등장 but 부족..

 

EUC-KR

한 한글 단어에 2byte 크기 부여

  • 완성형 인코딩
  • 하나의 글자에 고유한 코드 부여하는 방식
  • 조합형 인코딩
  • 초성, 중성, 종성을 위한 비트열의 조합으로 하나의 글자 코드 완성 방식

 

유니코드와 UTF-8

  • 유니코드
  • 모든 언어를 아우르는 문자 집합.
  • UTF-8, UTF-16, UTF-32 등
  • 통일된 표준 인코딩 방식. UTF-8이 가장 대중적.