ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [혼공컴운] 02 데이터
    CS/컴퓨터 구조와 운영체제 2023. 7. 26. 23:13

    02-1 0과 1로 숫자를 표현하는 방법

    정보단위

    - 0과 1을 나타내는 가장 작은 정보 단위를 비트(bit)라고 한다.

    - n비트는 2의 n제곱 가지의 정보를 표현할 수 있다.

    1byte 8bit
    1kB 1000byte
    1MB 1000kB
    1GB 1000MB
    1TB 1000GB

    - 참고로 1024byte = 1KiB(Kibibyte)이다.

    - 워드(word)란 CPU가 한 번에 처리할 수 있는 데이터 크기를 의미하고 현대 컴퓨터의 워드 크기는 대부분 32비트 또는 64비트이다.

     

     

    이진법

    - 이진수를 나타낼 때에는 끝에 아래첨자로 (2)를 붙이거나 이진수 앞에 0b를 붙인다.

    예) 1000(2), 0b1000

    - 이진수로 음수를 표현하는 방법 중 가장 널리 사용되는 방법은 2의 보수를 구해 이 값을 음수로 간주하는 방법이다.

    - 2의 보수의 사전적 의미는 '어떤 수를 그보다 큰 2의 n제곱에서 뺀 값'을 의미한다.

    - 컴퓨터 내부에서 음수와 양수를 구분하기 위해 플래그라는 부가정보를 사용한다.

     

     

    십육진법

    - 십육진수를 나타낼 때에는 끝에 아래첨자로 (16)을 붙이거나 0x를 앞에 붙인다.

    예) 15(16), 0x15

    - 십육진수의 숫자 하나를 이진수로 표현하려면 4비트가 필요하기 때문에 각 자리의 수를 4비트의 이진수로 변환한 뒤 이어붙이면 된다.

     

     

    02-2 0과 1로 문자를 표현하는 방법

    문자 집합과 인코딩

    - 컴퓨터가 인식하고 표현할 수 있는 문자의 모음을 문자 집합이라고 한다.

    - 문자를 이진수로 변환하는 과정을 문자 인코딩, 반대의 과정을 문자 디코딩이라고 한다.

     

     

    아스키 코드

    - 아스키는 초창기 문자 집합 중 하나로, 영어 알파벳과 아라비아 숫자, 그리고 일부 특수 문자를 포함한다.

    - 아스키 문자 집합에 속한 문자들은 각각 7비트로 표현되기 때문에 총 128개의 문자를 표현할 수 있다.

     

    EUC-KR

    - 한글 인코딩에는 완성형과 조합형 방식이 존재하는데 EUC-KR은 완성형 인코딩 방식을 사용한다.

    - 한글 한 글자당 2바이트 코드가 부여되기 때문에 16진수 네 자리로 표현이 가능하다.

    - 모든 한글을 표현할 수 없다는 단점이 있다.

     

     

    유니코드와 UTF-8

    - 유니코드는 여러 나라의 문자를 광범위하게 표현할 수 있는 통일된 문자 집합이다.

    - 유니코드는 글자에 부여된 값 자체를 인코딩된 값으로 삼지 않고 이 값을 다양한 방법으로 인코딩한다.

    - 인코딩 방법에는 대표적으로 UTF-8, UTF-16, UTF-32 등이 있다.

     

     

    출처: 혼자 공부하는 컴퓨터 구조 + 운영체제

     

Designed by Tistory.