ASCII(American Standard Code for Information Interchange)


미국 국립 표준협회에서 표준화한 정보교환용 7비트 부호체계로 ASCII는 영문 알파벳을 사용하는 대표적인 문자 인코딩이다.

아스키는 33개의 출력 불가능한 제어 문자들과 공백을 비롯한 95개의 출력 가능한 문자들로 000(0x00)부터 127(ox7F)까지 총 128개로 이루어진다.

제어 문자들의 역사적인 이유로 남아 있으며 더 이상 사용하지 않음

아스키가 널리 사용되면서 다양한 아스키 기반의 확장 인코딩들이 등장했으며, 이들을 묶어서 아스키라고 부르기도 한다.

대표적으로 7비트 인코딩을 유지한 ISO/IEC 646

원래 아스키 앞에 비트 0을 넣어 8비트 인코딩을 만든 IBM 코드 페이지, ISO 8859가 있다.

Unicode


ASCII가 2바이트 이상의 다양한 코드들을 표현할 수 없기 때문에 현대에는 Unicode를 더 많이 사용한다.

유니코드는 유니코드 콘소시엄이라는 단체에서 규율했으며 유니코드는 전 세계의 모든 문자를 컴퓨터에서 일관되게 표현하고 다룰 수 있도록 설계된 산업 표준이다. 따라서 유니코드를 사용하면 한글과 신자체, 간자체, 아랍 문자 등을 통일된 환경에서 깨뜨리지 않고 사용할 수 있다.

우리가 핸드폰에서 문자 텍스트를 칠 때 한 글자당 2byte로 처리되는 이유는 바로 유니코드를 사용하기 때문이다.