미국 국립 표준협회에서 표준화한 정보교환용 7비트 부호체계로 ASCII는 영문 알파벳을 사용하는 대표적인 문자 인코딩이다.
아스키는 33개의 출력 불가능한 제어 문자들과 공백을 비롯한 95개의 출력 가능한 문자들로 000(0x00)부터 127(ox7F)까지 총 128개로 이루어진다.
제어 문자들의 역사적인 이유로 남아 있으며 더 이상 사용하지 않음
아스키가 널리 사용되면서 다양한 아스키 기반의 확장 인코딩들이 등장했으며, 이들을 묶어서 아스키라고 부르기도 한다.
대표적으로 7비트 인코딩을 유지한 ISO/IEC 646
원래 아스키 앞에 비트 0을 넣어 8비트 인코딩을 만든 IBM 코드 페이지, ISO 8859가 있다.
ASCII가 2바이트 이상의 다양한 코드들을 표현할 수 없기 때문에 현대에는 Unicode를 더 많이 사용한다.
유니코드는 유니코드 콘소시엄이라는 단체에서 규율했으며 유니코드는 전 세계의 모든 문자를 컴퓨터에서 일관되게 표현하고 다룰 수 있도록 설계된 산업 표준이다. 따라서 유니코드를 사용하면 한글과 신자체, 간자체, 아랍 문자 등을 통일된 환경에서 깨뜨리지 않고 사용할 수 있다.
우리가 핸드폰에서 문자 텍스트를 칠 때 한 글자당 2byte로 처리되는 이유는 바로 유니코드를 사용하기 때문이다.