문자에는 몇 비트 또는 바이트가 있습니까?
"문자"당 얼마나 많은 비트 또는 바이트가 있습니까?
문자와 인코딩에 따라 다릅니다.
8 비트 ASCII 인코딩의 ASCII 문자는 8 비트 (1 바이트)이지만 7 비트에 맞을 수 있습니다.
ISO-8859-1 인코딩의 ISO-8895-1 문자는 8 비트 (1 바이트)입니다.
UTF-8 인코딩의 유니 코드 문자는 8 비트 (1 바이트)에서 32 비트 (4 바이트) 사이입니다.
UTF-16 인코딩의 유니 코드 문자는 16 (2 바이트)에서 32 비트 (4 바이트) 사이이지만 대부분의 일반 문자는 16 비트를 사용합니다. Windows에서 내부적으로 사용하는 인코딩입니다.
UTF-32 인코딩의 유니 코드 문자는 항상 32 비트 (4 바이트)입니다.
UTF-8의 ASCII 문자는 8 비트 (1 바이트)이고 UTF-16-16 비트입니다.
ISO-8895-1 (0xA0-0xFF)의 추가 (비 ASCII) 문자는 UTF-8 및 UTF-16에서 16 비트를 사용합니다.
이는 0.03125에서 0.125 사이의 문자가 비트에 있음을 의미합니다.
바이트에는 8 비트가 있습니다 (일반적으로 Windows에서 말함).
그러나 문자를 다루는 경우 문자 집합 / 인코딩에 따라 다릅니다. 유니 코드 문자는 2 바이트 또는 4 바이트가 될 수 있으므로 16 비트 또는 32 비트가 될 수 있지만 Windows-1252는 때때로 ANSI라고 잘못 불리우는 1 바이트이므로 8 비트입니다.
아시아 버전의 Windows 및 기타 일부에서는 전체 시스템이 2 바이트로 실행되므로 문자는 16 비트입니다.
편집 됨
Matteo의 의견에 따르면 모든 최신 버전의 Windows는 문자 당 내부적으로 16 비트를 사용합니다.
참고 URL : https://stackoverflow.com/questions/4850241/how-many-bits-or-bytes-are-there-in-a-character
'Programing' 카테고리의 다른 글
Kotlin에 생성자 참조가 있나요? (0) | 2020.10.15 |
---|---|
C # Generics에서 "기본"형식 매개 변수에 대한 합리적인 접근 방식이 있습니까? (0) | 2020.10.15 |
Windows 7에 Apache Bench를 설치하는 방법은 무엇입니까? (0) | 2020.10.14 |
Python : PATH 환경 변수를 수정하는 플랫폼 독립적 인 방법 (0) | 2020.10.14 |
MySQL에서 날짜 비교 (0) | 2020.10.14 |