~uno
|
Кодировка, кодовая страница
     Коды для функций выбора кодировки: NoChange | -1 | ANSI | 0 | OEMCP | 1 | MACCP | 2 | THREAD_ACP | 3 | UTF7 | 65000 | UTF8 | 65001 | Central European (DOS) | 852 | Central European Alphabet (Windows) | 1250 | Central European Alphabet (ISO) | 28592 | Cyrillic Alphabet (DOS) | 866 | Cyrillic Alphabet (Windows) | 1251 | Cyrillic Alphabet (ISO) | 28595 | Cyrillic Alphabet (KOI8-R) | 20866 | Ukrainian Alphabet (KOI8-RU) | 21866 | Latin 3 Alphabet (ISO) | 28593 | Western Alphabet | 1252 | Baltic Alphabet (Windows) | 1257 | Baltic Alphabet (ISO) | 28594 |
     В потоке данных UTF-16 старший байт может записываться либо перед младшим (англ. UTF-16 little-endian), либо после младшего (англ. UTF-16 big-endian). Аналогично существует два варианта четырёхбайтной кодировки — UTF-32LE и UTF-32BE. Для определения формата представления Юникода в начало текстового файла записывается сигнатура — символ U+FEFF (неразрывный пробел с нулевой шириной), также именуемый маркером последовательности байтов (англ. byte order mark (BOM)). Это позволяет различать UTF-16LE и UTF-16BE, поскольку символа U+FFFE не существует. Также этот способ иногда применяется для обозначения формата UTF-8, хотя к этому формату и неприменимо понятие порядка байтов. UTF-8 - EF BB BF
     UTF-16BE - FE FF
     UTF-16LE - FF FE
     UTF-32BE - 00 00 FE FF
     UTF-32LE - FF FE 00 00 К сожалению, этот способ не позволяет надёжно различать UTF-16LE и UTF-32LE, поскольку символ U+0000 допускается Юникодом (хотя реальные тексты редко начинаются с него). Файлы в кодировках UTF-16 и UTF-32, не содержащие BOM, должны иметь порядок байтов big-endian (unicode.org).
     Символы UTF-8 получаются из Unicode следующим образом: Unicode UTF-8: 0x00000000 — 0x0000007F: 0xxxxxxx 0x00000080 — 0x000007FF: 110xxxxx 10xxxxxx 0x00000800 — 0x0000FFFF: 1110xxxx 10xxxxxx 10xxxxxx 0x00010000 — 0x001FFFFF: 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
     Кодировка ASCII .0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F 2. ! " # $ % & ' ( ) * + , — . / 3. 0 1 2 3 4 5 6 7 8 9 : ; < = > ? 4. @ A B C D E F G H I J K L M N O 5. P Q R S T U V W X Y Z [ ] ^ _ 6. ` a b c d e f g h i j k l m n o 7. p q r s t u v w x y z { | } ~
     Коды для кириллицы в юникоде: 0410 А 0430 а 0411 Б 0431 б 0412 В 0432 в 0413 Г 0433 г 0414 Д 0434 д 0415 Е 0435 е 0416 Ж 0436 ж 0417 З 0437 з 0418 И 0438 и 0419 Й 0439 й 041A К 043A к 041B Л 043B л 041C М 043C м 041D Н 043D н 041E О 043E о 041F П 043F п 0420 Р 0440 р 0421 С 0441 с 0422 Т 0442 т 0423 У 0443 у 0424 Ф 0444 ф 0425 Х 0445 х 0426 Ц 0446 ц 0427 Ч 0447 ч 0428 Ш 0448 ш 0429 Щ 0449 щ 042A Ъ 044A ъ 042B Ы 044B ы 042C Ь 044C ь 042D Э 044D э 042E Ю 044E ю 042F Я 044F я
     0401 Ё 0451 ё
     ВАРИАНТЫ Ё Й
     0401 Ё cyrillic capital letter io 0415 0308 1.1 0451 ё cyrillic small letter io 0435 0308 1.1 0419 Й cyrillic capital letter short i 0418 0306 1.1 0439 й cyrillic small letter short i 0438 0306 1.1
     Западноевропейская кодировка ISO 8859-1. Windows−1252 частично совпадает с ней. В Юникоде первые 256 кодовых позиций совпадают с ISO-8859-1.
     Коды для латышских дополнительных (отличных от латиницы) букв в юникоде: 100h ā 101h Ā 10Ch č 10Dh Č 112h ē 113h Ē 122h ģ 123h Ģ 12Ah ī 12Bh Ī 136h ķ 137h Ķ 13Bh ļ 13Ch Ļ 145h ņ 146h Ņ 160h š 161h Š 16Ah ū 16Bh Ū 17Dh ž 17Eh Ž
Страница "Кодировка" обновлена 18.2.2016
Проекты:
Определения:
Определения
Система
Проект PintLang
VendorPint
Глобальные константы
Глобальные переменные
Ресурсы
События
VendorPint
|
|
|
Кодировка, кодовая страница | © 2008-2015 | Все права защищены. | Создание сайта WebOptimal |
При полном или частичном использовании материалов сайта ссылка на http://PowerIntellect.com обязательна.
|
|
|