Java -практические советы

         

Символы

Для записи одиночных символов используются следующие формы.

  • Печатные символы можно записать в апострофах: ' а ', ' N ', '

    ? '.
  • Управляющие символы записываются в апострофах с обратной наклонной чертой:
    • ' \n ' — символ перевода строки newline с кодом ASCII 10;
    • ' \r ' — символ возврата каретки CR с кодом 13;
    • ' \f ' — символ перевода страницы FF с кодом 12;
    • ' \b ' — символ возврата на шаг BS с кодом 8;
    • ' \t ' — символ горизонтальной табуляции НТ с кодом 9;
    • ' \\ ' — обратная наклонная черта;
    • ' \" ' — кавычка;
    • ' \' ' — апостроф.
  • Код любого символа с десятичной кодировкой от 0 до 255 можно задать, записав его не более чем тремя цифрами в восьмеричной системе счисления в апострофах после обратной наклонной черты: ' \123 ' — буква S , ' \346 ' — буква Ж в кодировке СР1251. Не рекомендуется использовать эту форму записи для печатных и управляющих символов, перечисленных в предыдущем пункте, поскольку компилятор сразу же переведет восьмеричную запись в указанную выше форму. Наибольший код ' \377 ' — десятичное число 255.
  • Код любого символа в кодировке Unicode набирается в апострофах после обратной наклонной черты и латинской буквы ц ровно четырьмя шестнад-цатеричными цифрами: ' \u0053 ' — буква S , ' \u0416 ' — буква Ж .

Символы хранятся в формате типа char (см. ниже).

Примечание

Прописные русские буквы в кодировке Unicode занимают диапазон от ' \u0410 ' — заглавная буква А , до ' \u042F ' — заглавная Я , строчные буквы от ' \u0430 ' — а , до ' \044F ' — я .

В какой бы форме ни записывались символы, компилятор переводит их в Unicode, включая и исходный текст программы.

Замечание

Компилятор и исполняющая система Java работают только с кодировкой Unicode.

 

Содержание раздела