Sekwencje ucieczkowe (escape sequences)

Transkrypt

Sekwencje ucieczkowe (escape sequences)
Sekwencje ucieczkowe (escape sequences)
Sekwencje ucieczkowe to ciągi znaków zaczynające się od znaku \ (backslash). Występują
one wewnątrz łańcuchów znaków i mają kilka zastosowań:
1. Umieszczenie w łańcuchu znaku, który w przeciwnym przypadku miałby specjalne
znaczenie:
a. \’ oznacza ‘ (a nie początek lub koniec łańcucha)
b. \” oznacza ” (a nie początek lub koniec łańcucha)
c. \\ oznacza \ (a nie początek sekwencji ucieczkowej)
d. \przejście do nowej linii – pozwala kontynuować łańcuch w następnej linii
(niepolecane)
2. Umieszczenie w łańcuchu znaku kontrolnego (z zestawu ASCII):
a. \n – przejście do nowej linii, line feed (LF)
b. \f – przejście do nowej strony, form feed (FF)
c. \t – tabulacja pozioma, horizontal tabulation (HT)
d. \v – tabulacja pionowa, vertical tabulation (VT)
e. \b – zmazanie ostatniego znaku, backspace (BS)
f. \a – dzwonek, bell (BEL)
g. \r – powrót karetki, carriage return (CR)
3. Umieszczenie w łańcuchu znaku, którego nie ma na klawiaturze:
a. \xhh , gdzie h – cyfra szestnastkowa: znak o kodzie 0xhh (można w ten sposób
podać każdy znak o kodzie od 0 do 255, czyli 0xFF)
b. \o, \oo lub \ooo , gdzie o – cyfra ósemkowa: znak o kodzie równym
odpowiedniej liczbie ósemkowej (można w ten sposób zakodować każdy znak
Unikodu o kodzie od 0 do 511, czy 0o777, w tym wszystkie polskie litery)
c. \uhhhh , gdzie h – cyfra szestnastkowa: znak Unikodu o kodzie 0xhhhh (można
w ten sposób zakodować całe BMP, czyli basic multilingual plane Unikodu,
czyli w praktyce wszystkie powszechnie używane znaki; ostatni kod to 0xFFFF,
czyli 65535)
d. \Uhhhhhhhh , gdzie h – cyfra szestnastkowa: znak Unikodu o kodzie
0xhhhhhhhh (można w ten sposób zakodować wszystkie znaki Unikodu;
ostatni dopuszczalny kod Unikodu to 0x10FFFF, czyli 1114111)
e. \N{nazwa} , gdzie nazwa oznacza oficjalną nazwę znaku w Unikodzie
Przykład:
>>>eura = ”€ \u20AC \U000020AC \N{euro dign}”
>>>print (eura)
€€€€

Podobne dokumenty