Sekwencje ucieczkowe (escape sequences)
Transkrypt
Sekwencje ucieczkowe (escape sequences)
Sekwencje ucieczkowe (escape sequences) Sekwencje ucieczkowe to ciągi znaków zaczynające się od znaku \ (backslash). Występują one wewnątrz łańcuchów znaków i mają kilka zastosowań: 1. Umieszczenie w łańcuchu znaku, który w przeciwnym przypadku miałby specjalne znaczenie: a. \’ oznacza ‘ (a nie początek lub koniec łańcucha) b. \” oznacza ” (a nie początek lub koniec łańcucha) c. \\ oznacza \ (a nie początek sekwencji ucieczkowej) d. \przejście do nowej linii – pozwala kontynuować łańcuch w następnej linii (niepolecane) 2. Umieszczenie w łańcuchu znaku kontrolnego (z zestawu ASCII): a. \n – przejście do nowej linii, line feed (LF) b. \f – przejście do nowej strony, form feed (FF) c. \t – tabulacja pozioma, horizontal tabulation (HT) d. \v – tabulacja pionowa, vertical tabulation (VT) e. \b – zmazanie ostatniego znaku, backspace (BS) f. \a – dzwonek, bell (BEL) g. \r – powrót karetki, carriage return (CR) 3. Umieszczenie w łańcuchu znaku, którego nie ma na klawiaturze: a. \xhh , gdzie h – cyfra szestnastkowa: znak o kodzie 0xhh (można w ten sposób podać każdy znak o kodzie od 0 do 255, czyli 0xFF) b. \o, \oo lub \ooo , gdzie o – cyfra ósemkowa: znak o kodzie równym odpowiedniej liczbie ósemkowej (można w ten sposób zakodować każdy znak Unikodu o kodzie od 0 do 511, czy 0o777, w tym wszystkie polskie litery) c. \uhhhh , gdzie h – cyfra szestnastkowa: znak Unikodu o kodzie 0xhhhh (można w ten sposób zakodować całe BMP, czyli basic multilingual plane Unikodu, czyli w praktyce wszystkie powszechnie używane znaki; ostatni kod to 0xFFFF, czyli 65535) d. \Uhhhhhhhh , gdzie h – cyfra szestnastkowa: znak Unikodu o kodzie 0xhhhhhhhh (można w ten sposób zakodować wszystkie znaki Unikodu; ostatni dopuszczalny kod Unikodu to 0x10FFFF, czyli 1114111) e. \N{nazwa} , gdzie nazwa oznacza oficjalną nazwę znaku w Unikodzie Przykład: >>>eura = ”€ \u20AC \U000020AC \N{euro dign}” >>>print (eura) €€€€