html karakter encodings

, tegnsæt, der er en metode til omregning af bytes i tegn.at godkende eller udviser en html dokument, et program skal vælge en ordentlig tegnsæt. den mest almindelige tegnsæt eller tegnsæt, der er i brug på computere er ascii - den amerikanske standard for udveksling af oplysninger, og det er sandsynligvis den mest anvendte tegnsæt for elektronisk kodning tekst, der støtter kun ascii. øvre - og små latinsk alfabet, nummer 9, og nogle ekstra tegn, som i alt 128 tegn på alle.du kan se på komplette sæt af printervenlig ascii tegn, men mange sprog anvender enten accented latinske bogstaver eller helt forskellige alfabeter.ascii - ikke behandler disse tegn; derfor er du nødt til at lære om karakter encodings, hvis du ønsker at bruge ikke - ascii tegn. den internationale standardiseringsorganisation skabt en række karaktersæt skal beskæftige sig med de forskellige nationale tegn.for dokumenter på engelsk, og de fleste andre vesteuropæiske sprog, bred støtte, der koder for iso-8859-1 anvendes. her er listen over tegnsæt bruges verden rundt sammen med deres beskrivelse, tegnsæt beskrivelse iso-8859-1 latinsk alfabet del 1, som omfatter nord amerika, europa, latinamerika, thecaribbean, canada, afrika iso-8859-2 latinsk alfabet del 2, der omfatter østeuropa iso-8859-3 latinsk alfabet del 3 (se europas esperanto, diverse andre iso-8859-4 latinsk alfabet, del 4, der dækker de nordiske baltics (og andre ikke iso-8859-1) iso-8859-5 latin /kyrillisk alfabet del 5 iso-8859-6 latin /arabisk alfabet del 6 iso-8859-7 latin /græske alfabet, del 7 iso-8859-8 latin /hebraiske alfabet, del 8 iso-8859-9 latin 5 alfabet, del 9, som iso-8859-1 bortset fra tyrkiske tegn erstatte islandske dem iso-8859-10 latin 6 latin 6 lappish, nordiske og eskimo iso-8859-15 det samme som iso-8859-1, men med større bogstaver indsættes iso-2022-jp latin /japansk alfabet del 1 iso-2022-jp-2 latin /japansk alfabet del 2 iso-2022-kr latin /koreanske alfabet del 1, unicode for konsortiet blev derefter nedsat til at udtænke en måde at vise alle tegn på forskellige sprog i stedet for disse forskellige uforenelige tegnkoder for forskellige sprog. derfor, hvis de ønsker at skabe dokumenter, der bruger tegn fra forskellige tegnsæt, du vil være i stand til at gøre det ved hjælp af den fælles unicode character encodings., unicode fastsætter derfor, encodings, der kan håndtere en snor på særlige måder for at gøre plads til de store tegnsæt, det omfatter.det er kendt som utf - 8, utf-16, og utf-32., tegnsæt beskrivelse utf - 8 en unicode for oversættelse format, der kommer i 8 - bit - enheder, der kommer i byte.en karakter i utf - 8 kan være fra 1 til 4 bytes længe, at utf - 8 variabel bredde. utf-16 en unicode for oversættelse format, der kommer i 16 - bit - enheder, der kommer i shorts.det kan være 1 eller 2 shorts længe, at utf16 variabel bredde. utf-32 en unicode for oversættelse format, der kommer på 32 - bit - tal enheder, der kommer i lang tid.det er en fast bredde format og er altid 1. "lang". den første 256 tegn af unicode tegnsæt svarer til 256 tegn på iso-8859-1. ved misligholdelsehttp: //4 forarbejdningsvirksomheder, bør støtte utf - 8, og xml - forarbejdningsvirksomheder skal støtte utf - 8 og utf-16; derfor alle xhtml overensstemmende forarbejdningsvirksomheder, bør også støtte utf-16.,



Previous:
Next Page: