Hvordan å skille mellom XML og HTML

hvert som du avanserer i ferd med å bli en bedre webdesigner eller programmerer, er det svært nyttig å vite hva som kjennetegner ulike kodespråk. I denne artikkelen skal vi diskutere de nødvendige skritt for å avgjøre om et dokument er HTML eller XML. HTML og XML er en del av en familie av språk som stammer fra SGML (SGML). Du kan lære mer om SGML fra World Wide Web Consortium (W3C)
La oss se kort HTML og XML:
XML - Extensible Markup Language er et tekstbasert cross-platform språk som er gjør det mulig å lagre. data (som adresser i en adressebok) i en strukturert måte. XML-dokumentet er forventet å ha riktig syntaks. Derfor, når du gjør XML-dokumenter de bør være velformet
. En velformet dokument har følgende:

Stengt tags (< mutualfunds > < /mutualfunds > eller < aksjer />)

Et element attributt må stå i anførselstegn (< aksjekurs = " 73,45 " >)

XML er case sensitive. Med andre ord begynnelsen og slutten tag bør bruke samme sak
HTML - Hypertext Markup Language er en tekst-baserte plattformer språket som brukes til forfattersider for presentasjon på world wide web. Ved hjelp av HTML man kan skape statisk eller dynamisk innhold for andre å se. HTML er litt mildere og lar noen koder for å ikke bli nestet riktig. HTML er ikke case sensitive og tomme elementer (for eksempel < br > den linjeskift eller < p > for avsnitt) trenger ikke å være stengt
Disse to språk har ulike mål for sluttbrukerne.. Du ville ikke primært bruker XML til å lage et nettsted for folk å besøke. Og HTML ville ikke være den optimale verktøyet for å representere data for ulike plattformer. Derfor er det veldig nyttig å forstå forskjellen mellom de to, slik at du kan bruke dem effektivt.
Trinn 1
I vårt første skritt vi skal ta en titt på to eksempeldokumenter. Ved utgangen av våre skritt må vi verktøy for å finne ut om vår dokumentet HTML eller XML basert på vår diskusjon
Dokument 1:.?
≪ xml version = " 1,0 " encoding = " utf-8 "? > < jobber > < jobb id = " en " > < title > Accountant < /title > < divisjon > Finance < /divisjon > < beskrivelse > Vårt selskap trenger en regnskapsfører til å utføre regnskaps oppgaver. < /beskrivelse > < jobtype > Full-Time < /jobtype > < /jobb > < jobb id = " 2 " > < title > Financial Director < /title > < divisjon > Finance < /divisjon > < beskrivelse > Vårt firma trenger en finansdirektør til å utføre administrative oppgaver. < /beskrivelse > < jobtype > Contract < /jobtype > < /jobb > < /arbeidsplasser >
Dokument 2:
<! DOCTYPE HTML PUBLIC " - //W3C //DTD HTML 4.01 //EN " " http: //www.w3.org/TR/html4/strict.dtd" > < html > < head > < title > E-Tech Company Sysselsetting oppføringer < /title > < /head > < body > < div id = " innhold " > Se en oversikt nedenfor < br > < ul > < li > < a href = " accountant.html " > Accountant < /a > < br > < li > < a href = " financialdirector.html " > Financial Director < /a > < /ul > < /div > < /body > < /html >
Trinn 2
Clue # 1: Første linje
Både dokument 1 og dokument 2 begynner veldig annerledes og den første linjen gir oss en verdifull anelse om deres opprinnelse . Dokument 1 har det som kalles en behandlingsinstruksjon. Det er hva XML bruker. Dokument 2 bruker <! DOCTYPE ... >. Dette er en dokumenttype erklæring som forteller leseren som validator type du vil bruke. Kompatible nettsider, eller med andre ord, websider som følger de forventede reglene for HTML, bør spesifisere en dokumenttype. Du kan selvfølgelig bare bruke < html > for web-sider, men å angi en dokumenttype er sterkt anbefalt.
Trinn 3
Clue # 2: Lukket Tags og små bokstaver
I vår første dokumentet alle våre koder er stengt. Vi ser bare begynnelsen og slutten tag typer. Disse elementene er referert til som å bli lukket. XML-dokumenter må ha lukkede tagger. I Dokument 2 på den annen side har vi < li > koder som ikke er lukket, samt en < br > tag. Vi kan fortsatt gjøre dette og likevel ha et gyldig HTML-dokument. Dokument 2 definitivt ikke et XML-dokument. Derfor har vi et mye sterkere argument at Dokument 2 er ikke et XML-dokument.
Også i dokument 1 alt er i små bokstaver og matching. Som du husker XML-dokumenter må være store og små bokstaver.
Trinn 4
Clue # 3: Forventet Tags
Vår siste sporet forholder seg til reglene eller syntaksen i HTML. HTML-dokumenter forventes å ha visse koder for å kunne presentere informasjon. Den primære eksempel er tag < html >. Dette elementet må spesifiseres slik at leseren vet dokumentet er HTML. For å ha en tittel du må gi < title > koder også. XML er helt forskjellig i denne henseende. Du kan angi noen koder du ønsker dine data. I alle XML-dokument vil du ikke finne en body-koden med mindre du angir et element du vil kalt " body ". Det vil bli forventet å være lukket og være store og små bokstaver.
Ta en titt på eksempelet nedenfor:?
< xml version = " 1,0 " encoding = " UTF-8 "? > < html > < head > < title > E-Tech Company Sysselsetting oppføringer < /title > < /head > < body > < div id = " innhold " > Se en oversikt nedenfor < ul > < li > < a href = " accountant.html " > Accountant < /a > < /li > < li > < a href = " financialdirector.html " > Financial Director < /a > < /li > < /ul > < /div > < /body > < /html >
Dette er faktisk et velformet XML-dokument. Det kan synes å være et HTML-dokument, men vår behandling instruksjon gir en verdifull anelse om hva slags dokument vi har.
konklusjon, har vi identifisert dokument 1 som XML og dokument 2 som HTML.
Som et siste tips, anbefaler jeg alltid validere HTML og XML-kode. HTML-koden skal valideres av en klage kontrolløren som W3C. Et verktøy som XML Spy eller Validome er også verdifulle i å validere XML-kode i tillegg. Anmeldelser