Prieš įdiegiant HTML5, nustatykite simbolio kodavimą dokumente, naudodami elementą, norėdami parašyti šiek tiek išsamią eilutę, parodytą žemiau. Tai elementai "Meta Charset", jei naudojate HTML4 savo tinklalapyje:
Svarbu pastebėti šiame codeare kabutes, kurias matote aplink turinys atributas: turinys = ' text / html; charset = iso-8859-1 ' . Kaip ir visi HTML atributai, šie kabutės apibrėžia atributo vertę, nurodant, kad visa eilutė text / html; charset = iso-8959-1 yra turinys Šis elementas yra tinkamas HTML, ir tai reiškia, kad ši eilutė turėjo būti parašyta. Tai taip pat sudėtinga ilgai ir bjauriai! Tai taip pat nėra kažkas, ko galbūt nepamirštumėtės virš galvos! Daugeliu atvejų žiniatinklio kūrėjai turėtų kopijuoti ir įklijuoti šį kodą iš vienos svetainės į bet kurį naują, kurį jie kuria, nes daug rašė apie tai rašyti iš naujo.
HTML5 išskiria papildomus "daiktus"
HTML5 ne tik pridėjo nemažai naujų elementų į kalbą, bet ir labai supaprastino daugelį HTML sintaksės, įskaitant elementą "Meta Charset". Naudodami HTML5 galite pridėti savo simbolių kodavimą su žymiai lengviau prisimenu sintaksęMETA elementas, kurį matote žemiau:
Palyginkite supaprastintą sintaksę su tuo, ką parašėme šio straipsnio pradžioje, seną HTML4 sintaksės sintaksę, ir pamatysite, kaip lengviau rašyti ir prisiminti HTML5 versiją. Vietoj to, kad reikia nukopijuoti ir įklijuoti jį iš esamos svetainės į bet kurį kitą, kuriame dirbote, tai yra visiškai kažkas, kad galėtumėte prisiminti kaip internetinį kūrėją. Šios laiko sutaupymo daugeliu atvejų nėra daug, bet kai atsižvelgsite į kitas HTML5 supaprastintas sintaksės sritis, sutaupysite!
Visada įtraukite simbolių kodavimą
Visada turėtumėte įtraukti savo tinklalapių simbolių kodavimą, net jei jūs kada nors ketinate naudoti specialius simbolius. Jei neįtraukiate simbolių kodavimo, jūsų svetainė tampa pažeidžiama kryžminio skenavimo scenarijų atakai naudojant UTF-7.
Šiame scenarijuje anattackeris mato, kad jūsų svetainėje nėra apibrėžta simbolių kodavimo, taigi triukas verčia naršyklę manyti, kad puslapio simbolių kodavimas iš tiesų yra UTF-7. Be to, užpuolikas injekuoja UTF-7 koduotus scenarijus į tinklalapį ir jūsų svetainė yra įsilaužta. Tai akivaizdžiai kelia problemų visiems, nuo jūsų įmonės iki jūsų lankytojų. Geros naujienos yra tai, kad paprasta išvengti problemos - tiesiog būtinai pridedate simbolių kodavimą visose jūsų tinklalapiuose.
Kur pridėti simbolių kodavimą
Kodo kodavimas tinklalapiui turėtų būti pirmoji HTML eilutė
elementas. Tai užtikrina, kad naršyklė žinotų, kas yra simbolių kodavimas, prieš tai, kai jis daro kažką kito puslapio, išskyrus tai, kaip nustatyti doctypą ir nustatyti, kad jis yra HTML puslapis. Jūsų HTML turėtų būti:…
Naudojant HTTP antraštes papildomam saugumui
Taip pat galite nurodyti simbolių kodavimą HTTP antraštėse. Tai dar labiau saugu nei pridėti jį prie HTML puslapio, tačiau jums reikės turėti prieigą prie serverio konfigūracijų arba .htaccess failų, o tai reiškia, kad jums gali prireikti dirbti su savo svetainės prieglobos paslaugų teikėju, norint gauti tokio pobūdžio prieigą arba padaryti ją pakeitimai jums. Prieiga yra tikrai iššūkis. Pati pakeitimas yra paprastas, todėl bet kuris prieglobos paslaugų teikėjas turėtų sugebėti padaryti šį pakeitimą jūsų santykinai lengvai.
Jei naudojate "Apache", galite nustatyti numatytąjį visų jūsų svetainės simbolių rinkinį pridėdami: AddDefaultCharset UTF-8 prie savo šaknies .htaccess failas Apache numatytojo simbolių rinkinys yra ISO-8859-1.













