29 oktober, 2011

ASCII vs UTF-8

ASCII kodna tebela
ASCII (kratica za angleško American Standard Code for Information Interchange) je ameriški standardni nabor za izmenjavo informacij je 7-bitni nabor znakov; obsega 27=128 znakov. ASCII tabela nima šumnikov.
Znaki s kodami od 0 do 31 so kontrolni znaki, znaki od 32 do 126 pa so izpisljivi, glej tabelo spodaj:
UTF-8
UTF-8 je eden izmed načinov kodiranja mednarodnega nabora znakov unicode, pri katerem znaki ASCII ostanejo enozložni, ostali znaki pa lahko zasedajo več zlogov. Ta način ima tudi šumnike. Spletne strani uporabljajo več ali manj UTF-8 način kodiranja.

MOJ PRIIMEK (vzvratno) zapisan v ASCII kodi:
k     01101011
e     01100101
c     01100011
n    01101110
o    01101111
K    01001011  

MOJ PRIIMEK (vzvratno) zapisan v UFT-8:
k    01101011
e    01100101
c    01100011
n    01101110
o    01101111
K    01001011    

Ni komentarjev:

Objavite komentar