Az adatok egyik formáról a másikra konvertálásának folyamatát kódolásnak nevezik. Az adatok átalakítására szolgál, hogy az adatokat különböző rendszerek támogathassák és felhasználhassák. A kódolás hasonlóan működik, mint a hőmérséklet Celsius-fokról Fahrenheit-re konvertálása, mivel csak más formában lesz konvertálva, de az eredeti érték mindig ugyanaz marad. A kódolást főleg két területen használják:
Megjegyzés: A kódolás eltér a titkosítástól, mivel fő célja nem az adatok elrejtése, hanem az, hogy formátumba konvertálja azokat, hogy megfelelően lehessen használni.
Ebben a témában a számítástechnikában használt különböző típusú kódolási technikákat tárgyaljuk.
A kódolási technika típusa
Karakterkódolás
A karakterkódolás a karaktereket bájtokba kódolja . Tájékoztatja a számítógépeket, hogyan értelmezzék a nullákat és egyeseket valós karakterekké, számokká és szimbólumokká. A számítógép csak bináris adatokat ért meg; ezért ezeket a karaktereket numerikus kódokká kell átalakítani. Ennek érdekében minden karaktert bináris kóddá alakítanak át, és ehhez a szöveges dokumentumokat kódolási típusokkal mentik. Megtehető úgy, hogy számokat párosít karakterekkel. Ha nem alkalmazunk karakterkódolást, weboldalunk nem jeleníti meg a karaktereket és a szöveget megfelelő formátumban. Ez csökkenti az olvashatóságot, és a gép nem tudja megfelelően feldolgozni az adatokat. Továbbá a karakterkódolás gondoskodik arról, hogy minden karakter megfelelő ábrázolással rendelkezzen számítógépes vagy bináris formátumban.
Különböző típusú karakterkódolási technikák léteznek, amelyeket az alábbiakban ismertetünk:
HTML kódolás
A HTML kódolás a HTML oldal megfelelő formátumban történő megjelenítésére szolgál. A kódolással a webböngésző megtudja, hogy melyik karakterkészletet kell használni.
A HTML-ben a HTML-jelölésben különféle karaktereket használnak, például . Ahhoz, hogy ezeket a karaktereket tartalomként kódolhassuk, kódolást kell használnunk.
URL kódolás
URL (Uniform Resource locator) A kódolást használják konvertálja a karaktereket olyan formátumba, hogy az interneten keresztül továbbítható legyen . Százalékos kódolásként is ismert. Az URL-kódolás az URL-nek az ASCII-karakterkészlet használatával történő internetre küldésére szolgál. A nem ASCII karaktereket %-ra cseréljük, majd a hexadecimális számjegyeket.
UNICODE kódolás
A Unicode egy univerzális karakterkészlet kódolási szabványa. Lehetővé teszi a szöveg kódolását, megjelenítését és kezelését a legtöbb nyelven vagy írásrendszeren, amelyek világszerte elérhetők. Minden támogatott nyelven minden karakterhez kódpontot vagy számot biztosít. Megközelítőleg az összes lehetséges karaktert képviselheti az összes nyelven. Egy adott bitsorozatot kódolási egységnek nevezünk.
A UNICODE szabvány 8, 16 vagy 32 bitet használhat a karakterek ábrázolására.
A Unicode szabvány meghatározza a Unicode Transformation Format (UTF) formátumot a kódpontok kódolásához.
A UNICODE kódolási szabvány a következő UTF-sémákkal rendelkezik:
Az UTF8-at a UNICODE szabvány határozza meg, amely az elektronikai kommunikációban használt változó szélességű karakterkódolás. Az UTF-8 képes mind az 1 112 064 érvényes karakterkód pontot kódolni Unicode-ban egy-négy egybájtos (8 bites) kódegység használatával.
Az UTF16 kódolás a karakter kódpontjait jelenti a két 16 bites egész szám egyikével.
Az UTF32 kódolás minden kódpontot 32 bites egész számként ábrázol.
Base64 kódolás
A Base64 kódolás a bináris adatok egyenértékű ASCII karakterekké történő kódolására szolgál. A levelezőrendszerben a Base64 kódolást használják, mivel az olyan levelezőrendszerek, mint az SMTP, nem működnek bináris adatokkal, mert csak ASCII szöveges adatokat fogadnak el. Az egyszerű HTTP-hitelesítésben is használják a hitelesítő adatok kódolására. Ezenkívül a bináris adatok cookie-kba és egyéb paraméterekbe történő átvitelére is használják, hogy az adatokat olvashatatlanná tegyék a manipuláció elkerülése érdekében. Ha egy kép vagy más fájl Base64 kódolás nélkül kerül átvitelre, az megsérül, mivel a levelezőrendszer nem képes kezelni a bináris adatokat.
A Base64 az adatokat 3 bájtos blokkokban jeleníti meg, ahol minden bájt 8 bitet tartalmaz; ezért 24 bitet jelent. Ez a 24 bit négy 6 bites csoportra van osztva. Ezen csoportok vagy darabok mindegyike egyenértékű Base64 értékké konvertálódik.
ASCII kódolás
Amerikai szabványos információcsere kód (ASCII) a karakterkódolás egy fajtája. Ez volt az első karakterkódolási szabvány, amelyet 1963-ban adtak ki.
Az ASCII kód az angol karakterek számokként való megjelenítésére szolgál, ahol minden betűhöz egy szám tartozik 0-tól 127-ig. A legtöbb modern karakterkódolási séma ASCII-n alapul, bár számos további karaktert támogat. Ez egy bájtos kódolás, amely csak az alsó 7 bitet használja. Az ASCII-fájlban minden alfabetikus, numerikus vagy speciális karakter egy 7 bites bináris számmal van ábrázolva. A billentyűzet minden karakterének egyenértékű ASCII-értéke van.
Kép- és hang- és videókódolás
A tárhely megtakarítása érdekében kép- és hang- és videokódolás történik. Az olyan médiafájlok, mint a kép, a hang és a videó, kódolva vannak, hogy hatékonyabb és tömörített formátumba mentse őket.
Ezek a kódolt fájlok ugyanazt a tartalmat tartalmazzák, általában hasonló minőségben, de tömörített méretben, így kisebb helyen menthetők, könnyen átvihetők levélben, vagy letölthetők a rendszerre.
Érthetjük úgy, mint egy . A WAV audiofájlt .MP3 fájllá alakítja, hogy a méret 1/10-ével csökkenjentheredeti méretére.