Prevodník binárny ↔ text — UTF-8 a ASCII

Prevedie text na binárny kód a späť, s UTF-8 alebo ASCII a voliteľným zoskupením bitov.

Znaky: 4 Bajty UTF-8: 4 Dĺžka výstupu: 35
Rýchla referencia: bežné znaky ASCII v 8-bitovom binárnom
Znak Desiatkovo Binárne (8 bitov)
A6501000001
Z9001011010
a9701100001
z12201111010
04800110000
95700111001
(medzera)3200100000
!3300100001
?6300111111
(nový riadok)1000001010

Často kladené otázky

Ako funguje konverzia textu na binárny kód?
Každý znak v texte má číselný kód (jeho kódový bod). Pri ASCII znakoch sa kód zmestí do 7 bitov a doplní sa nulou na 8. Znak A má kód 65, čo je v binárnom tvare 01000001. Prevodník prečíta každý znak, vyhľadá jeho kód a zapíše binárnu reprezentáciu bajt po bajte. Pri UTF-8 sa znak mimo ASCII zakóduje viacerými bajtmi.
Aký je rozdiel medzi ASCII a UTF-8?
ASCII pokrýva 128 znakov (anglická abeceda, číslice, interpunkcia) a používa jeden 7-bitový bajt na znak. UTF-8 je kódovanie s premenlivou dĺžkou, ktoré zvládne každý znak — latinka, slovenské diakritiky (á, č, ď, ľ, š, ť, ž), cyrilika, čínština, emoji — pomocou jedného až štyroch bajtov. ASCII znaky sú v UTF-8 rovnaké (jeden bajt). Slovenské znaky s diakritikou potrebujú 2 bajty. Pre slovenský text vždy použite UTF-8 — ASCII jednoducho diakritiku nevie.
Prečo mi nefunguje dekódovanie binárneho kódu?
Bežné príčiny: (1) skupiny bitov nemajú 8 (alebo 7) bitov — skontrolujte, či nie sú extra medzery; (2) sú prítomné iné znaky než 0 a 1; (3) binárny kód predstavuje neúplnú UTF-8 sekvenciu (napr. začiatok znaku č bez druhého bajtu). Dekodér ohlási pozíciu prvej chyby. Ak vstup nemá oddeľovače, nastavte „Zoskupenie bitov" na 8 a „Oddeľovač" na Žiaden.
Koľko bitov na znak použiť?
Štandardná konvencia je 8 bitov na bajt. Čisté ASCII sa zmestí do 7 bitov, ale uložené dáta a sieťové protokoly vždy doplňujú na 8. 7-bitový režim používajte len pri starých teletypových protokoloch alebo školských úlohách (napr. maturita z informatiky). Znaky mimo ASCII — slovenská diakritika, cyrilika, čínština, emoji — vyžadujú viacbajtové UTF-8, takže 7-bitové zoskupenie sa na ne neaplikuje.
Môžem konvertovať slovenský text alebo emoji?
Áno — nechajte kódovanie nastavené na UTF-8. Slovenské písmeno č má v UTF-8 dva bajty: 11000100 10001101. Rovnako š, ž, ľ, ť, ď a samohlásky s dĺžňom (á, é, í, ó, ú, ý) sú dvojbajtové. Znaky CJK (čínske, japonské, kórejské) majú tri bajty. Emoji typicky zaberajú štyri bajty. Režim ASCII odmietne akýkoľvek znak mimo rozsahu 0-127 chybou.
Je binárny kód to isté ako strojový kód?
Nie. Binárny kód je len číselná sústava — sústava so základom 2 — ktorá používa dve číslice, 0 a 1. Strojový kód je binárna reprezentácia inštrukcií CPU, ktorá je špecifická pre konkrétny procesor (x86, ARM). Binárny kód, ktorý tu vidíte, je text zakódovaný ako bajty, nie spustiteľné inštrukcie. Oba zhodou okolností používajú nuly a jednotky, preto sa v hovorovej reči slovo „binárny" často spája s počítačmi.
Ako previesť binárny kód späť na text?
Prepnite na záložku Binárne → Text a vložte svoj binárny kód. Dekodér rozdelí vstup podľa oddeľovača (predvolene medzera) na bajty, prevedie každú skupinu zo sústavy 2 na jej desiatkový kódový bod a poskladá výsledok. Pri UTF-8 správne spája viacbajtové sekvencie naspäť do jedného znaku — takže slovenské č z dvoch bajtov dostanete späť ako jediné písmeno.
Všetka konverzia prebieha vo vašom prehliadači. Nič sa nenahráva online.

Tento nástroj prevádza text na binárny kód a binárny kód späť na text priamo v prehliadači, bez nahrávania na server. Podporuje kódovanie UTF-8 (potrebné pre slovenské diakritiky ako č, š, ž, ľ, ť, ď a samohlásky s dĺžňom) aj 7-bitové ASCII pre staršie protokoly. Môžete zvoliť 8 alebo 7 bitov na skupinu a oddeľovač — medzeru, pomlčku, zvislú čiaru alebo žiaden. Príklad: písmeno A je 01000001, slovenské č v UTF-8 je 11000100 10001101 (dva bajty). Hodí sa na cvičenia z informatiky na strednej škole, prípravu na maturitu, úvodné kurzy STU FIIT alebo UK FMFI, ladenie kódovania textu a pochopenie ako počítače reprezentujú reťazce.