Unicode використовує два варіанти кодування: 8-бітний та 16-бітний. За замовчуванням використовується 16-бітове кодування, тобто кожен символ займає 16 біт (два байти); зазвичай його записують як U+hhhh, де hhhh – шістнадцятковий код символу.

Unicode Transformation Format, 8-bit – «формат перетворення Юнікода, 8-біт») — поширений стандарт кодування символів, що дозволяє компактніше зберігати і передавати символи Юнікода, використовуючи змінну кількість байт (від 1 до 4), що забезпечує повну зворотну сумісність з 7-бітним кодуванням ASCII.

Останніми роками стала вельми поширеною новий міжнародний стандарт кодування текстових символів Unicode, який відводить на кожен символ 2 байти (16 бітів).

В таблиці Unicode використовується 2 байти, тому можна сказати, що 1 символ у комп'ютері займає 1 або 2 байти.