Unicode використовує два варіанти кодування: 8-бітний та 16-бітний. За замовчуванням використовується 16-бітове кодування, тобто кожен символ займає 16 біт (два байти); зазвичай його записують як U+hhhh, де hhhh – шістнадцятковий код символу.

Unicode Transformation Format, 8-bit – «формат перетворення Юнікода, 8-біт») — поширений стандарт кодування символів, що дозволяє компактніше зберігати і передавати символи Юнікода, використовуючи змінну кількість байт (від 1 до 4), що забезпечує повну зворотну сумісність з 7-бітним кодуванням ASCII.

В таблиці Unicode використовується 2 байти, тому можна сказати, що 1 символ у комп'ютері займає 1 або 2 байти.

Для подання символ використовується суворо 4 байта, якими можна уявити абсолютно будь-який юнікодний символ.