utf8_encode
utf8_encode
(PHP 3>= 3.0.6, PHP 4)
utf8_encode - кодирует строку ISO-8859-1 в UTF-8.
Описание
string utf8_encode (string data)
Эта функция кодирует строку data в UTF-8 и возвращает кодированную версию. UTF-8 это стандартный механизм Unicode для кодирования wide character-значений в байтовый поток. UTF-8 прозрачна для обычных ASCII-символов, самосинхронизируется (т.е. программа может указать, где начинаются символы байтового потока) и может использоваться с функциями сравнения нормальных строк для сортировки их как таковых. PHP кодирует UTF-8 символы в блоки до 4 байтов, как здесь:
Таблица 1. Кодирование UTF-8
байтов | битов | представление |
---|---|---|
1 | 7 | 0bbbbbbb |
2 | 11 | 110bbbbb 10bbbbbb |
3 | 16 | 1110bbbb 10bbbbbb 10bbbbbb |
4 | 21 | 11110bbb 10bbbbbb 10bbbbbb 10bbbbbb |
Каждый b представляет бит, который может использоваться для хранения данных символа.