Один диджитал-журналист решился предсказать, какими смайликами будут злоупотреблять в будущем году. В этому году был популярен ¯\_(ツ)_/¯.
1. ʕ • ᴥ • ʔ — это про оптимизм;
2. (◡ ‿ ◡ ✿) — про спокойствие и миролюбие;
3. (• _ •) (• _ •)> ⌐ ■ - ■ (⌐ ■ _ ■) — отсылка к Актёру Дэвиду Карузо (снимался в сериале «C.S.I.: Место преступления Майами» и носил очки) Примерно означает, что кто-то над чем-то собирается поработать;
4. ( ⧉ ⦣ ⧉ ) — твои глаза, когда ты в виртуальной реальности;
5. (⊙ω⊙) — отказ от восприятия информации;
6. [:||||||||||||:] — журналист предположил, что пригодится для новостей, которые требуют музыкального сопровождения в виде бояна;
7. ╮ (. ❛ ᴗ ❛.) ╭ — этот каомодзи, по его мнению, заменит сам ¯\_(ツ)_/¯.
Каомодзи - японские смайлики, которые записываются в двухбайтовых кодировках как минимум (символы кириллицы и латиницы требуют чаще однобайтовой кодировки).
Зачем писать чушь, если не разбираетесь?
"в отличие от кириллицы и латиницы, которые чаще всего записываются в однобайтовых кодировках, японскому письму необходимы как минимум двухбайтовые кодировки, имеющие более широкий охват символов;" - там так написано!
Но вы же не так написали.
уточнила, спасибо
Если кому-то на самом деле интересно (зачем-то этот абзац же появился), то вот длинная история.
Давным давно у каждого языка была собственная однобайтовая кодировка. Более того, у каждой операционной системы для каждого языка эти кодировки были разные. Наверняка вы слышали о win-1251, KOI-8 и cp866 — это все только однобайтовая кириллица на разных платформах. Зачастую нигде рядом с файлом не хранилось, в какой он кодировке. Была полная вакханалия.
Потом появился Юникод. Юникод это не кодировка — это таблица символов. Огромная, на многие тысячи символов. Просто таблица, в которой записано, что символ номер такой-то — пробел, такой-то латинская буква, такой-то китайская. Говорить, что какой-то символ в Юникоде занимает столько-то байт некорректно. У символов только позиция. Основная часть кириллицы в нем занимает с 1024 по 1279 позиции.
А вот уже у Юникода есть разные способы кодирования его в байты. Самый распространенный при передачи по сети — UTF-8, в нем один символ занимает от одного байта до шести. В UTF-32 каждый символ всегда занимает 4 байта. В UTF-16 в основном 2, но есть нюансы.
Итого:
Вы либо действительно рассматриваете однобайтовые кодировки (но тогда никаких китайских символов), либо рассматриваете Юникод.
Утверждение «символы латиницы требуют чаще однобайтовой кодировки» в основном верно. Более точно: символы латиницы чаще всего требуют один байт для хранения в Юникоде.
Утверждение «символы кириллицы требуют чаще однобайтовой кодировки» не верно даже с учетом поправки выше. Их номера в таблице Юникода не позволяют хранить их в одном байте.
«Каомодзи — японские смайлики, которые записываются в двухбайтовых кодировках» — то же самое, что с латиницей. Чаще всего записываются двумя байтами в Юникоде.
Пожалуй, добавлю в избранное
Комментарий недоступен