Офтоп
Ольга Ефимова

Камодзи, которые заменят ¯\_(ツ)_/¯ в 2015 году

Один диджитал-журналист решился предсказать, какими смайликами будут злоупотреблять в будущем году. В этому году был популярен ¯\_(ツ)_/¯.

1. ʕ • ᴥ • ʔ — это про оптимизм;

2. (◡ ‿ ◡ ✿) — про спокойствие и миролюбие;

3. (• _ •) (• _ •)> ⌐ ■ - ■ (⌐ ■ _ ■) — отсылка к Актёру Дэвиду Карузо (снимался в сериале «C.S.I.: Место преступления Майами» и носил очки) Примерно означает, что кто-то над чем-то собирается поработать;

4. ( ⧉ ⦣ ⧉ ) — твои глаза, когда ты в виртуальной реальности;

5. (⊙ω⊙) — отказ от восприятия информации;

6. [:||||||||||||:] — журналист предположил, что пригодится для новостей, которые требуют музыкального сопровождения в виде бояна;

7. ╮ (. ❛ ᴗ ❛.) ╭ — этот каомодзи, по его мнению, заменит сам ¯\_(ツ)_/¯.

Каомодзи - японские смайлики, которые записываются в двухбайтовых кодировках как минимум (символы кириллицы и латиницы требуют чаще однобайтовой кодировки).

0
8 комментариев
Написать комментарий...
Невинный файл
Каомодзи - японские смайлики, которые записываются в двухбайтовых кодировках (символы кириллицы и латиницы требуют однобайтовой кодировки).

Зачем писать чушь, если не разбираетесь?

Ответить
Развернуть ветку
Занятый франт

"в отличие от кириллицы и латиницы, которые чаще всего записываются в однобайтовых кодировках, японскому письму необходимы как минимум двухбайтовые кодировки, имеющие более широкий охват символов;" - там так написано!

Ответить
Развернуть ветку
Невинный файл

Но вы же не так написали.

Ответить
Развернуть ветку
Занятый франт

уточнила, спасибо

Ответить
Развернуть ветку
Невинный файл

Если кому-то на самом деле интересно (зачем-то этот абзац же появился), то вот длинная история.

Давным давно у каждого языка была собственная однобайтовая кодировка. Более того, у каждой операционной системы для каждого языка эти кодировки были разные. Наверняка вы слышали о win-1251, KOI-8 и cp866 — это все только однобайтовая кириллица на разных платформах. Зачастую нигде рядом с файлом не хранилось, в какой он кодировке. Была полная вакханалия.

Потом появился Юникод. Юникод это не кодировка — это таблица символов. Огромная, на многие тысячи символов. Просто таблица, в которой записано, что символ номер такой-то — пробел, такой-то латинская буква, такой-то китайская. Говорить, что какой-то символ в Юникоде занимает столько-то байт некорректно. У символов только позиция. Основная часть кириллицы в нем занимает с 1024 по 1279 позиции.

А вот уже у Юникода есть разные способы кодирования его в байты. Самый распространенный при передачи по сети — UTF-8, в нем один символ занимает от одного байта до шести. В UTF-32 каждый символ всегда занимает 4 байта. В UTF-16 в основном 2, но есть нюансы.

Итого:
Вы либо действительно рассматриваете однобайтовые кодировки (но тогда никаких китайских символов), либо рассматриваете Юникод.

Утверждение «символы латиницы требуют чаще однобайтовой кодировки» в основном верно. Более точно: символы латиницы чаще всего требуют один байт для хранения в Юникоде.

Утверждение «символы кириллицы требуют чаще однобайтовой кодировки» не верно даже с учетом поправки выше. Их номера в таблице Юникода не позволяют хранить их в одном байте.

«Каомодзи — японские смайлики, которые записываются в двухбайтовых кодировках» — то же самое, что с латиницей. Чаще всего записываются двумя байтами в Юникоде.

Ответить
Развернуть ветку
Старинный якорь

Пожалуй, добавлю в избранное

Ответить
Развернуть ветку
Организационный кавалер

Комментарий недоступен

Ответить
Развернуть ветку
Средневековый турник
Ответить
Развернуть ветку
Читать все 8 комментариев
null