29 дек 2014 29.12.2014

Камодзи, которые заменят ¯\_(ツ)_/¯ в 2015 году

Один диджитал-журналист решился предсказать, какими смайликами будут злоупотреблять в будущем году. В этому году был популярен ¯\_(ツ)_/¯.

1. ʕ • ᴥ • ʔ — это про оптимизм;

2. (◡ ‿ ◡ ✿) — про спокойствие и миролюбие;

3. (• _ •) (• _ •)> ⌐ ■ - ■ (⌐ ■ _ ■) — отсылка к Актёру Дэвиду Карузо (снимался в сериале «C.S.I.: Место преступления Майами» и носил очки) Примерно означает, что кто-то над чем-то собирается поработать;

4. ( ⧉ ⦣ ⧉ ) — твои глаза, когда ты в виртуальной реальности;

5. (⊙ω⊙) — отказ от восприятия информации;

6. [:||||||||||||:] — журналист предположил, что пригодится для новостей, которые требуют музыкального сопровождения в виде бояна;

7. ╮ (. ❛ ᴗ ❛.) ╭ — этот каомодзи, по его мнению, заменит сам ¯\_(ツ)_/¯.

Каомодзи - японские смайлики, которые записываются в двухбайтовых кодировках как минимум (символы кириллицы и латиницы требуют чаще однобайтовой кодировки).

8474 просмотров

8 комментариев

Написать комментарий...

Невинный файл

29.12.2014

Каомодзи - японские смайлики, которые записываются в двухбайтовых кодировках (символы кириллицы и латиницы требуют однобайтовой кодировки).

Зачем писать чушь, если не разбираетесь?

Ответить

Развернуть ветку

Занятый франт

29.12.2014

"в отличие от кириллицы и латиницы, которые чаще всего записываются в однобайтовых кодировках, японскому письму необходимы как минимум двухбайтовые кодировки, имеющие более широкий охват символов;" - там так написано!

Ответить

Развернуть ветку

Невинный файл

29.12.2014

Но вы же не так написали.

Ответить

Развернуть ветку

Занятый франт

29.12.2014

уточнила, спасибо

Ответить

Развернуть ветку

Невинный файл

29.12.2014

Если кому-то на самом деле интересно (зачем-то этот абзац же появился), то вот длинная история.

Давным давно у каждого языка была собственная однобайтовая кодировка. Более того, у каждой операционной системы для каждого языка эти кодировки были разные. Наверняка вы слышали о win-1251, KOI-8 и cp866 — это все только однобайтовая кириллица на разных платформах. Зачастую нигде рядом с файлом не хранилось, в какой он кодировке. Была полная вакханалия.

Потом появился Юникод. Юникод это не кодировка — это таблица символов. Огромная, на многие тысячи символов. Просто таблица, в которой записано, что символ номер такой-то — пробел, такой-то латинская буква, такой-то китайская. Говорить, что какой-то символ в Юникоде занимает столько-то байт некорректно. У символов только позиция. Основная часть кириллицы в нем занимает с 1024 по 1279 позиции.

А вот уже у Юникода есть разные способы кодирования его в байты. Самый распространенный при передачи по сети — UTF-8, в нем один символ занимает от одного байта до шести. В UTF-32 каждый символ всегда занимает 4 байта. В UTF-16 в основном 2, но есть нюансы.

Итого:
Вы либо действительно рассматриваете однобайтовые кодировки (но тогда никаких китайских символов), либо рассматриваете Юникод.

Утверждение «символы латиницы требуют чаще однобайтовой кодировки» в основном верно. Более точно: символы латиницы чаще всего требуют один байт для хранения в Юникоде.

Утверждение «символы кириллицы требуют чаще однобайтовой кодировки» не верно даже с учетом поправки выше. Их номера в таблице Юникода не позволяют хранить их в одном байте.

«Каомодзи — японские смайлики, которые записываются в двухбайтовых кодировках» — то же самое, что с латиницей. Чаще всего записываются двумя байтами в Юникоде.

Ответить

Развернуть ветку

Старинный якорь

29.12.2014

Пожалуй, добавлю в избранное

Ответить

Развернуть ветку

Организационный кавалер

29.12.2014

Комментарий недоступен

Ответить

Развернуть ветку

Средневековый турник

29.12.2014

Ответить

Развернуть ветку

Написать комментарий...

Читать все 8 комментариев