Desvendando os Emojis

Nas últimas semanas, eu estive implementando suporte a emoji para um dos meus sites. Eu achei que seria divertido compartilhar alguns detalhes de como essa “maior inovação na comunicação humana desde a invenção da letra 🅰️” funciona na intimidde.

AVISO: Alguns emoji podem não ser exibidos como esperado no seu dispositivo.

Introdução ao Unicode

Como você talvez possa saber, qualquer texto dentro dos computadores é codificado com números. Um número para cada letra. A codificação mais popular que usamos é chamada Unicode, com as duas variações mais populares chamadas UTF-8 e UTF-16.

Unicode aloca 2²¹ (~ 2 milhões) caracteres, chamados de codepoints (para o desprazer dos programadores, admito que 21 não é um múltiplo de 8 🤷). Dentro desses 2 milhões, 150 mil caracteres, estão definidos.

150k caracteres definidos cobrem todos os alfabetos usados ​​na 🌍, muitos idiomas mortos, muitas coisas estranhas como 𝔣𝔲𝔫𝔫𝔶 𝕝𝕖𝕥𝕥𝕖𝕣𝕤, sɹǝʇʇǝl uʍop-ǝpᴉsdn, GHz como um glifo: ㎓, “direita, seta de duas cabeças com cauda”: ⤘, monstro de sete olhos: ꙮ, e um pato.

*Como curiosidade, veja abaixo o bloco de hieróglifos egípcios (U + 13000-U + 1342F). Eles têm algumas coisas realmente estranhas.

Voltando ao Emoji. No seu aspecto mais simples, eles são apenas isso: um símbolo em uma tabela Unicode. A maioria deles é agrupada entre U + 1F300-1F6FF e U + 1F900-1FAFF.

É :por isso que o Emoji se comporta como qualquer outra letra: ele pode ser digitado em um campo de texto, copiado, colado, renderizado em um documento de texto simples, incorporado em um tweet, etc. Quando você digita “A”, o computador vê U + 0041. Quando você digita “🌵”, o computador vê U + 1F335. Pouca diferença.

Modificadores de tom de pele

A maioria dos emoji humanos retratam uma pessoa amarela abstrata. Quando o tom da pele foi adicionado em 2015, em vez de adicionar um novo código para cada combinação de emoji + tons de pele, apenas cinco novos codepoints foram adicionados: 🏻🏼🏽🏾🏿 U + 1F3FB..U + 1F3FF. Esses codepoints não foram projetados para ser usados isoladamente, mas para ser anexados a um emoji existente. Juntos, eles formam uma ligadura: 👋 (U + 1F44b sinal de mão acenando) seguido diretamente por 🏽 (modificador de tom de pele médio U + 1F3FD) torna-se 👋🏽. 👋🏽 não tem seu próprio codepoint (é uma sequência de dois: U + 1F44B U + 1F3FD), mas tem sua própria aparência única. Com apenas cinco modificadores, ~ 280 emojis humanos se transformam em 1680 variações. Aqui estão alguns dançarinos:

🕺🕺🏻🕺🏼🕺🏽🕺🏾🕺🏿

Espero que a compreensão mais profunda de como o emoji funciona seja útil para ajudá-lo(a)s em seu trabalho … Nah, brincadeirinha. Mas espero que tenham gostado. 🙂

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google

Você está comentando utilizando sua conta Google. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s