Padrões de codificação de caracteres
Olá! No post de hoje vamos falar sobre padrões de codificação de caracteres e no que consiste a tabela ASCII e a de código UNICODE.
---
A codificação de caracteres é um padrão de relacionamento entre um conjunto de caracteres (como letras do alfabeto ou código Morse) e um conjunto de qualquer outra coisa, no caso de um computador relacionam-se com um conjunto de números binários.
O conjunto de caracteres e a codificação de caracteres eram considerados sinónimos, já que o mesmo nome poderia especificar tanto quais caracteres estão disponíveis e como eles foram codificados num fluxo de unidades de código (normalmente com um único caracter por unidade de código). No entanto, o Unicode afastou essa ideia, separando a ideia de numerar uma série de caracteres de codificar esses caracteres num fluxo de unidades de código. Para manter as nomenclaturas históricas e os sistemas baseados nelas, usa-se o termo charset para se referir a uma codificação de caracteres.
---
Código UNICODE
UNICODE é um padrão que permite aos computadores representar e manipular, de forma consistente, texto de qualquer sistema de escrita existente. Este padrão consiste em mais de 107 mil caracteres, um conjunto de diagramas de códigos para referência visual, entre outras coisas. Este padrão de codificação consegue codificar praticamente todos alfabetos, ao contrário do ASCII que apenas padronizava um. Em seguida vamos dar um exemplo de uma tabela de código UNICODE.
---
A codificação de caracteres é um padrão de relacionamento entre um conjunto de caracteres (como letras do alfabeto ou código Morse) e um conjunto de qualquer outra coisa, no caso de um computador relacionam-se com um conjunto de números binários.
O conjunto de caracteres e a codificação de caracteres eram considerados sinónimos, já que o mesmo nome poderia especificar tanto quais caracteres estão disponíveis e como eles foram codificados num fluxo de unidades de código (normalmente com um único caracter por unidade de código). No entanto, o Unicode afastou essa ideia, separando a ideia de numerar uma série de caracteres de codificar esses caracteres num fluxo de unidades de código. Para manter as nomenclaturas históricas e os sistemas baseados nelas, usa-se o termo charset para se referir a uma codificação de caracteres.
---
Código ASCII
ASCII que é um código de padrão Americano para o intercâmbio de informação, tratando-se de um código binário que codifica um conjunto de 128 sinais: 96 sinais gráficos (como letras do alfabeto, sinais matemáticos etc) e 32 sinais de controlo. Podem ter acesso a um exemplo de tabela de código ASCII analisando a imagem acima.
---
Código UNICODE
UNICODE é um padrão que permite aos computadores representar e manipular, de forma consistente, texto de qualquer sistema de escrita existente. Este padrão consiste em mais de 107 mil caracteres, um conjunto de diagramas de códigos para referência visual, entre outras coisas. Este padrão de codificação consegue codificar praticamente todos alfabetos, ao contrário do ASCII que apenas padronizava um. Em seguida vamos dar um exemplo de uma tabela de código UNICODE.
Comentários
Enviar um comentário