Padrões de codificação de caracteres
Uma
codificação de caracteres é um padrão de relacionamento entre um conjunto de
carateres com um conjunto de outra coisa, como por exemplo números ou pulsos
elétricos com o objetivo de facilitar o armazenamento de texto em computadores
e a sua transmissão através de redes de telecomunicação.
Exemplos
comuns, ou seja, algumas das formas de representação são:
- ASCII;
- Unicode
(É um padrão que permite aos computadores representar e manipular, de forma
consistente, texto de qualquer sistema de escrita existente);
- EBCDIC
(Utilizado em servidores IBM antigos, é completamente diferente do ASCII);
- IBM PC
Extended Character (Caracteres representados por binários desde 128 até 255 (0…
127: ASCII). Representações de dígitos da representação Unicode);
- ISO Latin
and ANSI (Partilham os primeiros 255 caracteres. A partir deste número os
formatos diferem do Unicode).
Código ASCII
A memória do computador conserva todos os
dados sob a forma numérica. Não existe um método para armazenar directamente os
caracteres. Cada caracter possui por conseguinte o seu equivalente em código
numérico: é o código ASCII (American Standard Code for Information Interchange
- traduz-se por "Código Americano Standard para a Troca de
Informações"). O código ASCII básico representava os caracteres em 7 bits
(quer dizer 128 caracteres possíveis, de 0 a 127).
Código UNICODE
Unicode é um padrão que permite aos
computadores representar e manipular, de forma consistente, texto de qualquer
sistema de escrita existente. Publicado no livro The Unicode Standard, o padrão
consiste de pouco mais de 107 mil caracteres, um conjunto de diagramas de
códigos para referência visual, uma metodologia para codificação e um conjunto
de codificações padrões de caracteres, uma enumeração de propriedades de
caracteres como caixa alta e caixa baixa, um conjunto de arquivos de computador
com dados de referência, além de regras para normalização, decomposição e
ordenação alfabética.
Bárbara & Júlio
Webgrafia:
Sem comentários:
Enviar um comentário