Codificação Unicode: norma de codificação de caracteres

Data:

2019-02-13 01:00:18

Pontos de vista:

433

Classificação:

1Como 0Não gostam

Compartilhar:

Table of contents:

Cada usuário da Internet, na tentativa de configurar uma determinada sua função é, pelo menos, um dia, vi no visor escrita de latim a palavra "Unicode". O que é isso, você vai descobrir ao ler este artigo.

unicode que é

Definição

Codificação Unicode" — o padrão de codificação de caracteres. Ele foi oferecido uma organização sem fins lucrativos Unicode, Inc. no ano de 1991. O padrão foi concebido com o objetivo de reunir o maior número possível de diferentes tipos de caracteres em um único documento. A página, que foi criada com base nele, pode conter letras e caracteres de diferentes idiomas (do russo ao coreano) e a matemática. Quando o fizer, todos os caracteres de uma determinada codificação são exibidos sem problemas.

As Razões para a criação

Uma vez, bem antes do aparecimento de um sistema de "Unicode", a codificação a. com base nas preferências do autor do documento. Por esta razão, muitas vezes, para ler um documento, você deve usar tabelas diferentes. Às vezes, isso tive que fazer várias vezes, que, essencialmente, complicava a vida de um usuário normal. Como já foi dito, a solução para o problema, em 1991, foi proposta uma organização sem fins lucrativos Unicode, Inc., предложившей novo tipo de codificação de caracteres. Ele foi chamado para combinar moralmente obsoletos e uma variedade de padrões. "Unicode" - conjunto de caracteres que озволила alcançar o inimaginável naquele momento: criar uma ferramenta que suporta uma enorme quantidade de caracteres. O resultado superou muitas expectativas – surgiram documentos, simultaneamente contenham como o inglês e o texto em português, latim e matemática.

Mais:

Como instalar a transferência de palavras no Word

Como instalar a transferência de palavras no Word

Trocar palavras é uma das mais importantes funções de um editor de texto. Através dela pode-se alcançar a dois muito interessantes durante a formatação. Em primeiro lugar, o texto resultante, ocupam menos espaço, assim como sua colocação será mais co...

Обрезаем foto no MS Paint

Обрезаем foto no MS Paint

Atencioso usuário de computador certamente chamou a atenção, que você arquivo de imagem, existem diferentes extensões: BMP, GIF, JPG e пр. a Maior distribuição recebeu o último formato especificado, assim como a maioria das câmeras digitais criam ima...

Como flashear

Como flashear "Bios" no PC

Considerando a questão de como flashear "Bios", a necessidade de delimitar este conceito relativamente isolados componentes, aos quais se aplica a esta operação. "Bios" - serviço privado de firmware do sistema, responsável pelo correcto funcionamento...

Mas a criação de um sistema unificado de codificação precedeu a necessidade de resolver um conjunto de problemas, que surgiram devido à enorme variedade de padrões, já existentes no momento. Os mais comuns são:

  • Elfos letras, ou ")ç
  • As limitações do conjunto de caracteres;
  • O problema de conversão de conjuntos de caracteres;
  • Duplicação de fontes.

unicode padrão

Um Pequeno histórica

Imagine que está no pátio de 80 е. a Informática ainda não é tão comum e tem uma vista diferente do de hoje. Enquanto cada sistema OPERACIONAL é único e alterada a cada um entusiasta para atender a necessidades específicas. A necessidade de troca de informações se transforma em um adicional de re-desenvolvimento do que tudo. A tentativa de ler o documento, criado sob outro sistema OPERACIONAL, muitas vezes exibe um estranho conjunto de caracteres, e começa o jogo com a codificação. Nem sempre consigo fazer isso rápido, e às vezes é necessário um documento é possível abrir daqui a seis meses, ou mesmo mais tarde. As pessoas, que muitas vezes se comunicam, criam para si mesmos a tabela de conversão. E aqui está um trabalho sobre eles revela um interessante detalhe: para criá-los você precisa de duas maneiras: “a minha na tua» e de volta. Fazer banais inversão de computação de uma máquina não pode, para ela, na coluna da direita do código fonte, e na esquerda - o resultado, mas não vice-versa. Se surgiu a necessidade de utilizar quaisquer caracteres especiais no documento, a sua necessidade era o primeiro a adicionar, e depois outro e explicar o parceiro, o que ele precisa fazer, para que estes caracteres não se transformou em ")". E não vamos esquecer que cada codificação teve de desenvolver ou introduzir próprias fontes, o que levou à criação de uma enorme quantidade de takes para o sistema OPERACIONAL.

Imagine ainda, que a página fontes, você verá 10 peças idênticas Times New Roman, com pequenas notas: para UTF-8, UTF-16, ANSI, UCS-2. Agora você entende que o desenvolvimento de um padrão universal foi uma necessidade premente?

o conjunto de caracteres Unicode

“os Pais-os criadores»

As Origens da criação de Unicode que você deve procurar em 1987, quando Joe Becker Xerox, juntamente com Lee Collins e Mark Davies da empresa, a Apple começou a pesquisas no campo da prática da criação universal, o conjunto de caracteres. Em agosto de 1988, Jo Becker publicou um projeto de sugestões para a criação de 16 bits internacional multilingue do sistema de codificação.

Depois de alguns meses de trabalho o grupo de trabalho Unicode foi ampliado para incluir Ken Whistler e Mike Кернегана dos RLG, Glenn Wright da Sun Microsystems e de vários outros profissionais, o que permitiu concluir o trabalho, mediante a formação de um único padrão de codificação.

codificação unicode

Descrição Geral

A base Unicode se encontra o conceito de símbolo. Sob esta definição é entendida abstrata de fenômeno existente em uma determinada forma de escrita e exequíveis através графемы (suas "retratos"). Cada caractere é definido em "Unicode" código único, pertencente a um determinado bloco padrão. Por exemplo, графема B e em inglês, em russo alfabetos, mas em Unicode, ela corresponde a um 2 diferentes caracteres. A eles se aplica a conversão na letra, т. е. cada um deles descreve uma chave de banco de dados, um conjunto de propriedades e nome completo.

Vantagens Unicode

A partir De outros contemporâneos codificação Unicode" era uma grande loja de caracteres para ão de criptografia» caracteres. O fato é que seus antecessores tiveram de 8 bits, ou seja, mantiveram a 28 de caracteres, e aqui está um novo desenvolvimento, teve já 216 caracteres, que se tornou um gigantesco passo em frente. Isto permitiu que a de codificar em quase todos os existentes e comuns alfabetos.

Com o advento"Unicode" não é mais preciso usar a tabela de conversão: como padrão único, ele simplesmente tirou a sua necessidade. Exatamente o mesmo caído no Esquecimento e ")» - é um padrão único fez impossíveis, assim como descarta a necessidade de criação de takes de fontes.

O Desenvolvimento de Unicode

Claro, o progresso não está no lugar, e desde a primeira apresentação, passaram-se 25 anos. No entanto, a codificação de "Unicode" teimosamente mantém sua posição no mundo. Em grande parte isso se tornou possível graças ao fato de que ele se tornou fácil внедряемым e foi distribuído, sendo reconhecido aos desenvolvedores de software proprietário (pago) e DE código aberto.

o conjunto de caracteres unicode (padrão de codificação de caracteres)

Não vale a pena acreditar, que hoje nos está disponível a mesma codificação Unicode", que um quarto de século atrás. No momento, a versão ajustada para 5.x.x, e o número de caracteres a serem codificados subiu para 231. Da capacidade de usar mais o estoque de caracteres abandonado, para ainda manter o apoio para Unicode de 16 (codificação, onde o máximo do seu número limitou o número 216). Desde o seu surgimento e a versão 2.0.0 "Unicode-padrão" aumentou o número de caracteres, que no elenco, quase 2 vezes. O aumento de opções e continuou nos anos seguintes. A versão 4.0.0 já apareceu a necessidade de aumentar a norma em si, o que foi feito. Como resultado, o "Unicode" achou-se a forma em que a conhecemos hoje.

unicode que é

O Que mais há no Unicode?

Além de enorme, constantemente пополняющегося número de caracteres, o "Unicode"-codificação de informações de texto tem uma outra úteis invertida. Trata-se do chamado de normalização. Ao invés de percorrer todo o documento caractere por caractere e substitua os ícones correspondentes da tabela de correspondência, utilize um dos algoritmos existentes de normalização. Do que se trata?

Ao Invés de gastar os recursos de uma máquina de computação para monitorar regularmente o mesmo símbolo, que pode ser semelhante em diferentes alfabetos, é usado um algoritmo especial. Ele permite suportar os símbolos relacionados separada графой tabela de pesquisa e aceder a eles, mas, vez por vez, a verificação de volta todos os dados.

Tais algoritmos foi desenvolvido e implementado quatro. Em cada um deles, a conversão ocorre de estritamente um certo princípio, отличающемуся dos outros, por isso chamado de qualquer um deles o mais eficaz não é possível. Cada desenvolvido para determinadas necessidades, foi incorporado e utilizado com sucesso.

unicode codificação de informação de texto

Distribuição padrão

Em 25 anos de sua história, a codificação de "Unicode" foi, provavelmente, a maior distribuição no mundo. Sob este padrão são ajustados para programas e páginas web. Sobre a latitude de aplicação pode falar o fato de que Unicode usam hoje mais de 60 % dos recursos da internet.

Agora, você já sabe, quando apareceu o padrão "Unicode". O que é, você também sabe e vai ser capaz de avaliar a importância da invenção, feita por um grupo de profissionais de Unicode, Inc. há mais de 25 anos.


Article in other languages:

AR: https://www.tostpost.com/ar/computers/17049-the-unicode-standard-character-encoding.html

BE: https://www.tostpost.com/be/kamputary/28705-kado-ka-yun-kod-standart-kadavannya-s-mvala.html

DE: https://www.tostpost.com/de/computer/28722-codierung-unicode-standard-zeichenkodierung-aus.html

ES: https://www.tostpost.com/es/los-ordenadores/28751-la-codificaci-n-unicode-la-norma-de-codificaci-n-de-caracteres.html

HI: https://www.tostpost.com/hi/computers/16107-the-unicode-standard-character-encoding.html

JA: https://www.tostpost.com/ja/computers/17630-unicode.html

KK: https://www.tostpost.com/kk/komp-yuterler/28677-kodirovka-yunikod-standart-kodtau-r-m-zder.html

PL: https://www.tostpost.com/pl/komputery/28515-kodowanie-unicode-standard-kodowania-znak-w.html

TR: https://www.tostpost.com/tr/bilgisayarlar/31449-kodlama-unicode-karakter-kodlama-standard.html

UK: https://www.tostpost.com/uk/komp-yuteri/28643-koduvannya-yun-kod-standart-koduvannya-simvol-v.html

ZH: https://www.tostpost.com/zh/computers/16121-unicode.html






Alin Trodden - autor do artigo, editor
"Olá, sou o Alin Trodden. Escrevo textos, leio livros e procuro impressões. E eu não sou ruim em falar sobre isso. Estou sempre feliz em participar de projetos interessantes."

Comentários (0)

Este artigo possui nenhum comentário, seja o primeiro!

Adicionar comentário

Notícias Relacionadas

Comparação de browsers: qual é o melhor

Comparação de browsers: qual é o melhor

Na era da internet, o navegador é a coisa mais importante, instalado no computador. É por isso que vale a pena prestar especial atenção a este componente do sistema. Se o navegador é bom, navegação na internet é simples e agradáve...

O Viber ou WhatsApp: o que é melhor?

O Viber ou WhatsApp: o que é melhor?

Existentes hoje em dia, mensageiros instantâneos quase totalmente enviamos no esquecimento envio ordinárias SMS-mensagens em um ambiente de dispositivos móveis. Estes programas têm feito SMS desconfortável e totalmente viável. Nes...

Passo A Passo

Passo A Passo "Metro-2". Descrição do jogo

“Metro-2: a Morte do caciqueç – a tão esperada continuação do projeto de desenvolvedores russos, que foi lançado bem antes do mundialmente famoso Metro 2033. Este jogo foi lançado em 2006, e que o criador tornou...

Quanto de memória ram você precisa para o funcionamento normal do computador?

Quanto de memória ram você precisa para o funcionamento normal do computador?

memória Ram, que é conhecido como a memória RAM, ou memória RAM, é uma das partes mais importantes de qualquer computador. Mas quanto a sua necessidade para o bom funcionamento do aparelho? Atuais para o novo PC e similares девайс...

A recuperação depois de formatar o pendrive: instrução

A recuperação depois de formatar o pendrive: instrução

infelizmente, A perda de dados contidos em dispositivos amovíveis como normais flash ou cartão de memória, é uma das mais comuns fenômenos. E nem sempre isso tem a ver com física quebras ou falhas de software. Uma formatação rápid...

Como remover interface em

Como remover interface em "CC:" com a ajuda de um console de comando?

um jogo "Counter-Strike: GO" é um dos mais populares atiradores, que é jogado por milhares de usuários. Aqui a enorme quantidade de console de comandos, que permitem personalizar a interface do usuário de qualquer coisa. Mas o que...