W3docs

ASCII

ASCII é o primeiro esquema de codificação de caracteres usado entre computadores na Internet. Veja a tabela completa de caracteres e códigos de entidade HTML.

ASCII, a sigla para "American Standard Code for Information Interchange," é o primeiro esquema de codificação de caracteres usado entre computadores na Internet. Esta página é uma referência: ela lista todos os caracteres ASCII juntamente com a referência numérica de caractere HTML (por exemplo A para A) que você pode usar para inseri-los.

Os esquemas modernos de codificação de caracteres, como UTF-8 e ISO-8859, são retrocompatíveis com ASCII.

Quando Você Realmente Precisa de Códigos ASCII?

No HTML moderno, você declara a codificação uma vez com <meta charset="UTF-8"> no <head>. Com UTF-8 ativo, você pode digitar letras, dígitos, pontuação e até caracteres acentuados ou não latinos diretamente no seu arquivo-fonte — não é necessário substituir A por &#65;. As referências numéricas ASCII são úteis principalmente em três situações:

  • Caracteres de marcação reservados. <, >, & e " têm significado especial em HTML. Para exibi-los como texto literal, você deve escapá-los, por exemplo &#60; (ou a entidade nomeada &lt;) para <.
  • Caracteres invisíveis ou ambíguos. Um espaço não quebrável (&#160; / &nbsp;) ou outro espaço em branco que não se distingue visualmente no código-fonte.
  • Ferramentas que não emitem UTF-8. Sistemas ou geradores mais antigos que produzem apenas ASCII de 7 bits.

Existem duas formas equivalentes de escrever qualquer ponto de código como entidade:

  • Decimal: &#38; (o número é o valor ASCII/Unicode do caractere).
  • Hexadecimal: &#x26; (mesmo caractere, valor escrito em base 16, com o prefixo x).

Para os poucos caracteres reservados, entidades nomeadas como &lt;, &gt;, &amp; e &quot; são geralmente preferidas por serem mais legíveis. Veja Entidades HTML para a referência completa de entidades nomeadas, e Codificação UTF-8 para caracteres além do intervalo de 128 caracteres ASCII.

O Conjunto de Caracteres ASCII

O conjunto de caracteres ASCII foi criado na década de 1960 como um padrão para computadores e dispositivos de hardware, como impressoras e leitores de fita magnética.

Originalmente, o ASCII foi baseado no alfabeto inglês. É um conjunto de caracteres de 7 bits contendo 128 caracteres: os números 0–9, letras maiúsculas e minúsculas A–Z do inglês, símbolos básicos de pontuação e caracteres especiais.

A maioria dos conjuntos de caracteres usados em computadores modernos, HTML e na Internet é retrocompatível com ASCII.

Abaixo está uma tabela com os 128 caracteres ASCII e seus códigos de entidade HTML equivalentes.

Caracteres Imprimíveis ASCII

Caractere ASCIICódigo de Entidade HTMLDescrição
espaço
!!ponto de exclamação
""aspas
##símbolo de número
$$cifrão
%%símbolo de percentagem
&&e comercial
''apóstrofo
((parêntese esquerdo
))parêntese direito
**asterisco
++sinal de mais
,,vírgula
--hífen
..ponto final
//barra
00dígito 0
11dígito 1
22dígito 2
33dígito 3
44dígito 4
55dígito 5
66dígito 6
77dígito 7
88dígito 8
99dígito 9
::dois-pontos
;;ponto e vírgula
<<menor que
==igual a
>>maior que
??ponto de interrogação
@@arroba
AAA maiúsculo
BBB maiúsculo
CCC maiúsculo
DDD maiúsculo
EEE maiúsculo
FFF maiúsculo
GGG maiúsculo
HHH maiúsculo
III maiúsculo
JJJ maiúsculo
KKK maiúsculo
LLL maiúsculo
MMM maiúsculo
NNN maiúsculo
OOO maiúsculo
PPP maiúsculo
QQQ maiúsculo
RRR maiúsculo
SSS maiúsculo
TTT maiúsculo
UUU maiúsculo
VVV maiúsculo
WWW maiúsculo
XXX maiúsculo
YYY maiúsculo
ZZZ maiúsculo
[[colchete esquerdo
\\barra invertida
]]colchete direito
^^circunflexo
__sublinhado
``acento grave
aaa minúsculo
bbb minúsculo
ccc minúsculo
ddd minúsculo
eee minúsculo
fff minúsculo
ggg minúsculo
hhh minúsculo
iii minúsculo
jjj minúsculo
kkk minúsculo
lll minúsculo
mmm minúsculo
nnn minúsculo
ooo minúsculo
ppp minúsculo
qqq minúsculo
rrr minúsculo
sss minúsculo
ttt minúsculo
uuu minúsculo
vvv minúsculo
www minúsculo
xxx minúsculo
yyy minúsculo
zzz minúsculo
{{chave esquerda
||barra vertical
}}chave direita
~~til

Caracteres de Controle de Dispositivo ASCII

Os caracteres de controle de dispositivo ASCII (exceto tabulação horizontal, avanço de linha e retorno de carro) raramente são usados em documentos HTML. Originalmente, os caracteres de controle ASCII (intervalo 0–31, mais 127) foram criados para controlar dispositivos de hardware.

Nota: Escreva esses códigos sem zeros à esquerda — as referências decimais vão de &#0; a &#9;, não &#00;/&#09;. A forma hexadecimal equivalente (por exemplo &#x09; para uma tabulação) pode ter zero como prefixo, mas a forma decimal não deve ter. Esses caracteres de controle são não imprimíveis: a maioria deles não produz saída visível em um navegador, portanto são listados aqui para fins de referência, não para uso cotidiano.

Caractere ASCIICódigo de Entidade HTMLDescrição
NULcaractere nulo
SOHinício de cabeçalho
STXinício de texto
ETXfim de texto
EOTfim de transmissão
ENQconsulta
ACKreconhecimento
BELsino (campainha)
BSretrocesso
HT tabulação horizontal
LF avanço de linha
VTtabulação vertical
FF avanço de formulário
CR retorno de carro
SOdeslocamento para fora
SIdeslocamento para dentro
DLEescape de link de dados
DC1controle de dispositivo 1
DC2controle de dispositivo 2
DC3controle de dispositivo 3
DC4controle de dispositivo 4
NAKreconhecimento negativo
SYNsincronização
ETBfim de bloco de transmissão
CANcancelar
EMfim de meio
SUBsubstituto
ESCescape
FSseparador de arquivo
GSseparador de grupo
RSseparador de registro
USseparador de unidade
DELexcluir (apagar)

DEL (código 127) também é um caractere de controle não imprimível — era historicamente usado para apagar um caractere em fita perfurada, não para exibir nada.

Exemplo de Uso Prático

Os casos em que as referências realmente se tornam úteis são os caracteres de marcação reservados. Abaixo, &#34; permite inserir aspas literais dentro de um valor de atributo entre aspas duplas, e &#60;/&#62; exibem colchetes angulares literais no conteúdo sem que o navegador os interprete como uma tag:

<!-- &#34; (a quote) inside a double-quoted attribute -->
<a href="#" title="The &#34;best&#34; link">Hover me</a>

<!-- &#60; and &#62; render as < and > instead of starting a tag -->
<p>Use the &#60;p&#62; element for paragraphs.</p>

<!-- &#38; (an ampersand) shown as literal text -->
<p>Fish &#38; Chips</p>

Os mesmos três caracteres têm equivalentes nomeados — &quot;, &lt;, &gt; e &amp; — que a maioria dos autores prefere pela melhor legibilidade:

<a href="#" title="The &quot;best&quot; link">Hover me</a>
<p>Use the &lt;p&gt; element for paragraphs.</p>
<p>Fish &amp; Chips</p>

Prática

Prática
Em um documento HTML com UTF-8, qual caractere mais frequentemente ainda precisa de uma referência de entidade como < ou <?
Em um documento HTML com UTF-8, qual caractere mais frequentemente ainda precisa de uma referência de entidade como < ou <?
Was this page helpful?