Por causa de um problema técnico relativo à transmissão dos caracteres especiais de várias línguas. Chama-se conjunto de caracteres uma representação digital de texto. O conjunto de representação amplamente utilizado é o ASCII. O ASCII padrão tem 7 bits, porém são usadas versões particulares desse padrão - o ASCII americano, ASCII português, etc., que utilizam 8 bits. Se geramos um texto em ASCII de 8 bits e, na transmissão, esse texto é tratado por um sistema que “compreende” apenas o ASCII de 7 bits, os caracteres especiais serão transformados em caracteres diferentes, pela perda do oitavo bit. Os usuários da Internet já devem ter sofrido experiência semelhante com mensagens de e-mail, que chegam com caracteres estranhos, ou páginas da Web com textos em japonês ou russo.