Computer non capisco nativamente testo e simboli. Invece, usano un linguaggio di codifica conosciuto come Unicode per tradurre numeri e lettere ai loro simboli, conosciuti come un set di caratteri e testo appropriato. I tipi più comuni di Unicode UTF-8, UTF-16, ISO-8859-1 e ASCII. C'è un identificatore univoco per ogni lettera testuale e simbolo in Unicode, che rimane costante attraverso diversi sistemi operativi e linguaggi di programmazione. Maggior parte dei linguaggi di programmazione hanno funzioni incorporate per tradurre tra diversi Unicode standard.
Istruzioni
1
Tradurre il set di caratteri in PHP. Digitare "utf8_decode($data)", dove "$data" indica il codice UTF-8. Output è il risultante set di caratteri ISO-8859-1.
2
Tradurre il set di caratteri in PERL. Digitare "use Encode qw (from_utf8 to_iso88591);
from_to ($data, "utf8", "iso-8859-1");. " Sostituire "da-utf8" con il set di caratteri con codificata UTF-8 e "to_iso88591" con l'output desiderato di ISO-8859-1.
3
Tradurre il set di caratteri in Python. Digitare il seguente codice.
source_encoding = "utf-8"
stringa = utf8variable
stringa = string.encode(source_encoding)
stringa = unicode (stringa, ' iso-8859-1')
Sostituire "utf8variable" con la variabile che contiene il set di caratteri UTF-8.