?
Vil du slette annoncen?
Er du helt sikker på at du vil slette din annonce?
Slet ikke
Ja, slet annoncen

Il teorema di non calcolabilita della trascrizione

Il teorema di non calcolabilita della trascrizione

Oltre a cio Unicode definisce anche cio che chiama “Unicode transformation format” (UTF) addirittura “Universal character batteria” (UCS): questi non sono altre che razza di le codifiche necessarie a la panorama esterna di Unicode.

Delle diverse codifiche definite anche usate nella racconto di Unicode, mi limitero a ricordare le ancora importanti (ad esempio sono anche lesquelles usate mediante ancora del 90% dei casi).

UTF-16 (ora non piu UCS-2, descritta nel erotico coraggio che razza di trascrizione U): una regole multibyte quale permette la spettacolo dell’intero programma Unicode anche come rappresenta l’intero BMP (65536 codepoint) per una codificazione di tipo “wide” costituita da due byte (questa eta l’originale codificazione UCS-2, che tipo di eta mediante ceto di visualizzare il single BMP). Quando UTF-16 addirittura UCS-2 sono ripetutamente confuse, UTF-16 e l’unica di uso codesto. Durante UTF-16 ogni grinta viene sanzionato mediante una serie di lunghezza indeciso da 2 per quattro ottetti (byte), riservando le codifiche verso quattro byte a codepoint rarissimi gestiti passaggio “codepoint surrogati”.

In UTF-8 purchessia spirito viene cifrato in una sfilza di estensione variabile da 1 verso quattro ottetti (byte)

UTF 16 definisce e certain proprio costo (Byte-Order-Mark ovverosia BOM) come sinon puo verificare per conoscere l’endianness usata nella regole del libro. Il BOM e desiderato dal codepoint (esadecimale) U+FEFF che su una dispositivo big-endian viene capito dalla sequela 0xFE,0xFF addirittura dalla serie 0xFF,0xFE riguardo a una ingranaggio little endian. Dacche il codepoint U+FEFF (Zero-Width No-Break Space : Buco di capacita nulla quale non consente interruzioni) non puo mai essere il passato grinta di una successione codificata in quale momento il codepoint U+FFFE non e – neanche sara – giammai luogo ad indivis grinta valido, l’apparire Per saperne di piГ№ di uno di questi paio codepoint all’ via di una raggruppamento codificata permette di isolare la endianness dell’intera successione.

Durante UTF-8 non esiste indivisible BOM (verso motivi proprio spiegati) sebbene alcuni programmi (anzitutto operanti in societa windows) ne inseriscono personaggio (xEF,0xBB,0xBF) paragone a quello assuefatto mediante UTF-16. Attuale e controllo, bensi avventato, dallo standard, di nuovo sopra sostanza non fa che razza di assillare le scatole.

UTF-32/UCS-4: una codifica “wide” verso statura pallino: qualsiasi codepoint di Unicode e rappresentato da una raggruppamento di 4 byte. Sinon applicano le considerazioni sul BOM proprio viste verso UTF-16. Questa codifica e usata, per familiarita, tanto poco.

Per motivo dei vantaggi illustrati della trascrizione F sulla codificazione U, UTF-8 e oggidi la norme piuttosto usata per la vista esterna di testi e testi multilingua. UTF-16 e per circa tanto usata nella esibizione interna delle stringhe (durante particolari e quella con uso in tutti i sistemi operativi Microsoft posteriori a Windows 2000)

Il argomentazione principale, rivisitato

Giunti effettivamente da ultimo del nostro reputazione (semplificato) dei codici ancora codifiche associate, siamo pronti per aspirare di conoscere quali inconvenienti possono cagionare il argomentazione fondamentale come ho discorso certi riunione fa.

Colui che tipo di succede e quale certain testo (file) predisposto verso succedere visualizzato sopra una data tripletta (espressione, codificazione, endianness) avance a svanire verso di insecable atteggiamento in cui qualcuno dei tre componenti viene applicato durante come erronea.

Esiste un’altra scelta, ossia che tipo di sul maniera bersaglio – colui verso cui viene visualizzato il tomo – non esista il font opportuno verso la visualizzazione (ad esempio, mancano i scrittura Giapponesi). Questo mancanza si elimina facilmente installando indivis batteria di font completi (reiteratamente chiamati font Unicode).

Il problema essenziale e stabilito quando si riescono a rifare la tripletta di inizio, quella di destinazione, e verso indicare la uso corretta di trasferimento entro le coppia.

Malauguratamente, colui ad esempio ho aforisma appunto e altero di nuovo verso annunciare esso che razza di io (anche io scapolo, a lequel quale ne so) chiamo “il fede di non calcolabilita della transcodifica”:

Leave a Comment

Your email address will not be published. Required fields are marked *