Unicode'i teisendusvorming (UTF)

Autor: Monica Porter
Loomise Kuupäev: 15 Märts 2021
Värskenduse Kuupäev: 1 Juuli 2024
Anonim
Unicode'i teisendusvorming (UTF) - Tehnoloogia
Unicode'i teisendusvorming (UTF) - Tehnoloogia

Sisu

Definitsioon - mida tähendab Unicode Transformation Format (UTF)?

Unicode'i teisendusvorming (UTF) on märkide kodeerimise vorming, mis on võimeline kodeerima kõiki Unicode'i võimalikke märgikoodipunkte. Kõige viljakam on UTF-8, mis on muutuva pikkusega kodeering ja kasutab 8-bitiseid koodiseadeid, mis on mõeldud tagurpidi ühilduvuseks ASCII kodeeringuga.


Unicode'i ümberkujundamise vormingut tuntakse ka kui universaalset ümberkujundamise formaati.

Sissejuhatus Microsoft Azure'i ja Microsoft Cloud | Kogu selle juhendi kaudu saate teada, mis on pilvandmetöötlus ja kuidas Microsoft Azure aitab teil pilvest rännata ja oma ettevõtet juhtida.

Techopedia selgitab Unicode'i teisendusvormingut (UTF)

Unicode'i teisendusvorming on üks kahest Unicodes kasutatavast kodeeringust, teine ​​on universaalne märgikomplekt (UCS). Neid mõlemaid kasutatakse Unicode koodipunktide vahemiku kaardistamiseks nn koodiväärtuste jadadeks. Kodeeringu nimedes olevad numbrid näitavad, mitu bitti kasutatakse kodeeringu ühes koodiväärtuses. See tähendab lihtsalt seda, et igale ainulaadsele tähemärgile omistatakse kooditunnus, mida nimetatakse koodipunktideks.

Erinevat tüüpi UTF-kodeeringud hõlmavad järgmist:


  • UTF-1 - UTF-8 eelkäija, kes pole enam Unicode'i standardi osa
  • UTF-7 - kasutab kodeerimiseks 7 bitti ja seda kasutati peamiselt, kuid seda peetakse nüüd vananenuks
  • UTF-8 - kasutab 8-bitist muutuva laiusega kodeeringut, et maksimeerida ühilduvust ASCII-ga
  • UTF-16 - 16-bitine muutuva laiusega kodeering
  • UTF-32 - 32-bitine fikseeritud laiusega kodeering
  • UTF-EBCIDC - kasutab 8 bitti ja on kavandatud ühilduma laiendatud binaarse kodeeritud kümnendkoha vahetuskoodiga (EBCDIC)