KOI8-R kodlash. KOI8-R uchun kodlash nima va u nima berdi? Koi 8 rus harflari uchun kodlash jadvali

Golovna / Corisna haqida ma'lumot

- Czampolit (@ComradZampolit) 2017 yil 17 sentyabr

KOI8-R ni qanday mashq qilish kerak?

KOI8-R - sakkiz bitli kod sahifasi, kirill alifbosi harflarini kodlash uchun ajratilgan. Chakana sotuvchilar rus alifbosi belgilarini shunday joylashtirdilarki, kirill belgilarining joylashuvi jadvalning pastki qismidagi ingliz alifbosidagi fonetik hamkasblariga mos tushdi. Va agar ushbu kodda yozilgan matnda teri belgisining sakkiz bitini olib tashlasangiz, lotin harflaridagi transliteratsiyaga o'xshash matn chiqadi.

Axborot almashish uchun bunday kod ÊS EOM seriyali kompyuterlarida etmish yil davomida turg'un edi va o'n sakkizinchi yilning o'rtalaridan boshlab ular birinchi ruslashtirilgan versiyalarda g'alaba qozona boshladilar. operatsion tizim UNIX.

Teri belgisiga o'ziga xos kod berilgan deb hisoblar edi: 00000000 dan 11111111 gacha. Shu tarzda, odam xoch uchun belgilarni, kompyuter esa - ularning kodi uchun ajratdi.

Chi vikoristovuetsya bir vaqtning o'zida kodlash Chernov?

Ni. Vaughn bula eski sakkiz bitli kompyuterlar uchun dolzarbdir, shu bilan birga Unicode-ni turli formatlarda ishlatish muhimroqdir.

Salom, blog saytining yangi o'quvchilari. Bugun biz siz bilan ular haqida gaplashamiz, yulduzlar sayt va dasturlarda stenografiya sifatida olinadi, matnni qanday kodlash va ularni qanday kuzatish mumkin. Biz CP866, KOI8-R, Windows 1251 ning asosiy ASCII va kengaytirilgan versiyalaridan boshlab va Unicode konsortsiumi UTF 16 va 8 uchun joriy kodlash bilan yakunlangan ularning rivojlanish tarixi haqida xabar beramiz.

Kimga siz uyga tashrif buyurishingiz mumkin, lekin siz yana qancha o'sha krakozyabrivni eyishga kelishim mumkinligini bilasiz, vilizlih osilib turadi (belgilar to'plami bilan o'qib bo'lmaydi). Endi men ushbu nizomlarning matniga hamma narsani aytib berish va sizning jamblaringizni mustaqil ravishda tartibga solish imkoniyati haqida o'ylayapman. Xo'sh, ma'lumotni olishga tayyor bo'ling va yangiliklarning tarqalishini kuzatib borishga harakat qiling.

ASCII - lotin uchun asosiy matn kodlash

Matnlarni kodlashni ishlab chiqish IT galereyasini qoliplashdan bir vaqtning o'zida amalga oshirildi va bir soat ichida chimalih o'zgarishlarini tanib oldi. Tarixiy jihatdan hamma narsa rus tilida shirin bo'lmagan EBCDIC bilan amalga oshirila boshlandi, chunki u lotin alifbosi harflarini, arab raqamlarini va tinish belgilarini boshqaruvchi belgilar bilan kodlash imkonini berdi.

Ammo baribir, warto matnlarini zamonaviy kodlashni rivojlantirish uchun to'g'ri nuqta mashhur ASCII(Axborot almashish uchun Amerika standart kodeksi, rus minasi "asky" kabi eshitiladi). Von birinchi 128 ta belgini eng ko'p yoziladigan ingliz koristuvachlari - arab raqamlari va belgilarini tasvirlaydi.

Batafsil qi 128 belgilari, ASCII tasvirlangan, kshtalt kamon ustida deaki xizmat belgilarini ishlatiladi, panjara, ingichka tikilib. Vlasne, siz o'zingiz qilishingiz mumkin:

Asl ASCII variantidagi 128 ta belgining o'zi standart bo'lib qoldi va ularning tilida har qanday boshqa tarzda kodlangan bo'lsa, ular shu tartibda yoqimsiz hidga arziydi.

Ale o'ng tomonda, bunda bir bayt ma'lumot uchun 128 emas, balki 256 xil qiymatlarni kodlash mumkin (ikkitasi eng kattasi 256 ga teng), so'ngra quyidagi asosiy versiya Askí z'yavivsya tsíli qator ASCII kodlash kengaytmalari, buning uchun milliy kodlash belgilarini kodlovchining 128 ta asosiy belgilariga ega bo'lish mumkin (masalan, rus).

Bu erda, qo'shiq bilan, bir soatlik tavsif uchun vikoristovuyutsya kabi raqamlar tizimi haqida bir oz ko'proq gapirish kerak. Birinchidan, barchangizga ma'lumki, kompyuter faqat ikkita tizimdagi raqamlar bilan ishlaydi, o'zi esa nollar va birlar bilan ishlaydi ("Mantiqiy algebra", xuddi siz kollej yoki maktabga borgandek). , terilari bir qadamda ikki, noldan boshlab va somyda ikkitagacha:

Bunday dizayndagi nol va birlarning barcha mumkin bo'lgan kombinatsiyalari 256 dan kam bo'lishi mumkinligini tushunish muhim emas. Raqamni ikkita tizimdan o'ninchiga aylantirish oson. Yakkama-yakka turish uchun ikkalasining barcha qadamlarini shunchaki katlash kerak.

Bizning dumbamiz 1 (nol qadamda 2) plyus 8 (3 bosqichda ikkita), ortiqcha 32 (beshinchi bosqichda ikkita), ortiqcha 64 (oltinchida), ortiqcha 128 (oltinchi bosqichda) chiqadi. Bir vaqtning o'zida 233 ni olib tashlang o'nta tizim hisoblash. Yak bachite, hamma narsa oddiyroq.

Ammo agar siz ASCII belgilar bilan jadvallarni ko'rib chiqsangiz, ular o'n oltita kodlashda taqdim etilganligini bilib olasiz. Masalan, Ascidagi "zirochka" o'n oltinchi 2A raqamiga to'g'ri keladi. Shubhasiz, siz o'n oltinchi tizimda arab raqamlaridan tashqari g'olib raqamlar va A (o'n ma'nosi) dan F (o'n besh)gacha ko'proq lotin harflari mavjudligini ko'rishingiz mumkin.

Xo'sh, eksa, uchun tarjima juft raqam XVI asrda haqoratli oddiy va ilmiy yo'l uchun vdayutsya. Yuqoridagi skrinshotda ko'rsatilganidek, ma'lumotlarning teri baytlari bitlar soniga ko'ra qismlarga bo'linadi. Bu. teri yarim bayt ikki tomonlama kod siz faqat o'n oltita qiymatni kodlashingiz mumkin (to'rtinchi bosqichda ikkitasi), ularni o'n oltinchi raqam bilan osongina ko'rsatish mumkin.

Bundan tashqari, baytning chap yarmida sahnani skrinshotda ko'rsatilgandek emas, balki noldan tiklash kerak bo'ladi. Natijada, oddiy hisob-kitobdan foydalanib, biz E9 raqami skrinshotda kodlanganligini hisobga olamiz. Ishonchim komilki, mening tushunmovchiliklarim va bu jumboqning yechimi sizni yoritib berdi. Xo'sh, keling, matnni kodlash haqida gapiraylik.

CP866 va KOI8-R-ni psevdografika bilan kodlovchi Ask-ning kengaytirilgan versiyalari

Keyinchalik biz barcha zamonaviy kodlarni (Windows 1251, unicode, UTF 8) ishlab chiqish uchun boshlang'ich nuqta bo'lgan ASCII haqida gapira boshladik.

Lotin alifbosining 128 dan ortiq belgilari, arab raqamlari va boshqalar, ammo kengaytirilgan versiyada ma'lumotlarning bir baytida kodlanishi mumkin bo'lgan barcha 256 qiymatni birlashtirish mumkin edi. Tobto. Asuka o'z tilidagi harfning belgilarini qo'shish mumkin bo'ldi.

Bu erda siz yana gapirishingiz, tushuntirishingiz kerak bo'ladi. kodlashning yangi ehtiyojlari matn nima uchun juda muhim. Kompyuteringiz ekranidagi belgilar ikkita nutq asosida shakllanadi - kuchli belgilarning vektor shakllari (ko'rinishi) to'plami (3-faylda hidlar mavjud) va ushbu vektor shakllari to'plamidan (shrift) foydalanishga imkon beruvchi kod. fayl) kerakli joyga kiritishingiz kerak bo'lgan bir xil belgi.

Men tushundimki, shriftlar vektor shakllari uchun, kodlash o'qi esa operatsion tizim va unda ishlatiladigan dasturlar uchun ishlatiladi. Tobto. Agar kompyuteringizda biron bir matn mavjud bo'lsa, u baytlar to'plami bo'ladi, teri kodlashlari matnning o'zida bitta belgiga ega.

Ekranda matnni ko'rsatadigan dastur (matn muharriri, brauzer va boshqalar), kodni tahlil qilishda qora belgining kodlanishini o'qiydi va kerakli fayl shriftida to'g'ri vektor shaklini qidiradi, bu ulanishni ko'rsatish uchun. berilgan matnli hujjat. Hamma narsa juda oddiy.

Shunday qilib, bizga kerak bo'lgan har qanday belgini (masalan, milliy alifbodan) kodlash uchun siz faqat ikkita fikrni vikonano qilishingiz mumkin - bu belgining vektor shakli kodlangan shrift uchun javobgardir va butun belgi kodlanishi mumkin. bir baytda kengaytirilgan ASCII kodlashlarida. Shuning uchun bunday variantlar juda muhimdir. Faqat kengaytirilgan Askaning ruscha original kilkidagi belgilarni kodlash uchun.

Misol uchun, u boshoqda paydo bo'ldi CP866, qaysidir ma'noda rus alifbosining ramzlari va ASCII ning kengaytirilgan versiyasini g'alaba qozonish mumkin edi.

Tobto. Yuqori qismi asosan Aska ning asosiy versiyasidan iborat edi (lotin tilida 128 ta belgi, raqamlar va boshqa axlatlar), chunki u tepada joylashgan uchta skrinshotda ko'rsatilgan va o'q allaqachon CP866 kodlash belgilari bilan jadvalning pastki qismidir. (Ruscha harflar va u erda har xil psevdografiya):

Bachite, raqamlar o'ng ustun uchun 8 dan boshlanadi, chunki 0 dan 7 gacha bo'lgan raqamlar ASCII asosiy qismidan oldin ko'rinadi (birinchi skrinshot bo'limi). Bu. Matnda paydo bo'lishi uchun CP866 matematik kodidagi ruscha "M" harfi 9S.

Tovushlar shunday miqdordan keldi CP866 da psevdografiya? Bu erda shuni ta'kidlash kerakki, rus tilidagi matnni kodlash, agar hozirgidek grafik operatsion tizimlarning bunday kengayishi mavjud bo'lsa, yanada ixtiyoriy ravishda kengaytirilgan. Va Dosi-da va unga o'xshash matnli operatsion tizimlarda psevdografiya matnlarning biroz qonuniy dizayniga ruxsat berdi va buning uchun CP866 va boshqa barcha tengdoshlari Ask-ning kengaytirilgan versiyalari toifasidan tozalandi.

CP866 IBM tomonidan ishlab chiqilgan, ammo rus tilidagi belgilar uchun bir qator kodlar ham kengaytirilgan, masalan, bir xil turdagi (ASCII kengaytmalari) ko'rish mumkin. KOI8-R:

vv roboti printsipi ilgari CP866 tomonidan tasvirlangan bir xilda qoldi - matnning teri belgisi bitta bayt bilan kodlangan. Skrinshotda KOI8-R jadvalining yana bir yarmi ko'rsatilgan, chunki birinchi yarmining birinchi yarmi ushbu maqolaning birinchi skrinshotida ko'rsatilganidek, asosiy So'rovga asoslangan.

KOI8-R kodlash xususiyatlaridan biri shuni ta'kidlash mumkinki, jadvaldagi rus harflari alifbo tartibida emas, masalan, ular CP866 da yozilgan.

Agar siz birinchi skrinshotga qarasangiz (asosiy qism, barcha kengaytirilgan kodlashni qanday kiritish kerak), keyin KOI8-R da rus harflari jadvalning bir xil o'rtasida tartiblanganligini, lotin alifbosi harflari qatorida joylashganligiga e'tibor bering. jadvalning birinchi qismi. Jami bitta urish (ettinchi bosqichda ikkitasi yoki 128) berish uchun rus ramzlaridan lotin usuliga o'tishning ravshanligi uchun hamma narsa buzildi.

Windows 1251 - ASCII ning joriy versiyasi

Matn kodining keyingi rivojlanishi grafik operatsion tizimlarning ommalashib borayotganligi va tez orada ularda psevdografiyadan foydalanish zarurati paydo bo'lishi bilan bog'liq edi. Natijada, guruh nomi, o'z hikoyasiga kelsak, avvalgidek, Askning kengaytirilgan versiyasi edi (matnning bir belgisi bir baytdan ortiq ma'lumot bilan kodlangan), ammo psevdografik belgilarni tanlamasdan. .

Hidi Amerika Standartlar Instituti tomonidan ajratilgan ANSI kodlari deb ataladigan narsaga to'g'ri keldi. Kirill alifbosining nomi ham rus tilini qo'llab-quvvatlagan variant uchun tanlangan. Bunga buti misol bo'lishi mumkin.

Vaughni vigid vi-nikoristovynaya yaralangan yaralangan CP866 I KOI8-R Tim, Scho Mass belgisi psevdografik nii belgilarining ramzi qarz oldi va bir xil, so'zlarning so'zlari blizis yilda vikoristovy. d.). ):

Shrift turlari va turlari orasida rus tilini kodlashning bunday ko'pligi orqali dasturiy ta'minot doimo boshini ayblab byl, va oramizda, sizning oramizda, shovní chitachí, siz tez-tez qayg'uli tashqariga osilgan. krakozyabri, matnda g'olib bo'lgan versiya bilan adashgan bo'lsa.

Bundan ham tez-tez hidi kuchli va otrimanni eslatish bilan osilib turardi elektron pochta Hatto katlanadigan qayta kodlash jadvallarini yaratishga nima sabab bo'ldi, masalan, bu muammoni hal qilishning iloji bo'lmadi va ko'pincha Windows CP866, KOI8-R5 yoki ruscha kodlashda yomon xatolarga yo'l qo'ymaslik uchun ularni ro'yxatga olish uchun burishdi.

Darhaqiqat, ruscha matn o'rnini bosishi kerak bo'lgan krakozyabry mov tilini noto'g'ri kodlash natijasi bo'lgan, chunki u paydo bo'lmagani uchun unda kodlangan. matnli xabarlar pochatkovo.

Bu qabul qilinadi, go'yo CP866 yordami uchun kodlangan belgilar, Windows 1251 kod jadvaliga taqlid qilishga harakat qiling yoki xabarnoma matnini o'zi bilan almashtirib, yozing (ahmoqona terish belgilar) va vilizut.

Shunga o'xshash vaziyat ko'pincha forumlarda yoki bloglarda ayblanadi, agar ruscha afv so'zlari bo'lgan matn noto'g'ri kodda olingan bo'lsa, chunki u saytda aql uchun yozilgan bo'lsa, aks holda unday emas. matn muharriri, bu kodni ko'rinmas ko'zga ko'rinmaydigan kodga qo'shadi.

Shaxssiz coduvans va krakozyabry bilan bunday vaziyat, doimiy ko'tarilish, boy nabridla, yangi universal o'zgarishlar yaratish oldin ularning fikrlarini o'zgartirish paydo bo'ldi, go'yo u o'zi bilan hamma narsani o'rniga va virishila b, hal, muammoning ildizida. matndan. Xitoy tiliga o'xshash til muammosi Qrimga asoslangan edi, ammo tilning ramzlari boyroq, pastroq 256 edi.

Unicode (Unicode) - universal kodlash UTF 8, 16 va 32

ASCII ning kengaytirilgan versiyalarida belgilarni kodlash uchun ko'rilgan ma'lumotni bir baytda tasvirlab bo'lmaydi. Natijada nomi ostida konsorsium tuzildi Unicode(Unicode - Unicode Consortium) IT-industriyasi rahbarlarining (i, dasturiy ta'minotni ishlab chiquvchi, kodni kodlovchi, shriftlarni yaratuvchi) spívpratsi boyligi bilan, chunki u matn uchun universal kodlash paydo bo'lishi bilan chaqirilgan edi. .

Unicode konsorsiumi ostida joriy qilingan birinchi variatsiya bula edi UTF-32. Kodlash nomidagi raqam bitlar sonini bildiradi, ya'ni bitta belgi kodlash uchun qanday yutish mumkin. 32 bit yangi universal UTF kodlashda bitta belgini kodlash uchun zarur bo'lgan 4 baytgacha ma'lumotni qo'shadi.

Natijada, matn bilan bir xil fayl, ASCII ning kengaytirilgan versiyasida va UTF-32 da kodlanadi, qolgan hollarda Chotiri uchun ko'proq kengayish (ahamiyat) mavjud. Bu yomon, lekin endi biz UTF yordami uchun boshqa o'ttiz qadamda ikkitaga yaxshi bo'lgan belgilar sonini kodlash imkoniga egamiz ( milliardlab belgilar, yakí nakriyut be-yak, albatta, ulkan zahira bilan zarur qiymat).

Bundan tashqari, Evropa guruhining tiliga ega mamlakatlar uchun zovsym kodlashda vikoristovuvaty belgilarining bunday ulug'vor soni va UTF-32 ni o'rnatishda hech qanday ehtiyoj yo'q edi. matnli hujjatlar, va buning natijasida Internet-trafikning ko'payishi va ma'lumotlarni saqlash majburiyati mavjud. Bu boy va bunday pulni behuda sarflashga hech kim yo'l qo'yib bo'lmaydi.

Unicode ishlab chiqilgandan so'ng paydo bo'ldi UTF-16, Yaka vyyshla nastylki masofada, biz vikoristovuyutsya kabi, barcha ramzlar uchun asosiy kenglik sifatida umovchannyam uchun olingan scho bula. Bitta belgini kodlash uchun ikkita bayt mavjud. Keling, narsalar qanday ko'rinishiga hayron bo'laylik.

Windows operatsion tizimi uchun siz "Ishga tushirish" - "Dasturlar" - "Aksessuarlar" - "Xizmatlar" - "Symbol jadvali" yo'lidan o'tishingiz mumkin. Natijada, tizimingizda o'rnatilgan barcha shrift tizimlarining vektor shakllari bilan jadval ko'rsatiladi. Yakshcho siz qabul qilasiz " Qo'shimcha parametrlar» Unicode belgilarni kiritib, siz teri shriftidan barcha belgilar diapazoni uchun, jumladan, yangisigacha foydalanishingiz mumkin.

Nutqdan oldin, ulardan birortasini bosish orqali siz ikki baytli yogo kuylashingiz mumkin UTF-16 format kodi, O'n to'rt o'n olti raqam bilan nima qo'shiladi:

UTF-16 da 16 bit yordamida qancha belgilarni kodlash mumkin? 65536 (o'n olti qadamda ikkita) va raqamning o'zi Unicode-da asosiy bo'sh joy sifatida olingan. Krim tsgogo, unga yordam va yaqin ikki millionyv znikiv uchun zakoduvati uchun isnuyut yo'llari, ale obmezhilis matnda million ramzlari keng kenglik.

Ale navit tsya uzoqda bo'lgan Unicode kodlash versiyasi faqat dasturlarni yozganlarni, aytaylik, unchalik mamnun qilmadi. Ingliz tili, Bo stink, ASCII kengaytirilgan versiyasidan UTF-16 ga o'tgandan so'ng, hujjatlar soni ikki baravar ko'paydi (Asci-da bir bayt va UTF-16-da bir xil belgining ikki bayti).

Unicode konsorsiumidagi hamma va hamma narsani qondirish uchun uni o'ylab topishga qaror qilindi hayot o'zgarishini kodlash. UTF-8 deb nomlangan. Ismning yuqori qismini ushlang, men dovjinani o'zgartirishim mumkinligi to'g'ri, tamom. Matnning teri belgisi birdan olti baytgacha bo'lgan belgilar ketma-ketligida kodlanishi mumkin.

Amalda, UTF-8 faqat birdan to'rt baytgacha bo'lgan diapazonga ega, shuning uchun bir necha bayt kod uchun biror narsani ochish nazariy jihatdan mumkin emas. Undagi barcha lotin belgilar eski ASCII-dagi kabi bir baytda kodlangan.

Shunisi e'tiborga loyiqki, faqat lotin tilini kodlash davrida Unicode-ni tushunmaydigan navit dasturlari, UTF-8-da kodlanganlarni o'qiydi. Tobto. Asci-ning asosiy qismi hozirgina Unicode konsorsiumining miyasiga o'tdi.

UTF-8 dagi kirillcha belgilar ikki baytda, masalan, gruzincha belgilar uch baytda kodlangan. Unicode konsortsiumi UTF 16 va 8 yaratilganidan keyin asosiy muammoni hal qildi - endi bizda bor shriftlar bitta kod maydoniga ega. Va endi ularning kotiblari o'zlarining kuchlari va matndagi belgilarning vektor shakllarini to'ldirish qobiliyatidan boshqa narsaga ega emaslar. Navit birdaniga.

Kursni "Rimlar jadvali" ustiga olib borishda turli shriftlar belgilar sonini ta'kidlashi aniq. Ko'pgina belgilar Unicode shriftlari hatto munosib darajada muhim bo'lishi mumkin. Lekin hozir hidlar ular tomonidan ko'rib chiqilmaydi, ular turli xil kodlash uchun yaratilgan, lekin yozish orqali, yozuv mashinkasi shriftni to'ldirgan yoki bitta kod maydonini oxirigacha to'ldirish orqali emas.

Krakozyabri zamíst rosíyskih harflar - yak vipraviti

Keling, ular krakozyabri matnini qanday o'zgartirishi kerakligini, aks holda rus tilidagi matn uchun to'g'ri kodlashni qanday tanlashni bilib olaylik. Xo'sh, u o'sha dasturda o'rnatiladi, unda siz matnni tahrirlashingiz yoki turli matn qismlari uchun kod yaratasiz.

Bu katlamni tahrirlash uchun matnli fayllar Men vikoristda ayniqsa yaxshiman, mening fikrimcha, . Vím, vín yuzdan ortiq yaxshi dasturlash va tartibning sintaksisini o'zgartirishi mumkin, shuningdek, qo'shimcha plaginlar uchun kengaytirilishi mumkin. O'qing hisobotni ko'rib chiqish tsíêí yo'l-yo'riq uchun mo''jizaviy dasturlar.

Notepad ++ ning yuqori menyusida "Kod" bandi mavjud bo'lib, siz blokirovka qilish uchun saytingizda mavjud bo'lgan variantni o'zgartirishingiz mumkin:

Joomla 1.5 va undan yuqori versiyalaridagi saytlar, shuningdek WordPress-dagi bloglar uchun variantni tanlash uchun qisqartmalar ko‘rinishiga rioya qiling. BOMsiz UTF8. BOM prefiksi nima?

O'ng tomonda, agar UTF-16 kodlash buzilgan bo'lsa, uni shunday ibora bilan bog'lash mumkin edi, chunki to'g'ridan-to'g'ri ketma-ketlikda bo'lgani kabi belgining kodini yozish mumkin (masalan, 0A15). ), shuning uchun teskari (150A). Va dasturlar tushunishi uchun ketma-ketlikda kodni o'qib chiqing va o'ylab toping BOM(Bayt tartibi belgisi yoki boshqacha qilib aytganda, imzo), bu hujjatlar to'plamiga uchta qo'shimcha bayt qo'shilishida namoyon bo'ladi.

UTF-8 kodlashda hech qanday BOM Unicode konsortsiumiga o'tkazilmadi va unga imzo qo'shildi (hujjatga eng muhim uchta bayt qo'shilgan) bunday dasturlarga ular shunchaki kodni o'qishlari kerak. Shuning uchun, agar siz fayllarni UTF bilan saqlasangiz, BOMsiz (imzosiz) variantni tanlashingiz mumkin. Bu martabada siz uzoqdasiz o'zingizni vilaza krakozyabriv bilan ta'minlang.

Shunisi e'tiborga loyiqki, Windows-dagi ba'zi dasturlar bu ishni bajara olmaydi (UTF-8-dan matnni BOMsiz saqlay olmaydi), masalan, xuddi shu baxtsiz Windows Notepad. Vín hujjatni UTF-8 dan oladi, lekin baribir kobga imzo qo'shadi (uchta qo'shimcha bayt). Bundan tashqari, bu baytlar abadiy bitta va bir xil bo'ladi - kodni to'g'ridan-to'g'ri ketma-ketlikda o'qing. tsyu dríbnitsyu orqali serverlarda Ale muammoni ayblashi mumkin - vilizu krakozyabri.

Shunday qilib, har qanday vaqtda ajoyib Windows bloknotiga aldanmang saytingizdagi hujjatlarni tahrirlash uchun, shuning uchun siz noaniqliklar paydo bo'lishiga qarshi emassiz. Eng yaxshi va eng yaxshi oddiy variant Men Notepad++ muharriridan ham foydalanaman, u amalda ko'p kamchiliklarga ega emas va ba'zi afzalliklardan iborat.

Notepad ++ yordamida kodlashni tanlashda siz matnni o'z mohiyatiga ko'ra Unicode standartiga yaqinroq bo'lgan UCS-2 kodlashiga aylantirishingiz mumkin bo'ladi. Notepad matnni ANSI-da ham kodlashi mumkin, shuning uchun. Biz allaqachon Windows 1251 uchun ba'zi rus filmlarini tasvirlab berdik. Siz biron bir ma'lumot olasizmi?

Von sizning operatsiya xonangiz reestrida ro'yxatdan o'tgan Windows tizimlari- ANSI kodi uchun kodlashni qanday tanlash kerak, OEM kodini qanday tanlash kerak (rus filmi uchun u CP866 bo'ladi). Agar siz reklama uchun boshqa tilni kompyuteringizga o'rnatgan bo'lsangiz, kodlash o'z filmingiz uchun bir xil ANSI yoki OEM kodi bilan almashtiriladi.

Bundan tashqari, agar siz hujjatni Notepad++ dasturida kerakli koddan saqlasangiz yoki tahrirlash uchun saytdan hujjatni ochsangiz, tahrirlovchining pastki o'ng burchagiga nom qo'shishingiz mumkin:

Shchob niknut krakozyabriv, yuqoridagi tavsiflardan tashqari, server yoki mahalliy xost firibgarni ayblamasligi uchun saytning barcha tomonlari chiqish kodining sarlavhasiga kodlashning o'zi haqida ma'lumot yozish to'g'ri bo'ladi.

Vzagali, Html creme gipermatnli maketning barcha filmlarida maxsus ovozli xml mavjud bo'lib, unda matn kodlash ko'rsatilgan.

Avvalo, kodni tahlil qiling, brauzer g'olibning qaysi versiyasidan foydalanilayotganini va filmdagi belgilar kodini qanday izohlash kerakligini bilib oladi. Shuni ham yodda tutingki, agar siz hujjatni standart unicodedan saqlasangiz, xml noaniqligini o'tkazib yuborishingiz mumkin (kodlash UTF-8 da bo'ladi, bu BOM emas yoki UTF-16, ya'ni BOM ê).

Hujjatni rasmiylashtirish vaqtida Film html kodlashni kodlash uchun Meta elementi, bu egri va yopiladigan Head tegi orasiga yoziladi:

... ...

Ushbu yozuv qabul qilinganidek qattiq ko'rib chiqiladi, lekin men asta-sekin joriy etilayotgan yangi Html 5 standartini qayta topshiraman va u hozirda g'olib bo'lgan brauzerlar tomonidan to'g'ri tushuniladi.

Fikr sifatida, hujjatning Html kodlashidagi Meta elementi qisqaroq bo'ladi yakomoga hujjat sarlavhasida yuqoriroq, shuning uchun birinchi belgi matnida yozish paytida asosiy ANSI emas (u har doim va har qanday o'zgarishlarda to'g'ri o'qilganidek), brauzer allaqachon ushbu belgilarning kodlarini qanday izohlash haqida ona ma'lumoti uchun javobgardir. .

Sizga omad! Blog saytining yon tomonlarida tez zustríches uchun

Buti tsikavo mumkin

Sayt uchun xabarning mutlaq haqiqiyligini aniqlaydigan URL manzili nima
OpenServer - joriy mahalliy server WordPress-ni kompyuterga o'rnatish uchun ushbu yoga wiki ilovasi
Chmod qanday, fayl va papkalarga (777, 755, 666), shuningdek PHP orqali kirish huquqlarini qanday belgilash mumkin
Yandex sayt va onlayn do'konni qidiradi

KOI8-R kodlash

ISO 8859-5 kodlash

ISO 8859-5

Alternativ kodlash

"Muqobil kodlash"- CP437 kod tomoniga asoslanib, ikkinchi yarmidagi barcha o'ziga xos Evropa belgilar kirill alifbosiga almashtiriladi va psevdografik belgilar ishlatilmaydi. Bundan tashqari, robotlashtirilgan matnlar uchun g'alaba qozonadigan dasturlarni ko'rib chiqishning hojati yo'q, shuningdek, kirill belgilarining g'alaba qozonishini ta'minlaydi.

Tarixan, muqobil kodlash uchun juda ko'p imkoniyatlar mavjud edi, ammo boshqa barcha xususiyatlar 0xF0 - 0xFF (240-255) maydoni bilan cheklangan. Qolgan standart MS-DOS 6.22 versiyasida joriy qilingan IBM CP866 kodlash edi. fayl tizimi FAT. Windows NT oilasining ruslashtirilgan tizimlari konsolida CP866 dosi vikoristovuetsya.

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8. A 410 B 411 412 G 413 D 414 E 415 F 416 W 417 Men 418 Y 419 41A gacha L 41B M 41C H 41D Pro 41E P 41F
9. R 420 Z 421 T 422 423 F 424 X 425 C 426 427-bob SH 428 Shch 429 b 42A S 42B b 42c E 42D Yu 42E Men 42Fman
A. 430 b 431 432 g 433 d 434 e 435 f 436 s 437 bu 438 439 43A gacha l 43B m 43C n 43D pro 43E n 43F
b. ░ 2591 ▒ 2592 ▓ 2593 │ 2502 ┤ 2524 ╡ 2561 ╢ 2562 ╖ 2556 ╕ 2555 ╣ 2563 ║ 2551 ╗ 2557 № 255D ╜255C ╛255B ┐ 2510
C. └ 2514 ┴ 2534 ┬ 252C ├ 251C ─ 2500 ┼ 253C № 255E ╟255F ╚ 255A ╔ 2554 ╩ 2569 ╦ 2566 ╠ 2560 ═ 2550 ╬ 256C ╧ 2567
D. ╨ 2568 ╤ 2564 ╥ 2565 ╙ 2559 ╘ 2558 ╒ 2552 ╓ 2553 № 256B № 256A ┘ 2518 ┌250C █ 2588 ▄ 2584 ▌258C ▐ 2590 ▀ 2580
E. 440-bet s 441 t 442 443 da f 444 x 445 c 446 447 yil sh 448 w 449 b 44A 44B b 44C e. 44D yu 44E men 44F
F. E 401 e 451 Ê 404 454 dollar £407 457 40E da 45E da °B0 ∙ 2219 B7 √ 221A № 2116 ¤ A4 ■ 25A0 A0

SO 8859-5- Kirillcha yozish uchun ISO-8859 seriyasidan 8-bitli kodlash. Rossiyada Mayzhe ishlatilmaydi. Umuman olganda, ISO 8859-5 oddiy kodlashdan boshqa narsa emas, yangi kundagi parchalar kerakli belgilarga boy, masalan, tire (-), panjalar-yalinka (""), darajalar (°) va in.



.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8. 80 81 82 83 84 85 86 87 88 89 8A 8B 8C 8D 8E 8F
9. 90 91 92 93 94 95 96 97 98 99 9A 9B 9C 9D 9E 9F
A. A0 E 401 A 402 403 Ê 404 S 405 Men 406 £407 £408 409 gacha M 40A Pro 40B N40C AD 40E da P 40F
b. A 410 B 411 412 G 413 D 414 E 415 F 416 W 417 Men 418 Y 419 41A gacha L 41B M 41C H 41D Pro 41E P 41F
C. R 420 Z 421 T 422 423 F 424 X 425 C 426 427-bob SH 428 Shch 429 b 42A S 42B b 42c E 42D Yu 42E Men 42Fman
D. 430 b 431 432 g 433 d 434 e 435 f 436 s 437 bu 438 439 43A gacha l 43B m 43C n 43D pro 43E n 43F
E. 440-bet s 441 t 442 443 da f 444 x 445 c 446 447 yil sh 448 w 449 b 44A 44B b 44C e. 44D yu 44E men 44F
F. № 2116 e 451 R 452 -453 454 dollar *455 men 456 457 458 dollar 459 h 45A ћ 45B q 45C § A7 45E da Men 45 F

KOI-8 (axborot almashish kodi, 8 bit), KOI8- informatikada sakkiz bitli belgilar kodlash standarti. Kirill alifbosining harflarini kodlash uchun ajratilgan. Kodlashning etti bitli versiyasi ham mavjud - KOI-7. KOI-7 va KOI-8 GOST 19768-74 (hozircha) tavsiflangan.

KOI-8 rozrobniklari kengaytirilgan ASCII jadvalining yuqori qismiga rus alifbosi belgilarini shunday joylashtirdilarki, kirill belgilarining o‘rni jadvalning pastki qismidagi ingliz alifbosidagi fonetik o‘xshashlariga mos keladi. Tse, agar KOI-8 da yozilgan matnda teri belgisining sakkiz bitini olib tashlasangiz, lotin harflaridagi imloni talab qiladigan "o'qish" matni chiqadi. Masalan, "Ruscha matn" so'zlari "rUSSKIJ tEKST" ga aylandi. Yon eslatma sifatida kirillcha belgilar alifbo tartibidan tashqari chizilgan.

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8. ─ 2500 │ 2502 ┌250C ┐ 2510 └ 2514 ┘ 2518 ├ 251C ┤ 2524 ┬ 252C ┴ 2534 ┼ 253C ▀ 2580 ▄ 2584 █ 2588 ▌258C ▐ 2590
9. ░ 2591 ▒ 2592 ▓ 2593 ⌠ 2320 ■ 25A0 ∙ 2219 √ 221A ≈ 2248 ≤ 2264 ≥ 2265 A0 ⌡ 2321 °B0 ²B2 B7 ÷ F7
A. ═ 2550 ║ 2551 ╒ 2552 e 451 ╓ 2553 ╔ 2554 ╕ 2555 ╖ 2556 ╗ 2557 ╘ 2558 ╙ 2559 ╚ 255A ╛255B ╜255C № 255D № 255E
b. ╟255F ╠ 2560 ╡ 2561 E 401 ╢ 2562 ╣ 2563 ╤ 2564 ╥ 2565 ╦ 2566 ╧ 2567 ╨ 2568 ╩ 2569 № 256A № 256B ╬ 256C © A9
C. yu 44E 430 b 431 c 446 d 434 e 435 f 444 g 433 x 445 bu 438 439 43A gacha l 43B m 43C n 43D pro 43E
D. n 43F men 44F 440-bet s 441 t 442 443 da f 436 432 b 44C 44B s 437 sh 448 e. 44D w 449 447 yil b 44A
E. Yu 42E A 410 B 411 C 426 D 414 E 415 F 424 G 413 X 425 Men 418 Y 419 41A gacha L 41B M 41C H 41D Pro 41E
F. P 41F Men 42Fman R 420 Z 421 T 422 423 F 416 412 b 42c S 42B W 417 SH 428 E 42D Shch 429 427-bob b 42A

KOI8-U kodlash (Ukraina)

KOI-8 Internetda birinchi rus standartlashtirilgan kodlash bo'ldi.

IETF KOI-8 kodlash variantlari uchun RFC ni tasdiqladi:

  • RFC 1489 - KOI8-R (rus alifbosining harflari);
  • RFC 2319 - KOI8-U (Ukraina alifbosining harflari);
  • RFC 1345 - ISO-IR-111 (asosiy diapazonni belgilashni kechiring).

Hover jadvallarida harflar ostidagi raqamlar Unicode-dagi harfning o'n oltinchi kodini ko'rsatadi.

KOI8-R kodlash (ruscha)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F

8.

2500

2502

250C

2510

2514

2518

251C

2524

252C

2534

253C

2580

2584

2588

258C

2590

9.

2591

2592

2593

2320

25A0

2219

221A

2248

2264

2265

A0

2321
°
B0
²
B2
·
B7
÷
F7

A.

2550

2551

2552
e
451

2553

2554

2555

2556

2557

2558

2559

255A

255B

255C

255D

255E

b.

255F

2560

2561
Yo
401

2562

2563

2564

2565

2566

2567

2568

2569

256A

256B

256C
©
A9

C.
Yu
44E
A
430
b
431
c
446
d
434
e
435
f
444
G
433
X
445
і
438
th
439
oldin
43A
l
43B
m
43C
n
43D
haqida
43E

D.
P
43F
I
44F
R
440
h
441
T
442
da
443
va
436
V
432
b
44C
s
44B
h
437
w
448
e
44D
sch
449
yil
447
b
44A

E.
YU
42E
VA
410
B
411
C
426
D
414
E
415
F
424
G
413
X
425
І
418
Y
419
Oldin
41A
L
41B
M
41C
H
41D
Pro
41E

F.
P
41F
MEN
42F
R
420
Z
421
T
422
Da
423
VA
416
Da
412
b
42C
S
42B
Z
417
V
428
E
42D
SCH
429
H
427
Kommersant
42A

Boshqa variantlar

Faqat jadvallar qatorlari ko'rsatilgan, ular ishlamaydi, parchalar hali ham ishlaydi.

KOI8-U kodlash (ruscha-ukraincha)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F

A.

2550

2551

2552
e
451
є
454

2554
і
456
ї
457

2557

2558

2559

255A

255B
ґ
491

255D

255E

b.

255F

2560

2561
Yo
401
Є
404

2563
І
406
Ї
407

2566

2567

2568

2569

256A
Ґ
490

256C
©
A9

Kodlash KOI8-RU (Rus-Belarus-Ukraina)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F

A.

2550

2551

2552
e
451
є
454

2554
і
456
ї
457

2557

2558

2559

255A

255B
ґ
491
ў
45E

255E

b.

255F

2560

2561
Yo
401
Є
404

2563
І
406
Ї
407

2566

2567

2568

2569

256A
Ґ
490
Ў
40E
©
A9

Kod KOI8-C (Markaziy Osiyo)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8. ғ
493
җ
497
қ
49B
ҝ
49D
ң
4A3
ү
4AF
ұ
4B1
ҳ
4B3
ҷ
4B7
ҹ
4B9
һ
4BB

2580
ә
4D9
ӣ
4E3
ө
4E9
ӯ
4EF
9. Ғ
492
Җ
496
Қ
49A
Ҝ
49C
Ң
4A2
Ү
4AE
Ұ
4B0
Ҳ
4B2
Ҷ
4B6
Ҹ
4B8
Һ
4BA

2321
Ә
4D8
Ӣ
4E2
Ө
4E8
Ӯ
4EE
A.
A0
ђ
452
ѓ
453
e
451
є
454
ѕ
455
і
456
ї
457
ј
458
љ
459
њ
45A
ћ
45B
ќ
45C
ґ
491
ў
45E
џ
45F
b.
2116
Ђ
402
Ѓ
403
Yo
401
Є
404
Ѕ
405
І
406
Ї
407
Ј
408
Љ
409
Њ
40A
Ћ
40B
Ќ
40C
Ґ
490
Ў
40E
Џ
40F

KOI8-T kodlash (tojik)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8. қ
49B
ғ
493

201A
Ғ
492

201E

2026

2020

2021

2030
ҳ
4B3

2039
Ҳ
4B2
ҷ
4B7
Ҷ
4B6
9. Қ
49A

2018

2019

201C

201D

2022

2013
-
2014

2122

203A
A. ӯ
4EF
Ӯ
4EE
e
451
¤
A4
ӣ
4E3
¦
A6
§
A7
«
AB
¬
AC
­
AD
®
AE
b. °
B0
±
B1
²
B2
Yo
401
Ӣ
4E2

B6
·
B7

2116
»
BB
©
A9

KOI8-O, KOI8-S kodlash (slovyanska, eski imlo)

0407
.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F

8.
Ђ
0402
Ѓ
0403
¸
00B8
ѓ
0453

201E

2026

2020
§
00A7

20AC
¨
00A8
Љ
0409

2039
Њ
040A
Ќ
040C
Ћ
040B
Џ
040F

9.
ђ
0452

2018

2019

201C

201D

2022

2013

2014
£
00A3
·
00B7
љ
0459

203A
њ
045A
ќ
045C
ћ
045B
џ
045F

A.

00A0
ѵ
0475
ѣ
0463
e
0451
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
®
00AE

2122
«
00AB
ѳ
0473
ґ
0491
ў
045E
´
00B4

b.
°
00B0
Ѵ
0474
Ѣ
0462
Yo
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408

2116
¢
00A2
»
00BB
Ѳ
0472
Ґ
0490
Ў
040E
©
00A9

ISO-IR-111, KOI8-E kodlash

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F

A.

00A0
ђ
0452
ѓ
0453
e
0451
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
љ
0459
њ
045A
ћ
045B
ќ
045C
­
00 AD
ў
045E
џ
045F

b.

2116
Ђ
0402
Ѓ
0403
Yo
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408
Љ
0409
Њ
040A
Ћ
040B
Ќ
040C
¤
00A4
Ў
040E
Џ
040F

Kodlash KOI8-Unified, KOI8-F

KOI8-Unified (KOI8-F) kodlash Fingertip Software tomonidan targ'ib qilinadi.

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F

8.

2500

2502

250C

2510

2514

2518

251C

2524

252C

2534

253C

2580

2584

2588

258C

2590

9.

2591

2018

2019

201C

201D

2022

2013

2014
©
00A9

2122

00A0
»
00BB
®
00AE
«
00AB
·
00B7
¤
00A4

A.

00A0
ђ
0452
ѓ
0453
e
0451
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
љ
0459
њ
045A
ћ
045B
ќ
045C
ґ
0491
ў
045E
џ
045F

b.

2116
Ђ
0402
Ѓ
0403
Yo
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408
Љ
0409
Њ
040A
Ћ
040B
Ќ
040C
Ґ
0490
Ў
040E
Џ
040F

KOI-8 ning kirill bo'lmagan variantlari

REVning ba'zi mamlakatlarida lotin alifbosining milliy variantlari uchun KOI-8 modifikatsiyalari yaratilgan. Asosiy g'oya bir xil edi - sakkizinchi bit "ko'rilganda" matn ko'proq yoki kamroq tushunarli bo'lishi uchun aybdor.

- Xo'sh, boshlang! - dedi Doloxov.
- Xo'sh, - dedi P'êr, siz shunday kulasiz. - Qo'rqinchli edi. Uning o'ng tomonda ekanligi, bu juda oson boshlangani ko'rinib turardi, lekin odamlarning irodasiga bog'liq bo'lmagan o'z-o'zidan chiqib ketganidan hech narsa qo'rqishi mumkin emas edi va boshlash kichik edi. Denisov birinchi viyshov bar'eru oldidan va ovoz berdi:
- Oskylki raqiblari nomi ko'chib, keyin boshlash uchun yaxshi emas: to'pponcha olib va ​​bir so'z uchun va birlashish boshlash.
- G ... "az! Ikki! T" i! ... - jahl bilan Denisov va vídyyshov y bík baqirib. Hujumkorona, ular bir-birini tanigan tuman ichida, bosib o'tgan yo'llarda tobora yaqinlashishdi. Raqiblar mali to'g'ri, bar'eruga borib, agar xohlasangiz, otib tashlang. Doloxov to'pponchani ko'tarmasdan, uning raqibi qiyofasida yorqin, porloq, xira ko'zlaridan hayratda qoldi. Yogoning og'zi, tush kabi, mav o'z-o'zidan kulib.
- Xohlasam - otishim mumkin! — dedi P'erga, bu so'zni eshitgandan so'ng, qorli qor va qorli yo'ldan yugurib kelayotgan uchta gurkirash pishov. P'er to'pponcha bilan o'zini urmasligidan qo'rqib, o'ng qo'li bilan oldinga tortdi. Sharobning chap qo'lini tirishqoqlik bilan orqaga qo'yish, chunki men o'ng qo'lni ko'tarmoqchi edim va qila olmasligimni bilib oldim. Oltita yo'lni kesib o'tib, qorda so'qmoqlar bo'ylab tiqilib, P'er uning oyoqlariga qaradi, Doloxovga yana keskin qaradi va barmog'ini yogo kabi tortdi, vystriliv. Bunchalik kuchli ovozga qarshi bo'lmang, P'er uning zarbasidan titrab ketdi, so'ng o'zini mag'lubiyatga uchratib, tirjaydi. Dim, ayniqsa, tumanda zich, persha meteda zadavay yoma bachiti; lekin men boshqa hech narsa otib yo'q, Ba'zi Vin tekshirish uchun, u emas edi. Doloxovning kichkintoylari biroz yig'lashdi va Dima tufayli postga keldi. Bir qo'lim bilan levi tumshug'ini qidirib titrardim, ikkinchi qo'lim bilan to'pponchani pastga siqib qo'ydim. Yoga niqobi bulutli edi. Rostov pídbíg i schos sizga aytmoqda.
- Yo'q ... e ... t, - Doloxiv tishlarini tishladi, - yo'q, terisini yuvmadi, - va uning qorga tushib, shablonga tushib, qoyalarni yana chayqatib yubordi. Yogoning chap qo'li qonga belangan edi, surdutga sharobini artib, yashirdi. Yoga ko'rinishi oqarib ketgan, qovog'i burishgan va tremthylo edi.
- Mabut ... - Doloxovni boshladim, lekin bir lahzada emas, men tavba qilaman ... - zusilli sharobga rozi bo'lib, jingalak. P'êr, hech bo'lmaganda primuyuyuchi ridanya, Doloxovning oldiga yugurdi va Doloxovga o'xshab bar'êri qurilgan kenglikdan o'tishni xohladi: - Bar'êruga! - va P'er, nutq nima haqida ekanligini tushunib, uning naqshlari oq zupinivsya. 10 dan kam krokiv ularni oldi. Doloxov boshini qorga tushirdi, ochko'zlik bilan qorni tatib ko'rdi, boshini yana ko'tardi, silab, oyoqlarini ko'tardi va og'irlik markazini ko'tardi. Vín soxta sovuq qor va smoktav yoga; yoga tremtilini yo'q qiladi, lekin hamma kuladi; ko'zlar zusillis va qolgan tanlangan kuchlarning yovuzligi bilan porladi. Vín pídnyav pístolet men cílity bo'lib.
- Yon tomondan, to'pponcha bilan yoping, - dedi Nesvitskiy turtib bo'lgach.
- 3ak "kuting!" - o'zini ko'rsatmasdan, Denisovga raqibiga baqirdi.
P'êr ayyor jilmayish bilan afsusdaman va tavba qilaman, uyalmasdan oyoqlari va qo'llarini yoyib, Doloxovning oldida keng ko'kraklari bilan turib, yangisiga hayratda qoldim. Denisov, Rostov va Nesvitskiy turmush qurishdi. Shu zahotiyoq badbo'y hid sezilib, Doloxovning g'azablangan faryodi eshitildi.
- O'tgan! - qichqirdi Doloxov va ojiz holda qor ustiga yotdi. P'er boshining orqasiga o'ralib, orqasiga o'girilib, tulkilarga pishov qaradi, ko'p qor yog'ib xirillab, asossiz so'zlarni aytdi:
- Ahmoq... ahmoq! O'lim... bema'nilik... - jilmayishda davom eting. Nesvitsky Zupiny yoga va povyz uy.
Rostov Denisovdan yarador Doloxovga olib ketildi.
Doloxovning ko‘zlari yassilangan, chana yonida yotib, ovqatga bir og‘iz so‘z ham bermay imo-ishoralari sizni o‘zingdek talashdi; ale, Moskvaga borganingizdan so'ng, sizning oldingizga shoshilinch keldi va eng muhimi, boshingizni ko'tarib, Rostovni qo'lingizdan ushlab, o'zingiz uchun o'tirdingiz. Rostov butunlay o'zgarib, Doloxov qiyofasining pastki virazini to'xtovsiz bo'g'ib qo'ydi.
- Xo'sh, nima? o'zingizni qanday taniysiz? - so'radi Rostov.
- Yomon! lekin bu boylarda emas. Do'stim, - dedi Doloxov ovoz bilan, nega gapingizni bo'layapsiz, - de mi? Biz Moskvadamiz, bilaman. Men hech narsa emasman, lekin men mashinada yurdim, ichkariga kirdim... Men chiday olmadim. Von bunga chiday olmaydi...
- JSSV? - so'radi Rostov.
- Mening onam. Onam, farishtam, mening sevimli farishtam, onam va Doloxov Rostovning qo'lini mahkam siqib yig'lashdi. Agar siz biroz tinchlansangiz, Rostovga onangiz bilan yashayotganingizni, o'limga yordam berish uchun ona sifatida chiday olmasligingizni tushuntirgan bo'lsangiz. Vín baraka Rostov í̈hati uning oldida va íh tayyorlash.
Rostov, g'alaba qozonish uchun uning oldiga bordi va katta ajablanib, Doloxov, tsey buffon, ukasi Doloxov Moskvada keksa onasi va singlisi bilan tirikligini va u kenja o'g'li va ukasi ekanligini tan oldi.

Qolgan soatlarda men mulozimlar vech-na-vich bilan kamdan-kam bahslashardim. í Sankt-Peterburgda, va Moskvada í̈xníy budinok zavzhd buv povny mehmonlar. Vinolar duelidan keyingi kecha, tez-tez tortinchoq bo'lib, yotoqxonaga bormadi, balki o'zining ulug'vor, otasining kabinetida, xuddi graf Bezuxi vafot etgan joyda qoldi.
Vín divanda yotdi va uxlashni, u bilan bo'lgan hamma narsani unutishni xohladi, lekin Vín zarracha o'smadi. Qalbingizda shunday o'ylar, o'ylar bo'roni shiddat bilan ko'tarildiki, siz bir zum uxlamadingiz, lekin siz bir lahzaga ham erga o'tirmadingiz va divandan yig'ilib, xonani shvedlar bilan aylanib chiqdingiz. kroklar. Keyin u o'zining mehribonligi orqasida, ochiq yelkalari va beg'araz, xolis nigohi bilan ko'rindi va darhol unga Doloxovning qiyofasini, xuddi obidda va xuddi o'sha qiyofasini masxara qilib, arfaga qarashni buyurdi. Doloxov, oqartirilgan, uchta. ortiga o‘girilib, qorga tushganida, go‘yo azob chekdi.
"U nima edi? - O'ziga vino so'radi. - Men kohant haydadim, shuning uchun otryadimning bir kohantini o'ldirdim. Ha, shunday edi. Qarang, nima? Qanday qilib nimaga boraman? - U bilan do'stlashgan kishiga, - ichki ovoz eshitildi.
“Men nimada aybdorman? - vino ichish. - Sevmaydigan bilan do'stlashganga, o'zini va o'zini aldaganga - va siz to'satdan knyaz Vasilda kechgandan keyin bir necha so'z aytsangiz, chiqmaganingizni tasavvur qildingiz: "Maqsad qilaylik. [Men seni sevaman.] Hammasi! Men bu haqda o'yladim, o'yladim, o'yladim, bu mening huquqim yo'qligini o'yladim. Va shunday bo'ldi." Vín eng yaxshi omad da asal oyi va chervonív taxmin. Ayniqsa, chaynalgan, yangi do'st uchun majoziy va jirkanch, xuddi bir marta, do'stligidan keyin hech qanday muammosiz, 12 yilligi munosabati bilan sharob, yotoqxonadan ofisga va ofisga tikuv xalatida kelganlar haqida. boshning bosh postlaridan, go'yo shanobly egilib, P'êra qiyofasiga, uning xalatiga hayron bo'lib, bir oz kulib, níbi o'z direktorining baxt sadosi bilan jilmayib yurar edi.
“Va men uni necha marta yozganman, uni ajoyib go'zallik, dunyoviy xushmuomalalik, sharob o'ylash bilan yozganman; Butun Peterburgni olgan budinka bilan yozar, o'sha go'zal go'zallik bilan yozar edi. Xo'sh, men nima haqida yozyapman?! Men shunchaki tushunmayapman deb o'yladim. Qanchalik tez-tez, vv xarakter haqida o'ylab, men o'zimni aybdor ekanligimni ko'rsatdim, men tushunmadim, kundalik xotirjamlik, mamnunlik va har qanday moyillik va bazan mavjudligini tushunmadim va butun yechim bunda edi. dahshatli so'z, u bema'ni ayol: o'zingizga dahshatli so'z aytdi va hamma tushundi!
“Anatol uning oldiga bordi, tiyinlarini tiklab, yalang yelkalaridan o'pdi. Von unga bir tiyin ham bermadi, balki o'pishga ruxsat berdi. Batko, zhartom, zbudzhuvav vv rashk; u rashk qilish kerak, deb u qadar yomon emas, deb xotirjam tabassum bilan dedi: nima xohlasangiz, uyalmang, men haqimda dedi. Men a kabi energiya ayting, chi buni behudalik belgisi sifatida ko'rmayapman. Vona masxara bilan kulib, yomon emasligini, farzandli onalari bo'lishi kerakligini, mening ko'z o'ngimda farzand ko'rmasligini aytdi.
Keyin biz katta aristokratik ustunda tebranishlarni hurmat qilmasdan, virazívning qo'polligi, ravshanligi va qo'polligini taxmin qildik. "Men ahmoq emasman... borib o'zingiz sinab ko'ring... allez vous promener", dedi u. Ko'pincha, keksalar, yoshlar va ayollarning ko'z o'ngida muvaffaqiyatga hayron bo'lgan P'er nima uchun sharobni yoqtirmasligini tushunolmasdi. Men o'zimni P'êr ko'rsatganimdan so'ng, men hech qanday tarzda vvni sevmayman; Men uning o'zimning aybimni takrorlaydigan, lekin bu haqda bilishni ovora ayol ekanligini bilardim.

Bugun biz siz bilan ular haqida gaplashamiz, yulduzlar sayt va dasturlarda stenografiya sifatida olinadi, matnni qanday kodlash va ularni qanday kuzatish mumkin. Biz asosiy ASCII dan boshlab, shuningdek CP866, KOI8-R, Windows 1251 ning kengaytirilgan versiyalari va Unicode konsortsiumi UTF 16 va 8 ning joriy kodlashi bilan yakunlangan ularning rivojlanish tarixi haqida xabar beramiz. Tahrirlash: Kimga siz uyga tashrif buyurishingiz mumkin, lekin siz yana qancha o'sha krakozyabrivni eyishga kelishim mumkinligini bilasiz, vilizlih osilib turadi (belgilar to'plami bilan o'qib bo'lmaydi). Endi men ushbu nizomlarning matniga hamma narsani aytib berish va sizning jamblaringizni mustaqil ravishda tartibga solish imkoniyati haqida o'ylayapman. Xo'sh, ma'lumotni olishga tayyor bo'ling va yangiliklarning tarqalishini kuzatib borishga harakat qiling.

ASCII - lotin uchun asosiy matn kodlash

Matnlarni kodlashni ishlab chiqish IT galereyasini qoliplashdan bir vaqtning o'zida amalga oshirildi va bir soat ichida chimalih o'zgarishlarini tanib oldi. Tarixiy jihatdan hamma narsa rus tilida shirin bo'lmagan EBCDIC bilan amalga oshirila boshlandi, chunki u lotin alifbosi harflarini, arab raqamlarini va tinish belgilarini boshqaruvchi belgilar bilan kodlash imkonini berdi. Ammo baribir, warto matnlarini zamonaviy kodlashni rivojlantirish uchun to'g'ri nuqta mashhur ASCII(Axborot almashish uchun Amerika standart kodeksi, rus minasi "asky" kabi eshitiladi). Von eng ko'p yoziladigan ingliz harflarining birinchi 128 ta belgisini - lotin harflari, arab raqamlari va turli xil belgilarni tasvirlaydi. Batafsil qi 128 belgilari, ASCII tasvirlangan, kshtalt kamon ustida deaki xizmat belgilarini ishlatiladi, panjara, ingichka tikilib. Vlasne, siz o'zingiz qilishingiz mumkin:
Asl ASCII variantidagi 128 ta belgining o'zi standart bo'lib qoldi va ularning tilida har qanday boshqa tarzda kodlangan bo'lsa, ular shu tartibda yoqimsiz hidga arziydi. O'ng tomonda, bir bayt ma'lumot uchun 128 emas, balki 256 xil qiymatni (ikkitasi eng yuqorisi 256 ga teng) kodlash mumkin, buning uchun asosiy versiyaga amal qiladi. Aska, butun qator paydo bo'ldi ASCII kodlash kengaytmalari, buning uchun milliy kodlash belgilarini kodlovchining 128 ta asosiy belgilariga ega bo'lish mumkin (masalan, rus). Bu erda, qo'shiq bilan, bir soatlik tavsif uchun vikoristovuyutsya kabi raqamlar tizimi haqida bir oz ko'proq gapirish kerak. Birinchidan, barchangizga ma'lumki, kompyuter faqat ikkita tizimdagi raqamlar bilan ishlaydi, o'zi esa nollar va birlar bilan ishlaydi ("Mantiqiy algebra", xuddi siz kollej yoki maktabga borgandek). Bir bayt sakkiz bitdan iborat bo'lib, ularning har biri noldan boshlab ikki bosqichli va somyda ikkitagacha:
Bunday dizayndagi nol va birlarning barcha mumkin bo'lgan kombinatsiyalari 256 dan kam bo'lishi mumkinligini tushunish muhim emas. Raqamni ikkita tizimdan o'ninchiga aylantirish oson. Yakkama-yakka turish uchun ikkalasining barcha qadamlarini shunchaki katlash kerak. Bizning dumbamiz 1 (nol qadamda 2) plyus 8 (3 bosqichda ikkita), ortiqcha 32 (beshinchi bosqichda ikkita), ortiqcha 64 (oltinchida), ortiqcha 128 (oltinchi bosqichda) chiqadi. Darhol men o'ninchi raqamlar tizimidan 233 ni olaman. Yak bachite, hamma narsa oddiyroq. Ammo agar siz ASCII belgilar bilan jadvallarni ko'rib chiqsangiz, ular o'n oltita kodlashda taqdim etilganligini bilib olasiz. Masalan, Ascidagi "zirochka" o'n oltinchi 2A raqamiga to'g'ri keladi. Shubhasiz, siz o'n oltinchi tizimda arab raqamlaridan tashqari g'olib raqamlar va A (o'n ma'nosi) dan F (o'n besh)gacha ko'proq lotin harflari mavjudligini ko'rishingiz mumkin. Xo'sh, eksa, uchun ikkita raqamni o'n oltiga aylantirish haqoratli oddiy va ilmiy yo'l uchun vdayutsya. Yuqoridagi skrinshotda ko'rsatilganidek, ma'lumotlarning teri baytlari bitlar soniga ko'ra qismlarga bo'linadi. Bu. baytning yarmi terisida ikkita kod faqat o'n oltita qiymatni (to'rtinchi bosqichda ikkitasi) kodlashi mumkin, uni o'n olti raqam bilan osongina aniqlash mumkin. Bundan tashqari, baytning chap yarmida sahnani skrinshotda ko'rsatilgandek emas, balki noldan tiklash kerak bo'ladi. Natijada, oddiy hisob-kitobdan foydalanib, biz E9 raqami skrinshotda kodlanganligini hisobga olamiz. Ishonchim komilki, mening tushunmovchiliklarim va bu jumboqning yechimi sizni yoritib berdi. Xo'sh, keling, matnni kodlash haqida gapiraylik.

CP866 va KOI8-R-ni psevdografika bilan kodlovchi Ask-ning kengaytirilgan versiyalari

Keyinchalik biz barcha zamonaviy kodlarni (Windows 1251, unicode, UTF 8) ishlab chiqish uchun boshlang'ich nuqta bo'lgan ASCII haqida gapira boshladik. Lotin alifbosining 128 dan ortiq belgilari, arab raqamlari va boshqalar, ammo kengaytirilgan versiyada ma'lumotlarning bir baytida kodlanishi mumkin bo'lgan barcha 256 qiymatni birlashtirish mumkin edi. Tobto. Asuka o'z tilidagi harfning belgilarini qo'shish mumkin bo'ldi. Bu erda siz yana gapirishingiz, tushuntirishingiz kerak bo'ladi matnlarni kodlash uchun yangi ehtiyojlar va nima uchun bu juda muhim. Kompyuteringiz ekranidagi belgilar ikkita nutq asosida shakllanadi - kuchli belgilarning vektor shakllari to'plami (tashqi ko'rinishi) (kompyuteringizda o'rnatilgan shriftli fayllarda hidlar mavjud) shrift) sizga kerak bo'lgan bir xil belgi. kerakli joyga kiritish uchun. Men tushundimki, shriftlar vektor shakllari uchun, kodlash o'qi esa operatsion tizim va unda ishlatiladigan dasturlar uchun ishlatiladi. Tobto. Agar kompyuteringizda biron bir matn mavjud bo'lsa, u baytlar to'plami bo'ladi, teri kodlashlari matnning o'zida bitta belgiga ega. Ekranda matnni ko'rsatadigan dastur (matn muharriri, brauzer va boshqalar), kodni tahlil qilishda qora belgining kodlanishini o'qiydi va kerakli fayl shriftida to'g'ri vektor shaklini qidiradi, bu ulanishni ko'rsatish uchun. berilgan matnli hujjat. Hamma narsa juda oddiy. Shunday qilib, bizga kerak bo'lgan har qanday belgini (masalan, milliy alifbodan) kodlash uchun siz faqat ikki marta o'ylab ko'rishingiz mumkin - bu belgining vektor shaklini kodlaydigan shrift uchun ayblash kerak va butun belgi kengaytirilgan shaklda kodlanishi mumkin. Bir baytda ASCII kodlash. Shuning uchun bunday variantlar juda muhimdir. Faqat kengaytirilgan Askaning ruscha original kilkidagi belgilarni kodlash uchun. Misol uchun, u boshoqda paydo bo'ldi CP866, qaysidir ma'noda rus alifbosining ramzlari va ASCII ning kengaytirilgan versiyasini g'alaba qozonish mumkin edi. Tobto. Yuqori qismi asosan Aska ning asosiy versiyasidan iborat edi (lotin tilida 128 ta belgi, raqamlar va boshqa axlatlar), chunki u tepada joylashgan uchta skrinshotda ko'rsatilgan va o'q allaqachon CP866 kodlash belgilari bilan jadvalning pastki qismidir. (Ruscha harflar va u erda har xil psevdografiya):
Bachite, raqamlar o'ng ustun uchun 8 dan boshlanadi, chunki 0 dan 7 gacha bo'lgan raqamlar ASCII asosiy qismidan oldin ko'rinadi (birinchi skrinshot bo'limi). Bu. Matnda paydo bo'lishi uchun CP866 matematik kodidagi ruscha "M" harfi 9S. Tovushlar shunday miqdordan keldi CP866 da psevdografiya? Bu erda shuni ta'kidlash kerakki, rus tilidagi matnni kodlash, agar hozirgidek grafik operatsion tizimlarning bunday kengayishi mavjud bo'lsa, yanada ixtiyoriy ravishda kengaytirilgan. Va Dosi-da va unga o'xshash matnli operatsion tizimlarda psevdografiya matnlarning biroz qonuniy dizayniga ruxsat berdi va buning uchun CP866 va boshqa barcha tengdoshlari Ask-ning kengaytirilgan versiyalari toifasidan tozalandi. CP866 IBM tomonidan ishlab chiqilgan, ammo rus tilidagi belgilar uchun bir qator kodlar ham kengaytirilgan, masalan, bir xil turdagi (ASCII kengaytmalari) ko'rish mumkin. KOI8-R:
vv roboti printsipi ilgari CP866 tomonidan tasvirlangan bir xilda qoldi - matnning teri belgisi bitta bayt bilan kodlangan. Skrinshotda KOI8-R jadvalining yana bir yarmi ko'rsatilgan, chunki birinchi yarmining birinchi yarmi ushbu maqolaning birinchi skrinshotida ko'rsatilganidek, asosiy So'rovga asoslangan. KOI8-R kodlash xususiyatlaridan biri shuni ta'kidlash mumkinki, jadvaldagi rus harflari alifbo tartibida emas, masalan, ular CP866 da yozilgan. Agar siz birinchi skrinshotga qarasangiz (asosiy qism, barcha kengaytirilgan kodlashni qanday kiritish kerak), keyin KOI8-R da rus harflari jadvalning bir xil o'rtasida tartiblanganligini, lotin alifbosi harflari qatorida joylashganligiga e'tibor bering. jadvalning birinchi qismi. Jami bitta urish (ettinchi bosqichda ikkitasi yoki 128) berish uchun rus ramzlaridan lotin usuliga o'tishning ravshanligi uchun hamma narsa buzildi.

Windows 1251 - ASCII ning joriy versiyasi

Matn kodining keyingi rivojlanishi grafik operatsion tizimlarning ommalashib borayotganligi va tez orada ularda psevdografiyadan foydalanish zarurati paydo bo'lishi bilan bog'liq edi. Natijada, guruh nomi, o'z hikoyasiga kelsak, avvalgidek, Askning kengaytirilgan versiyasi edi (matnning bir belgisi bir baytdan ortiq ma'lumot bilan kodlangan), ammo psevdografik belgilarni tanlamasdan. . Hidi Amerika Standartlar Instituti tomonidan ajratilgan ANSI kodlari deb ataladigan narsaga to'g'ri keldi. Kirill alifbosining nomi ham rus tilini qo'llab-quvvatlagan variant uchun tanlangan. Buning dumbasi buti mumkin Windows 1251. Vaughni vigid vi-nikoristovynaya yaralangan yaralangan CP866 I KOI8-R Tim, Scho Mass belgisi psevdografik nii belgilarining ramzi qarz oldi va bir xil, so'zlarning so'zlari blizis yilda vikoristovy. d.). ):
Rus tilini juda ko'p kodlash orqali, shrift turlari va dasturiy ta'minot turlari orasida biz doimiy ravishda sarlavhani ko'tarib turdik va biz bilan, siz, o'quvchilarning qo'shiqlari, ko'pincha o'zingizning achchiqligingizdan foydalanasiz. krakozyabri, matnda g'olib bo'lgan versiya bilan adashgan bo'lsa. Дуже часто вони вилазили при надсиланні та отриманні повідомлень електронною поштою, що спричинило створення дуже складних перекодувальних таблиць, які, власне, вирішити цю проблему докорінно не змогли, і найчастіше користувачі для листування використовували трансліт латинських літер, щоб уникнути горезвісних кракозябрів при використання російських кодувань подібних CP866, KOI8-R yoki Windows 1251 gacha. Aslida, ruscha matnni almashtirish uchun foydalanilgan xatolar, matnli bildirishnoma kodlangan bo'lib, u paydo bo'lmaganidek, berilgan filmni noto'g'ri kodlash natijasidir. Bu qabul qilinadi, go'yo CP866 yordami uchun kodlangan belgilar, Windows 1251 kod jadvaliga taqlid qilishga harakat qiling yoki xabarnoma matnini o'zi bilan almashtirib, yozing (ahmoqona terish belgilar) va vilizut.
Shunga o'xshash vaziyat ko'pincha veb-saytlar, forumlar yoki bloglarni yaratish va yaratishda ayblanadi, agar ruscha belgilar bilan matn noto'g'ri kodlashda kechirilsa, go'yo u saytda zamochuvannyam uchun yoki noto'g'ri matn muharririda yozilgan bo'lsa, bu emas. kodning xatosini men tinimsiz ko'z bilan ko'raman. Shaxssiz coduvans va krakozyabry bilan bunday vaziyat, doimiy ko'tarilish, boy nabridla, yangi universal o'zgarishlar yaratish oldin ularning fikrlarini o'zgartirish paydo bo'ldi, go'yo u o'zi bilan hamma narsani o'rniga va virishila b, hal, muammoning ildizida. matndan. Xitoy tiliga o'xshash til muammosi Qrimga asoslangan edi, ammo tilning ramzlari boyroq, pastroq 256 edi.

Unicode (Unicode) - universal kodlash UTF 8, 16 va 32

ASCII ning kengaytirilgan versiyalarida belgilarni kodlash uchun ko'rilgan ma'lumotni bir baytda tasvirlab bo'lmaydi. Natijada nomi ostida konsorsium tuzildi Unicode(Unicode - Unicode Consortium) spívpratsi bagatioh IT sohasi yetakchilari uchun (men, dasturiy ta'minotni ishlab chiquvchi, kim zalizo kodlari, shriftlarni yaratuvchi), matn uchun universal kodlash paydo bo'lishi natijasida. Unicode konsorsiumi ostida joriy qilingan birinchi variatsiya bula edi UTF-32. Kodlash nomidagi raqam bitlar sonini bildiradi, ya'ni bitta belgi kodlash uchun qanday yutish mumkin. 32 bit yangi universal UTF kodlashda bitta belgini kodlash uchun zarur bo'lgan 4 baytgacha ma'lumotni qo'shadi. Natijada, matn bilan bir xil fayl, ASCII ning kengaytirilgan versiyasida va UTF-32 da kodlanadi, qolgan hollarda Chotiri uchun ko'proq kengayish (ahamiyat) mavjud. Bu yomon, lekin endi biz UTF yordami uchun boshqa o'ttiz qadamda ikkitaga yaxshi bo'lgan belgilar sonini kodlash imkoniga egamiz ( milliardlab belgilar, yakí nakriyut be-yak, albatta, ulkan zahira bilan zarur qiymat). Ale Bagan, Buyuk Movari Guruhlar Mamlakati Buyuk Kilkíst belgisidir Vikoristovati yilda codovanniym Men non-chisel pishirib yo'q, millat-nika teg teglar da prote, va najot qilinmoqda natijada. Bu boy va bunday pulni behuda sarflashga hech kim yo'l qo'yib bo'lmaydi. Unicode ishlab chiqilgandan so'ng paydo bo'ldi UTF-16, Yaka vyyshla nastylki masofada, biz vikoristovuyutsya kabi, barcha ramzlar uchun asosiy kenglik sifatida umovchannyam uchun olingan scho bula. Bitta belgini kodlash uchun ikkita bayt mavjud. Keling, narsalar qanday ko'rinishiga hayron bo'laylik. Windows operatsion tizimida siz "Ishga tushirish" - "Dasturlar" - "Aksessuarlar" - "Xizmatlar" - "Symbol jadvali" yo'lidan o'tishingiz mumkin. Natijada, tizimingizda o'rnatilgan barcha shrift tizimlarining vektor shakllari bilan jadval ko'rsatiladi. Agar siz "Qo'shimcha parametrlar"da Unicode belgilarni tanlasangiz, teri shrifti uchun barcha belgilar oralig'idan, shu jumladan, yangisigacha foydalanishingiz mumkin. Nutqdan oldin, ulardan birortasini bosish orqali siz ikki baytli yogo kuylashingiz mumkin UTF-16 format kodi, O'n to'rt o'n olti raqam bilan nima qo'shiladi:
UTF-16 da 16 bit yordamida qancha belgilarni kodlash mumkin? 65536 (o'n olti qadamda ikkita) va raqamning o'zi Unicode-da asosiy bo'sh joy sifatida olingan. Krim tsgogo, unga yordam va yaqin ikki millionyv znikiv uchun zakoduvati uchun isnuyut yo'llari, ale obmezhilis matnda million ramzlari keng kenglik. Afsuski, kodlashning Unicode versiyasi, masalan, dasturni faqat ingliz tilida yozganlarni unchalik mamnun qilmadi, chunki ular ASCII ning kengaytirilgan versiyasidan UTF-16 ga o'tgandan so'ng, ularning hujjatlari ikki baravar ko'paydi (har bir belgi uchun bir bayt). Asc i da UTF-16 da bir xil belgi uchun ikki bayt). Unicode konsorsiumidagi hamma va hamma narsani qondirish uchun u bekor qilindi kodni o'ylab toping hayotning o'zgarishi. UTF-8 deb nomlangan. Ismning yuqori qismini ushlang, men dovjinani o'zgartirishim mumkinligi to'g'ri, tamom. Matnning teri belgisi birdan olti baytgacha bo'lgan belgilar ketma-ketligida kodlanishi mumkin. Amalda, UTF-8 faqat birdan to'rt baytgacha bo'lgan diapazonga ega, shuning uchun bir necha bayt kod uchun biror narsani ochish nazariy jihatdan mumkin emas. Undagi barcha lotin belgilar eski ASCII-dagi kabi bir baytda kodlangan. Shunisi e'tiborga loyiqki, faqat lotin tilini kodlash davrida Unicode-ni tushunmaydigan navit dasturlari, UTF-8-da kodlanganlarni o'qiydi. Tobto. Asci-ning asosiy qismi hozirgina Unicode konsorsiumining miyasiga o'tdi. UTF-8 dagi kirillcha belgilar ikki baytda, masalan, gruzincha belgilar uch baytda kodlangan. Unicode konsortsiumi UTF 16 va 8 yaratilganidan keyin asosiy muammoni hal qildi - endi bizda bor shriftlar bitta kod maydonidan foydalanadi. Va endi ularning kotiblari o'zlarining kuchlari va matndagi belgilarning vektor shakllarini to'ldirish qobiliyatidan boshqa narsaga ega emaslar. Kursni "Rimlar jadvali" ustiga olib borishda turli shriftlar belgilar sonini ta'kidlashi aniq. Ko'pgina belgilar Unicode shriftlari hatto munosib darajada muhim bo'lishi mumkin. Lekin hozir hidlar ular tomonidan ko'rib chiqilmaydi, ular turli xil kodlash uchun yaratilgan, lekin yozish orqali, yozuv mashinkasi shriftni to'ldirgan yoki bitta kod maydonini oxirigacha to'ldirish orqali emas.

Krakozyabri zamíst rosíyskih harflar - yak vipraviti

Keling, ular krakozyabri matnini qanday o'zgartirishi kerakligini, aks holda rus tilidagi matn uchun to'g'ri kodlashni qanday tanlashni bilib olaylik. Xo'sh, u o'sha dasturda o'rnatiladi, unda siz matnni tahrirlashingiz yoki turli matn qismlari uchun kod yaratasiz. Matnli fayllarni tahrirlash uchun bu ayniqsa yaxshi, menimcha, Html va PHP muharriri Notepad ++. Vím, vín yuzdan ortiq yaxshi dasturlash va tartibning sintaksisini o'zgartirishi mumkin, shuningdek, qo'shimcha plaginlar uchun kengaytirilishi mumkin. Yordam uchun mo''jizaviy dasturning hisobot sharhini o'qing. Notepad ++ ning yuqori menyusida "Kod" bandi mavjud bo'lib, siz blokirovka qilish uchun saytingizda mavjud bo'lgan variantni o'zgartirishingiz mumkin:
Joomla 1.5 va undan yuqori versiyalaridagi saytlar, shuningdek WordPress-dagi bloglar uchun variantni tanlash uchun qisqartmalar ko‘rinishiga rioya qiling. BOMsiz UTF8. BOM prefiksi nima? O'ng tomonda, agar UTF-16 kodlash buzilgan bo'lsa, uni shunday ibora bilan bog'lash mumkin edi, chunki to'g'ridan-to'g'ri ketma-ketlikda bo'lgani kabi belgining kodini yozish mumkin (masalan, 0A15). ), shuning uchun teskari (150A). Va dasturlar tushunishi uchun ketma-ketlikda kodni o'qib chiqing va o'ylab toping BOM(Bayt tartibi belgisi yoki boshqacha qilib aytganda, imzo), bu hujjatlar to'plamiga uchta qo'shimcha bayt qo'shilishida namoyon bo'ladi. UTF-8 kodlashda hech qanday BOM Unicode konsortsiumiga o'tkazilmadi va unga imzo qo'shildi (hujjatga eng muhim uchta bayt qo'shilgan) bunday dasturlarga ular shunchaki kodni o'qishlari kerak. Shuning uchun, agar siz fayllarni UTF bilan saqlasangiz, BOMsiz (imzosiz) variantni tanlashingiz mumkin. Bu martabada siz uzoqdasiz o'zingizni vilaza krakozyabriv bilan ta'minlang. Shunisi e'tiborga loyiqki, Windows-dagi ba'zi dasturlar bu ishni bajara olmaydi (UTF-8-dan matnni BOMsiz saqlay olmaydi), masalan, xuddi shu baxtsiz Windows Notepad. Vín hujjatni UTF-8 dan oladi, lekin baribir kobga imzo qo'shadi (uchta qo'shimcha bayt). Bundan tashqari, bu baytlar yagona bo'ladi - kodni to'g'ridan-to'g'ri ketma-ketlikda o'qing. tsyu dríbnitsyu orqali serverlarda Ale muammoni ayblashi mumkin - vilizu krakozyabri. Shunday qilib, har qanday vaqtda ajoyib Windows bloknotiga aldanmang saytingizdagi hujjatlarni tahrirlash uchun, shuning uchun siz noaniqliklar paydo bo'lishiga qarshi emassiz. Eng qisqa va eng oddiy variantda men Notepad ++ muharriridan foydalanaman, u amalda qisqa bo'lishi mumkin emas va ba'zi afzalliklardan iborat. Notepad ++ yordamida kodlashni tanlashda siz matnni o'z mohiyatiga ko'ra Unicode standartiga yaqinroq bo'lgan UCS-2 kodlashiga aylantirishingiz mumkin bo'ladi. Notepad matnni ANSI-da ham kodlashi mumkin, shuning uchun. Biz allaqachon Windows 1251 uchun ba'zi rus filmlarini tasvirlab berdik. Siz biron bir ma'lumot olasizmi? U Windows operatsion tizimingiz reestrida ro'yxatdan o'tgan - ANSI turidan tanlash uchun kodlash kabi, OEM vaqtini tanlash kabi (rus filmi uchun u CP866 bo'ladi). Agar siz reklama uchun boshqa tilni kompyuteringizga o'rnatgan bo'lsangiz, kodlash o'z filmingiz uchun bir xil ANSI yoki OEM kodi bilan almashtiriladi. Bundan tashqari, agar siz hujjatni Notepad++ dasturida kerakli koddan saqlasangiz yoki tahrirlash uchun saytdan hujjatni ochsangiz, tahrirlovchining pastki o'ng burchagiga nom qo'shishingiz mumkin: Shchob niknut krakozyabriv, yuqoridagi tavsiflardan tashqari, server yoki mahalliy xost firibgarni ayblamasligi uchun saytning barcha tomonlari chiqish kodining sarlavhasiga kodlashning o'zi haqida ma'lumot yozish to'g'ri bo'ladi. Vzagali, Html creme gipermatnli maketning barcha filmlarida maxsus ovozli xml mavjud bo'lib, unda matn kodlash ko'rsatilgan.< ? xml version= "1.0" encoding= "windows-1251" ? >Avvalo, kodni tahlil qiling, brauzer g'olibning qaysi versiyasidan foydalanilayotganini va filmdagi belgilar kodini qanday izohlash kerakligini bilib oladi. Shuni ham yodda tutingki, agar siz hujjatni standart unicodedan saqlasangiz, xml noaniqligini o'tkazib yuborishingiz mumkin (kodlash UTF-8 da bo'ladi, bu BOM emas yoki UTF-16, ya'ni BOM ê). Html kino hujjatini kiritish vaqtida kodlash o'zgartiriladi Meta elementi, bu egri va yopiladigan Head tegi orasiga yoziladi: < head> . . . < meta charset= "utf-8" > . . . < / head>Ushbu yozuv Html 4.01 standartida qabul qilinganidek qattiq qayta ko'rib chiqilgan, ammo u asta-sekin joriy etilayotgan yangi Html 5 standartiga yangilanadi va sizni hozirda g'olib bo'lgan brauzerlar to'g'ri tushunishadi. Fikr sifatida, hujjatning Html kodlashidagi Meta elementi qisqaroq bo'ladi yakomoga hujjat sarlavhasida yuqoriroq, shuning uchun birinchi belgi matnida yozish paytida asosiy ANSI emas (u har doim va har qanday o'zgarishlarda to'g'ri o'qilganidek), brauzer allaqachon ushbu belgilarning kodlarini qanday izohlash haqida ona ma'lumoti uchun javobgardir. . Posilannya eng uzoqda

© 2022 androidas.ru - Android haqida hamma narsa