KOI8-R kodlaması. KOI8-R için kodlama nedir ve ne verdi? 8 harf için kodlama tablosu

Golovna / Corisna bilgileri

- Czampolit (@ComradZampolit) 17 Eylül 2017

KOI8-R nasıl uygulanır?

KOI8-R, Kiril alfabelerinin harflerini kodlamak için bölünmüş sekiz bitlik bir kod sayfasıdır. Perakendeciler, Rus alfabesinin sembollerini, Kiril sembollerinin konumları, tablonun altındaki İngiliz alfabesindeki fonetik karşılıklarıyla eşleşecek şekilde düzenlediler. Ve bu kodda yazılan metinde, cilt sembolünün sekiz bitini çıkarın, o zaman Latin harflerindeki harf çevirisine benzer şekilde metin çıkacaktır.

Bilgi alışverişi için böyle bir kod, ЄС EOM serisinin bilgisayarlarında yetmiş yıl içinde durgundu ve on sekizinci yılın ortasında ilk Ruslaştırılmış versiyonlarda kazanmaya başladılar. işletim sistemi UNIX.

Cilt sembolüne benzersiz bir kod atandığına inanılıyordu: 00000000'den 11111111'e. Bu şekilde, kişi haç ve bilgisayar için sembolleri - kodları için ayırt etti.

Chi vikoristovuetsya aynı zamanda Chernov'u kodluyor mu?

Ni. Vaughn bula eski sekiz bit bilgisayarlarla ilgilidir, aynı zamanda Unicode'u farklı formatlarda kullanmak daha önemlidir.

Merhaba, blog sitesinin yeni okuyucuları. Bugün sizlerle, site ve programlarda yıldızların stenografi olarak alındığı, metinlerin nasıl kodlanacağı ve nasıl izleneceği hakkında konuşacağız. Temel ASCII'nin yanı sıra CP866, KOI8-R, Windows 1251'in genişletilmiş sürümleriyle başlayan ve Unicode konsorsiyumu UTF 16 ve 8'in mevcut kodlamasıyla biten gelişimlerinin tarihini rapor ediyoruz.

Kimi ziyaret edebilirsin, ama aynı krakozyabriv'i yemeye daha ne kadar gelebileceğimi bilirsin (bir dizi karakter okumaz). Artık tüm makaleleri metne gönderme ve sövelerimi bağımsız olarak inceleme fırsatım olacak. Pekala, bilgileri almaya hazırlanın ve haberlerin yayılmasını takip etmeye çalışın.

ASCII - latin için temel metin kodlaması

Metinlerin kodlanmasının geliştirilmesi bir anda BT galerisinin kalıplanmasından yapıldı ve pis koku, bir saat içinde chimalih değişikliklerinin tanınmasını sağladı. Tarihsel olarak her şey, Latin alfabesinin harflerinin, Arap rakamlarının ve noktalama işaretlerinin siyah karakterlerle kodlanmasına izin verdiği için Rus dilinde kulağa hoş gelmeyen EBCDIC ile başladı.

Ancak yine de, varto'daki metinlerin modern kodlanmasının geliştirilmesi için doğru nokta ünlüdür. ASCII(Bir Rus madeni “asky” gibi ses çıkardığından, Bilgi Değişimi için Amerikan Standart Kodu). Vaughn, ilk 128 sembolü en sık yazılan İngilizce koristuvach'larla - arap rakamları ve işaretleri - tanımlar.

ASCII'de açıklanan 128 işarette daha fazlası, kshtalt kemeri, ґrat, zirochok üzerinde ince servis sembolleri deaks kullandılar. Vlasne, sen kendin yapabilirsin:

ASCII koçanı varyantından gelen 128 karakter standart hale geldi ve dillerinde başka herhangi bir şekilde kodlanmışlar, bu sırayla kokuya değer.

Sağdaki Ale, bir baytlık bilgi yardımı için 128 değil, 256 farklı değeri (ikisi en yüksek 256'ya eşittir) kodlamak mümkündür, ardından aşağıdaki temel sürüm Askі z'yavivsya tsіli satır ASCII kodlama uzantıları, Ulusal kodlamanın sembolleri için kodun 128 temel işaretini oluşturmanın mümkün olduğu (örneğin, Rusça).

Burada, tek tek, açıklamada muzaffer olan sayı sistemleri hakkında söylenecek biraz daha fazla şey var. Birincisi, hepinizin bildiği gibi, bilgisayar sadece iki sistemdeki sayılarla çalışır ve kendisi sıfırlar ve birlerle ("Boole cebiri", sanki koleje veya okula gitmişsiniz gibi). , sıfırdan başlayarak iki adımda ve somy'de ikiye kadar olan kaplamalar:

Böyle bir tasarımdaki tüm olası sıfır ve bir kombinasyonlarının 256'dan az olabileceğini anlamak önemli değildir. Sayıyı iki sistemden onuncuya dönüştürmek kolaydır. Üzerinde tek başına durmak için ikisinin tüm adımlarını basitçe katlamak gerekir.

Popomuz 1 (sıfır adımda 2) artı 8 (3 adımda iki), artı 32 (beşinci adımda iki), artı 64 (altıncı adımda) artı 128 (altıncı adımda) çıkıyor. hepsini bir araya getirin 233 on sistem sayılar. Yak bachite, her şey daha basit.

Ancak, ASCII karakterli tablolara bakarsanız, on altıncı kodlamada sunulduğunu anlarsınız. Örneğin, "zіrochka" vіdpovіdaє On altıncı sayı 2A'ya sorun. Şüphesiz, on altıncı sistemde Arap rakamlarına ek olarak muzaffer sayıların ve A'dan (on anlamına gelir) F'ye (on beş anlamına gelir) kadar daha fazla Latin harflerinin olduğunu görebilirsiniz.

Peki, eksen, için tercüme çift ​​sayı on altıncı yüzyılda vdayutsya saldırgan basit ve bilimsel bir şekilde. Dış görünüm baytları, yukarıdaki ekran görüntüsünde gösterildiği gibi, bit sayısına göre parçalara ayrılır. dahil cilt yarım bayt çift ​​kod on altıncı bir sayı ile kolayca ortaya çıkarılabilen yalnızca on altı değeri (dördüncü adımda iki) kodlayabilirsiniz.

Ayrıca, baytın sol yarısında, adımın ekran görüntüsünde gösterildiği gibi sıfırdan sıfırlanması gerekecektir. Sonuç olarak, basit bir hesaplama ile ekran görüntüsünde E9 sayısının kodlanmış olduğunu çıkarıyoruz. Eminim ki yanlış anlamalarım ve bu bulmacanın çözümü size mantıklı geldi. Şimdi devam edelim, metni kodlama hakkında konuşalım.

Aska'nın genişletilmiş sürümleri - CP866 ve KOI8-R'yi pseudographics ile kodlama

Daha sonra tüm modern kodların (Windows 1251, unicode, UTF 8) geliştirilmesinin başlangıç ​​noktası olan ASCII'den bahsetmeye başladık.

Latin alfabesinin 128'den fazla karakteri, Arap rakamları ve daha fazlası, ancak genişletilmiş sürüm, bir bayt bilgide kodlanabilen 256 değerin tümünü birleştirme yeteneğine sahiptir. Tobto. Asuka'ya kişinin dilinin harfinin sembollerini eklemek mümkün oldu.

Burada açıklamak için tekrar konuşmanız gerekecek. kodlamanın yeni ihtiyaçları metinler ve neden bu kadar önemli? Bilgisayarınızın ekranındaki semboller iki konuşma temelinde oluşturulur - her türlü işaretin bir dizi vektör formu (görünüm) (kokular dosya 3'te bulunur) ve aynı sembolü kullanmanıza izin veren bir kod doğru yere eklemeniz gerekir.

Vektör formlarının kendileri için yazı tiplerinin kullanıldığını ve kodlama ekseninin, içine yazılan programların işletim sistemine dayandığını fark ettim. Tobto. Bilgisayarınızda herhangi bir metin varsa, bu bir bayt kümesi olacaktır, dış görünüm kodlamaları metnin kendisinin tek bir karakterine sahiptir.

Metni ekranda görüntüleyen bir program (metin düzenleyici, tarayıcı vb.), kodu ayrıştırırken, siyah karakterin kodlamasını okur ve gerekli yazı tipi dosyasında doğru vektör formunu arar, hangi bağlantıyı görüntülemek için bağlantı verilen metin belgesi. Her şey çok basmakalıp.

Bu nedenle, ihtiyacımız olan herhangi bir karakteri kodlamak için (örneğin, ulusal alfabeden), sadece iki zihni vikonano yapabilirsiniz - bu karakterin vektör formu, kodlanmış yazı tipinden sorumludur ve bu karakter kodlanabilir. bir bayt içinde genişletilmiş ASCII kodlamaları. Bu nedenle bu tür seçenekler önemlidir. Sadece genişletilmiş Aska'nın Rus orijinal kilkasındaki sembollerin kodlanması için.

Örneğin, koçanın üzerinde göründü CP866, bir şekilde, Rus alfabesinin sembollerini ve ASCII'nin genişletilmiş bir versiyonunu kazanmak mümkün oldu.

Tobto. її Tablonun üst kısmı, üzerine gelinen üç ekran görüntüsünde sunulduğu için Aska'nın temel sürümüyle (Latince'de 128 karakter, sayılar ve diğer saçmalıklar) neredeyse çakıştı ve eksen zaten CP866 ile tablonun alt kısmı kod işaretleri (Rus harfleri ve orada her türlü sözde grafik):

Bachite, sağ tarafta sayılar 8 ile başlar, çünkü 0'dan 7'ye kadar olan sayılar, ASCII temel bölümünden önce görülür (div. ilk ekran görüntüsü). dahil CP866 matematik kodu 9C'deki Rusça "M" harfi (çift sıra 9'un retinasında ve on altıncı sayı sisteminde C sayısı), bir bayt bilgi ile yazılabilir, ancak çiftin netliği için Rusça karakterlerle yazı tipinin metinde sorunsuz görünmesi.

Sesler böyle bir miktardan geldi CP866'da sözde grafikler? Burada, grafik işletim sistemlerinin şimdi olduğu gibi bir genişlemesi varsa, Rusça metin için kodlamanın daha da değişken bir şekilde genişletildiğini belirtmekte fayda var. Ve Dosi'de ve buna benzer metin işlemleri, sözde grafik metinlerin biraz çirkin bir tasarımına bile izin verdi ve bunun için CP866 ve aynı yaştaki tüm diğerleri, Ask'ın genişletilmiş sürümleri kategorisinden temizlendi.

CP866, IBM tarafından geliştirildi, ancak Rusça dil sembolleri için bir dizi kod da genişletildi, örneğin aynı türe (ASCII uzantıları) kadar görülebilir KOI8-R:

її roboti ilkesi, daha önce CP866 tarafından açıklananla aynı kaldı - metnin cilt karakteri tek bir bayt ile kodlandı. Ekran görüntüsü KOI8-R tablosunun diğer yarısını gösterir, çünkü ilk yarının ilk yarısı, bu makalenin ilk ekran görüntüsünde gösterildiği gibi temel Sor'a dayanmaktadır.

KOI8-R kodlamasının özellikleri arasında, örneğin CP866 oluşturulduğundan, bu tablodaki Rusça harflerin alfabetik sırayla olmadığı not edilebilir.

İlk ekran görüntüsüne (temel kısım, tüm genişletilmiş kodlamalara nasıl girileceğine) bakarsanız, KOI8-R'de Rus harflerinin tablonun aynı ortasında sıralandığına, Latin alfabesinin harflerinin içinde olduğuna dikkat edin. tablonun ilk kısmı. Toplamda bir vuruş (yedinci adımda iki veya 128) vermek için Rus sembollerinden Latin usulüne geçişin netliği adına bütün kırıldı.

Windows 1251 - ASCII'nin güncel sürümü

Metin kodunun daha da geliştirilmesi, grafik işletim sistemlerinin popülerlik kazanması ve kısa sürede bunlarda psödografi kullanımına duyulan ihtiyaçtan kaynaklanıyordu. Sonuç olarak, grubun adı, kendi hikayesinde olduğu gibi, daha önce olduğu gibi, Ask'ın genişletilmiş versiyonlarıydı (metindeki bir karakter, birden fazla bayt bilgi tarafından kodlanmıştır), ancak psödografikte semboller kullanılmamıştır.

Koku, Amerikan Standartlar Enstitüsü tarafından bozulan sözde ANSI kodlarına kadar uzanıyor. Kiril alfabesinin adı da Rus dilinin desteğiyle varyant için seçilmiştir. Buna bir örnek buti olabilir.

Вона вигідно відрізнялася від використовуваних раніше CP866 і KOI8-R тим, що місце символів псевдографіки в ній зайняли символи російської типографіки (крім знака наголосу), а також символи, що використовуються в близьких до російської слов'янських мовах (українській, білоруській і т. d.). ):

Bu çeşitlilik sayesinde, yazı tipi türleri ve türleri arasında Rus dilinin kodlanması yazılım sürekli kafayı suçladı ve bizimle, aranızda, chitachі shovnі chitachі, sık sık kendi sefilliğinizi taktınız krakozyabri, metinde muzaffer olan sürümde bir başıboş olsaydı.

Daha da sıklıkla, koku baskın ve otrimanni hatırlatan e-posta, virishiti tsyu sorunu gibi oldukça katlanır kayıt tablolarının oluşturulmasına neden olan, temelde daha önce olamazdı ve vikoristovuvali, schobnut talihsiz krakozyabriv için genellikle koristuvachs, aksi takdirde vikoristannye Windows koduvans benzer 15IKO veya CP866.

Nitekim Rusça metnin yerini alacak olan krakozyabry, verilen dilin yanlış kodlanmasının bir sonucuydu, kulağa hoş gelmediği için onun için kodlanmıştı. Metin mesajları koçanın kendisi gibi.

CP866'nın yardımı için kodlanmış semboller, Windows 1251 kod tablosunu taklit etmeye çalışın, kısayolu kullanın (sessizce yazarak karakterler) ve bildirim metnini tamamen değiştirdiğini görün.

Benzer bir durum genellikle forumlarda veya bloglarda suçlanır, eğer Rus sembolleri affı olan metin yanlış kodlamada alınırsa, sitede bir kilit için yazılmış gibi, aksi takdirde o değil Metin düzeltici görünmez gözle görülmeyen kodu koda ekleyen .

Sürekli olarak zengin nabridla tırmanan kişisel olmayan coduvans ve krakozyabry ile böyle bir durum, yeni bir evrensel varyasyonun yaratılmasından önce, sanki her şeyin yerini alacakmış gibi ve metnin kökündeki virishila b, naresht'in fikrini değiştirmiş gibi görünüyordu. sorun Çince'ye benzer dil sorunu Kırım'a dayanıyordu, ancak dilin sembolleri daha zengindi, 256'nın altındaydı.

Unicode (Unicode) - evrensel kodlama UTF 8, 16 ve 32

Modern pvdenno-shidnoy Asia grubunun binlerce karakteri, ASCII'nin genişletilmiş sürümlerinde karakterleri kodlamak için görülen bir bayt bilgide tanımlanamadı. Sonuç olarak, adı altında bir konsorsiyum oluşturuldu. tek kod(Unicode - Unicode Konsorsiyumu), endüstride bugata olan spіvpratsі ile (bu, rіblyєє yazılımı, khto kodє zalіzo, khto svіdіє yazı tipi), evrensel koduvannya tekst görünümünde yakі bіlіkavlenі.

Unicode konsorsiyumu altında tanıtılan ilk varyasyon bula idi. UTF-32. Kodlamanın başlığındaki sayı, bir karakteri kodlamak için gereken bit sayısı anlamına gelir. 32 bit, yeni evrensel UTF kodlamasında tek bir karakteri kodlamak için gereken 4 bayta kadar bilgi ekler.

Sonuç olarak, metin içeren aynı dosya, ASCII'nin genişletilmiş sürümünde ve UTF-32'de kodlamalar, davanın geri kalanında genişleme (önem) dört kat daha fazladır. Bu kötü, ama şimdi PTF'nin yardımıyla iki kişilik daha pahalı olan işaretlerin sayısını otuz diğer adımda kodlama fırsatımız var ( milyarlarca sembol, yaki pokriyut be-yak devasa bir rezervden gerçekten gerekli değer).

Ancak, Avrupa grubunun diline sahip ülkeler için, kodda böylesine görkemli sayıda işaret kodlandı ve gerekli değildi, ancak UTF-32 kurulduğunda, pis koku boşuna değildi. metin belgeleri, ve sonuç olarak, İnternet trafiği miktarını ve veri kaydetme zorunluluğunu artıracağım. Bu zengin ve böyle bir para israfına kimse izin veremezdi.

Unicode'un geliştirilmesinden sonra ortaya çıktı UTF-16, Uzakta Yaka vyyshla nastіlki, umovchannyam için alınan scho bula, biz vikoristovuyutsya gibi tüm semboller için temel bir genişlik olarak. Bir karakteri kodlamak için iki bayt vardır. Nasıl göründüğümüzü merak edelim.

Windows işletim sisteminde "Başlat" - "Programlar" - "Aksesuarlar" - "Hizmetler" - "Sembol Tablosu" yolundan gidebilirsiniz. Sonuç olarak, sisteminizde kurulu tüm font sistemlerinin vektör formları ile bir tablo görüntülenir. Yakshcho alacaksın " Ek parametreler» Unicode karakterleri yazarak, dış görünüm yazı tipini yeni karaktere kadar tüm karakter aralığı için kullanabilirsiniz.

Konuşmadan önce, olup olmadıklarına tıklayarak iki bayt yogo söyleyebilirsiniz. UTF-16 biçim kodu, On dört on altı basamakla eklenenler:

UTF-16'da 16 bit yardımı ile kaç karakter kodlanabilir? 65536 (on altı adımda iki) ve sayının kendisi Unicode'da taban alanı olarak alındı. Krіm tsgogo, ona yardım etmek için kodlamanın bir yoludur ve iki milyona yakın znіkіv, ayrıca genişleyen metin genişliğiyle çevrilidir.

Ale navit tsya, Unicode kodlamanın çok uzak versiyonu, diyelim ki, sadece programlar yazanlara fazla memnuniyet getirmedi. ingilizce, Bo kıyameti, ASCII'nin genişletilmiş versiyonundan UTF-16'ya geçişten sonra, birçok belge ikiye katlandı (Asci'de bir karakter için bir bayt ve UTF-16'da aynı karakter için iki bayt).

Unicode konsorsiyumundaki herkesin ve her şeyin memnuniyeti için, ortaya çıkmaya karar verildi. hayatın değişiminin kodlanması. Її UTF-8 olarak adlandırılmıştır. Popri adından da anlaşılacağı gibi, tobto dovzhina değil. Metnin dış görünüm karakteri, altı bayta kadar bir dizide kodlanabilir.

Uygulamada, UTF-8'in yalnızca bir ila iki bayt aralığı vardır, bu nedenle teorik olarak birkaç baytlık bir kod için herhangi bir şey ortaya çıkarmak imkansızdır. İçindeki tüm Latin karakterleri, eski güzel ASCII'de olduğu gibi bir bayt olarak kodlanmıştır.

Dikkat çekicidir, kodlama zamanlarında Latince'den daha az şey vardır, bu programlarda gezinin, Unicode'u anlamıyorlarsa, hepsi aynı, UTF-8'de kodlanmış olanları okuyun. Tobto. Aska'nın temel kısmı basitçe Unicode konsorsiyumunun beynine geçti.

UTF-8'deki Kiril karakterler iki bayt olarak kodlanmıştır ve örneğin Gürcüce karakterler üç bayt olarak kodlanmıştır. UTF 16 ve 8'in oluşturulmasından sonra Unicode Konsorsiyumu ana sorunu çözdü - şimdi elimizde yazı tiplerinin tek bir kod alanı vardır. Ve şimdi onların yazıcıları metindeki sembollerin vektör biçimlerini doldurmak için kendi güçlerini kullanamıyorlar. Hemen navigasyon yapın.

"Simgeler Tablosu"nun üzerinde gezinirken, farklı yazı tiplerinin karakter sayısını vurguladığı açıktır. Unicode yazı tiplerinin çoğu, makul düzeyde bile önemli olabilir. Ve şimdi, kokular farklı kodlamalar için yaratıldıkları için değil, yazı tipini bir yazı tipine doldurdukları için ya da bu chi ve diğer vektör formları ile tek bir kod boşluğunu sonuna kadar doldurmadıkları için değerlendiriliyor.

Rus mektuplarının Krakozyabri vekili.

Şimdi krakozyabri metnini nasıl değiştireceklerini merak edelim, yoksa Rusça metin için doğru kodlama nasıl seçilir. Peki, ya metnin kendisini düzenlediğiniz ya da farklı metin parçaları için kod oluşturduğunuz o programda ayarlanmıştır.

Bu kıvrımı düzenlemek için metin dosyalarıÖzellikle vicorist'te iyiyim, bence, . Vіm, vіn, yüzlerce iyi programlama ve düzenin sözdizimini ve ayrıca ek eklentiler için genişletme olasılığını değiştirebilir. Okumak rapor incelemesi indüklenen mesajdan mucizevi programlar.

Notepad ++'ın üst menüsünde, sitenizde mevcut olan seçeneği kilitlemek için değiştirebileceğiniz bir “Kodlama” öğesi vardır:

Joomla 1.5 ve daha fazlasındaki bir sitenin yanı sıra WordPress'teki bir blog için, bir seçenek belirlemek için kısayolların görünümünü izleyin Malzeme Listesi olmadan UTF8. BOM öneki nedir?

Sağda, UTF-16 kodlaması kırılmışsa, doğrudan bir sırayla (örneğin, 0A15) olduğu gibi bir sembole bir kod yazmak mümkün olduğu için, böyle bir cümleyi ona vidaladılar. (150A). Ve programların anlaması, sırayla kodu okuması ve ortaya çıkması için malzeme listesi(Bayt Sırası İşareti veya başka bir deyişle bir imza), belgelerin koçanı üzerine üç ek bayt eklenmesiyle kendini gösterir.

UTF-8 kodlamasında, Unicode konsorsiyumuna hiçbir Malzeme Listesi aktarılmadı ve buna bağlı olarak, bu tür programlara bir imza (belgenin koçanı üzerindeki en iyi üç baytı) eklemek, kodu okumaya değer. Bu nedenle, dosyaları UTF'ye kaydetmek adına BOM'suz (imzasız) seçeneği seçmek sizin sorumluluğunuzdadır. Bu rütbede çok uzaktasın kendinizi krakozyabriv şeklinde güvenceye alın.

Windows'taki bazı programların bu işi yapamaması dikkat çekicidir (UTF-8'den BOM olmadan metin kaydedemez), örneğin aynı sefil Windows Not Defteri. Vіn belgeyi UTF-8'den alır, ancak hepsi aynı şekilde koçana bir imza (üç ek bayt) ekler. Ayrıca, bu baytlar sonsuza kadar bir ve aynı olacaktır - kodu doğrudan sırayla okuyun. tsyu drіbnitsyu aracılığıyla sunuculardaki Ale sorunu suçlayabilir - vilіzu krakozyabri.

Yani herhangi bir zamanda harika Windows not defterine aldanmayın Sitenizdeki belgeleri düzenlemek için, böylece yanlışlıkların ortaya çıkmasına aldırmazsınız. en iyi ve en iyi basit seçenek Ayrıca pratikte çok fazla eksiği olmayan ve bazı avantajlardan oluşan Notepad++ düzenleyicisini de kullanıyorum.

Notepad ++ ile bir kodlama seçerken, metni özünde Unicode standardına daha yakın olan UCS-2 kodlamasına dönüştürebileceksiniz. Not defteri, metni ANSI'de de kodlayabilir, bu nedenle. %100 Rusça bizim tarafımızdan üç kat daha fazla Windows 1251 anlatılacaktır. Herhangi bir bilgi alıyor musunuz?

Vaughn, ameliyathanenizin siciline kayıtlı. Windows sistemleri- ANSI kodu için kodlama nasıl seçilir, OEM kodu nasıl seçilir (Rus filmi için CP866 olacaktır). Kilitleme için bilgisayarınıza başka bir dil yüklerseniz, kodlama, kendi diliniz için aynı ANSI veya OEM koduyla değiştirilecektir.

Belgeyi ihtiyacınız olan kodlamadan Notepad++'a kaydederseniz veya belgeyi düzenlemek için siteden açarsanız, düzenleyicinin sağ alt köşesine adı ekleyebilirsiniz:

Shchob niknut krakozyabriv, yukarıdaki açıklamalar dışında, sitenin tüm taraflarının çıktı kodunun başlığına kodlamanın kendisiyle ilgili bilgileri yazmak daha iyi olacaktır, böylece sunucu veya yerel ana bilgisayar dolandırıcıyı suçlamaz.

Vzagali, hypertext düzeninin tüm movs'larında, kodlamanın metne belirtildiği, keyfi olarak seslendirilmiş xml, Html creme kullanılır.

Her şeyden önce, kodu analiz edin, tarayıcı galip olanın hangi sürümünün olduğunu ve filmdeki karakterlerin kodunun nasıl yorumlanması gerektiğini bilecektir. Ancak, belgeyi varsayılan Unicode'dan kaydederseniz, xml belirsizliğini atlayabilirsiniz (kodlama UTF-8'de olacaktır, bu da BOM veya UTF-16 olmaması anlamına gelir, yani BOM є anlamına gelir).

Belgenin hazırlandığı tarihte Film Html'si kodlamayı kodlamak için meta öğesi, kıvrılan ve kapanan Head etiketinin arasına yazılır:

... ...

Bu giriş, 'da benimsendiği gibi kesinlikle gözden geçirilecek, ancak yavaş yavaş tanıtılan yeni Html 5 standardına yeniden göndereceğim ve şu anda muzaffer olan tarayıcılar tarafından doğru bir şekilde anlaşılacak.

Bir fikir olarak, belgenin Html kodlamasındaki Meta öğesi daha kısa olacaktır. yakomoga belge başlığında daha yüksektir, böylece ilk karakterin metnine yazarken, temel ANSI (her zaman ve herhangi bir varyasyonda doğru bir şekilde okunur) değildir, tarayıcı, bu karakterlerin kodunun nasıl yorumlanacağı hakkında anne bilgisinden suçludur.

Sana iyi şanslar! Blog sitesinin kenarlarında hızlı zırvalar yapmak için

tsikavo yapabilirsin

Site için mesajın mutlak geçerliliğini belirleyen URL adresleri nelerdir?
OpenServer - mevcut Yerel sunucu bir bilgisayara WordPress yüklemek için bu yoga wiki uygulaması
Chmod nasıl, dosya ve klasörlere (777, 755, 666) ve ayrıca PHP aracılığıyla erişim hakları nasıl atanır
Site ve çevrimiçi mağaza için Yandex araması

KOI8-R Kodlaması

ISO 8859-5 kodlaması

ISO 8859-5

alternatif kodlama

"Alternatif kodlama"- CP437 kod tarafına dayalı olarak, diğer yarıdaki tüm belirli Avrupa karakterleri Kiril ile değiştirilir ve sözde grafik karakterler kullanılmaz. Ayrıca robotik metinler için galip gelen programlara bakılmasına gerek olmadığı gibi Kiril sembollerinin galip gelmesini de sağlar.

Geçmişte, alternatif kodlama için birçok seçenek vardı, ancak diğer tüm özellikler 0xF0 - 0xFF (240-255) alanıyla sınırlıdır. Kalan standart, MS-DOS 6.22 sürümünde tanıtılan IBM CP866 kodlamasıydı. dosya sistemiŞİŞMAN. Windows NT ailesinin Ruslaştırılmış sistemlerinin konsolunda CP866 dosi vikoristovuєtsya.

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8. 410 B411 412 G 413 D 414 E415 F416 417 ben 418 419 41A'ya kadar 41B 41C 41D Pro 41E 41F
9. 420 TL Z 421 422 423 F424 425 C426 Bölüm 427 SH 428 Şş 429 b42A S 42B b42c E 42D 42E ben 42F
A. 430 b431 432 g 433 434 e435 f436 437 bu 438 439 43A'ya kadar 43B m 43C n 43D profesyonel 43E n 43F
b. ░ 2591 ▒ 2592 ▓ 2593 │ 2502 ┤ 2524 ╡ 2561 ╢ 2562 ╖ 2556 ╕ 2555 ╣ 2563 ║ 2551 ╗ 2557 255D ╜255C ╛255B ┐ 2510
C. └ 2514 ┴ 2534 ┬ 252C ├ 251C ─ 2500 ┼ 253C 255E ╟255F 255A ╔ 2554 ╩ 2569 ╦ 2566 ╠ 2560 ═ 2550 ╬ 256C ╧ 2567
D. ╨ 2568 ╤ 2564 ╥ 2565 ╙ 2559 ╘ 2558 ╒ 2552 ╓ 2553 256B 256A ┘ 2518 ┌250C █ 2588 ▄ 2584 ▌258C ▐ 2590 ▀ 2580
E. p 440 441 442 443'te 444 x 445 c446 yıl 447 sh 448 449 b44A 44B b44C e44D sen 44E ben 44F
F. E 401 451 Є 404 454 $ 407 £ 457 40E'de 45E'de °B0 ∙ 2219 B7 √ 221A № 2116 ¤ A4 ■ 25A0 A0

SO 8859-5- Kiril alfabesi yazmak için ISO-8859 serisinden 8 bit kodlama. Rusya'da Mayzhe alışmıyor. Genel olarak, ISO 8859-5 basit bir kodlamadan başka bir şey değildir, yeni bir gündeki parçalar kısa çizgi (-), pençeler-yalinka (""), derece (°) ve inç gibi gerekli semboller açısından zengindir.



.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8. 80 81 82 83 84 85 86 87 88 89 8A 8B 8C 8D 8E 8F
9. 90 91 92 93 94 95 96 97 98 99 9A 9B 9C 9D 9E 9F
A. A0 E 401 402 403 Є 404 405 ben 406 407 £ 408 £ 409'a kadar 40A Profesyonel 40B N40C AD 40E'de 40F
b. 410 B411 412 G 413 D 414 E415 F416 417 ben 418 419 41A'ya kadar 41B 41C 41D Pro 41E 41F
C. 420 TL Z 421 422 423 F424 425 C426 Bölüm 427 SH 428 Şş 429 b42A S 42B b42c E 42D 42E ben 42F
D. 430 b431 432 g 433 434 e435 f436 437 bu 438 439 43A'ya kadar 43B m 43C n 43D profesyonel 43E n 43F
E. p 440 441 442 443'te 444 x 445 c446 yıl 447 sh 448 449 b44A 44B b44C e44D sen 44E ben 44F
F. № 2116 451 R 452 -453 454 $ *455 ben 456 457 $458 459 45A ћ 45B ќ 45C § A7 45E'de ben 45F'yim

KOI-8 (bilgi değişim kodu, 8 bit), KOI8- bilgisayar biliminin sembollerini kodlamak için sekiz bitlik standart. Kiril alfabelerinin harflerini kodlamak için ayrılmıştır. Kodlamanın yedi bitlik bir sürümü de var - KOI-7. KOI-7 ve KOI-8, GOST 19768-74'te (şimdilik) açıklanmıştır.

KOI-8 rozrobnik'ler, Rus alfabesinin sembollerini, genişletilmiş ASCII tablosunun üst kısmına, Kiril sembollerinin pozisyonları, tablonun alt kısmındaki İngiliz alfabesindeki fonetik karşılıklarına karşılık gelecek şekilde yerleştirdi. Tse, KOI-8'de yazılan metinde, cilt sembolünün sekiz bitini kaldırın, ardından Latin karakterleriyle yazmak istiyorsanız “okuma” metninin çıkacağı anlamına gelir. Örneğin, "Rusça Metin" kelimeleri "rUSSKIJ tEKST" haline geldi. Bir yan not olarak, Kiril karakterleri alfabetik sıraya göre sıralanmıştır.

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8. ─ 2500 │ 2502 ┌250C ┐ 2510 └ 2514 ┘ 2518 ├ 251C ┤ 2524 ┬ 252C ┴ 2534 ┼ 253C ▀ 2580 ▄ 2584 █ 2588 ▌258C ▐ 2590
9. ░ 2591 ▒ 2592 ▓ 2593 ⌠ 2320 ■ 25A0 ∙ 2219 √ 221A ≈ 2248 ≤ 2264 ≥ 2265 A0 ⌡ 2321 °B0 ²B2 B7 ÷ F7
A. ═ 2550 ║ 2551 ╒ 2552 451 ╓ 2553 ╔ 2554 ╕ 2555 ╖ 2556 ╗ 2557 ╘ 2558 ╙ 2559 255A ╛255B ╜255C 255D 255E
b. ╟255F ╠ 2560 ╡ 2561 E 401 ╢ 2562 ╣ 2563 ╤ 2564 ╥ 2565 ╦ 2566 ╧ 2567 ╨ 2568 ╩ 2569 256A 256B ╬ 256C © A9
C. sen 44E 430 b431 c446 434 e435 444 g 433 x 445 bu 438 439 43A'ya kadar 43B m 43C n 43D profesyonel 43E
D. n 43F ben 44F p 440 441 442 443'te f436 432 b44C 44B 437 sh 448 e44D 449 yıl 447 b44A
E. 42E 410 B411 C426 D 414 E415 F424 G 413 425 ben 418 419 41A'ya kadar 41B 41C 41D Pro 41E
F. 41F ben 42F 420 TL Z 421 422 423 F416 412 b42c S 42B 417 SH 428 E 42D Şş 429 Bölüm 427 b42A

KOI8-U Kodlaması (Ukraynaca)

KOI-8, İnternet'teki ilk Rus standartlaştırılmış kodlama oldu.

IETF, KOI-8 kodlama seçenekleri için RFC'yi onayladı:

  • RFC 1489 - KOI8-R (Rus alfabesinin harfleri);
  • RFC 2319 - KOI8-U (Ukrayna alfabesinin harfleri);
  • RFC 1345 - ISO-IR-111 (ana aralığın tanımı için kusura bakmayın).

Vurgulu tablolarda, harflerin altındaki sayılar, Unicode'daki harfin on altıncı kodunu gösterir.

KOI8-R Kodlaması (Rusça)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F

8.

2500

2502

250C

2510

2514

2518

251C

2524

252C

2534

253C

2580

2584

2588

258C

2590

9.

2591

2592

2593

2320

25A0

2219

221A

2248

2264

2265

A0

2321
°
B0
²
B2
·
B7
÷
F7

A.

2550

2551

2552
e
451

2553

2554

2555

2556

2557

2558

2559

255A

255B

255C

255D

255E

b.

255F

2560

2561
sen
401

2562

2563

2564

2565

2566

2567

2568

2569

256A

256B

256C
©
A9

C.
Yu
44E
a
430
b
431
c
446
d
434
e
435
f
444
G
433
X
445
і
438
inci
439
önceki
43A
ben
43B
m
43C
n
43D
hakkında
43E

D.
P
43F
İ
44F
R
440
h
441
t
442
de
443
kuyu
436
içinde
432
b
44C
s
44B
h
437
w
448
e
44D
sch
449
yıl
447
b
44A

E.
YU
42E
ANCAK
410
B
411
C
426
D
414
E
415
F
424
G
413
X
425
І
418
Y
419
Önceki
41A
L
41B
M
41C
H
41D
profesyonel
41E

F.
P
41F
İ
42F
R
420
W
421
T
422
saat
423
F
416
AT
412
b
42C
S
42B
W
417
W
428
E
42D
SCH
429
H
427
Kommersant
42A

Diğer seçenekler

Yalnızca çalışmayan tablo satırları gösterilir, kırıklar hala çalışır.

KOI8-U Kodlaması (Rusça-Ukraynaca)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F

A.

2550

2551

2552
e
451
є
454

2554
і
456
ї
457

2557

2558

2559

255A

255B
ґ
491

255D

255E

b.

255F

2560

2561
sen
401
Є
404

2563
І
406
Ї
407

2566

2567

2568

2569

256A
Ґ
490

256C
©
A9

Kodlama KOI8-RU (Rus-Belarus-Ukrayna)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F

A.

2550

2551

2552
e
451
є
454

2554
і
456
ї
457

2557

2558

2559

255A

255B
ґ
491
ў
45E

255E

b.

255F

2560

2561
sen
401
Є
404

2563
І
406
Ї
407

2566

2567

2568

2569

256A
Ґ
490
Ў
40E
©
A9

KOI8-C Kodu (Orta Asya)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8. ғ
493
җ
497
қ
49B
ҝ
49D
ң
4A3
ү
4AF
ұ
4B1
ҳ
4B3
ҷ
4B7
ҹ
4B9
һ
4BB

2580
ә
4D9
ӣ
4E3
ө
4E9
ӯ
4EF
9. Ғ
492
Җ
496
Қ
49A
Ҝ
49C
Ң
4A2
Ү
4AE
Ұ
4B0
Ҳ
4B2
Ҷ
4B6
Ҹ
4B8
Һ
4BA

2321
Ә
4D8
Ӣ
4E2
Ө
4E8
Ӯ
4EE
A.
A0
ђ
452
ѓ
453
e
451
є
454
ѕ
455
і
456
ї
457
ј
458
љ
459
њ
45A
ћ
45B
ќ
45C
ґ
491
ў
45E
џ
45F
b.
2116
Ђ
402
Ѓ
403
sen
401
Є
404
Ѕ
405
І
406
Ї
407
Ј
408
Љ
409
Њ
40A
Ћ
40B
Ќ
40C
Ґ
490
Ў
40E
Џ
40F

KOI8-T Kodlaması (Tacik)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8. қ
49B
ғ
493

201A
Ғ
492

201E

2026

2020

2021

2030
ҳ
4B3

2039
Ҳ
4B2
ҷ
4B7
Ҷ
4B6
9. Қ
49A

2018

2019

201C

201D

2022

2013
-
2014

2122

203A
A. ӯ
4EF
Ӯ
4EE
e
451
¤
A4
ӣ
4E3
¦
A6
§
A7
«
AB
¬
AC
­
AD
®
AE
b. °
B0
±
B1
²
B2
sen
401
Ӣ
4E2

B6
·
B7

2116
»
BB
©
A9

KOI8-O, KOI8-S kodlaması (slovyanska, eski yazım)

0407
.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F

8.
Ђ
0402
Ѓ
0403
¸
00B8
ѓ
0453

201E

2026

2020
§
00A7

20AC
¨
00A8
Љ
0409

2039
Њ
040A
Ќ
040C
Ћ
040B
Џ
040F

9.
ђ
0452

2018

2019

201C

201D

2022

2013

2014
£
00A3
·
00B7
љ
0459

203A
њ
045A
ќ
045C
ћ
045B
џ
045F

A.

00A0
ѵ
0475
ѣ
0463
e
0451
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
®
00AE

2122
«
00AB
ѳ
0473
ґ
0491
ў
045E
´
00B4

b.
°
00B0
Ѵ
0474
Ѣ
0462
sen
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408

2116
¢
00A2
»
00BB
Ѳ
0472
Ґ
0490
Ў
040E
©
00A9

ISO-IR-111, KOI8-E kodlaması

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F

A.

00A0
ђ
0452
ѓ
0453
e
0451
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
љ
0459
њ
045A
ћ
045B
ќ
045C
­
00AD
ў
045E
џ
045F

b.

2116
Ђ
0402
Ѓ
0403
sen
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408
Љ
0409
Њ
040A
Ћ
040B
Ќ
040C
¤
00A4
Ў
040E
Џ
040F

KOI8-Unified, KOI8-F Kodlama

KOI8-Unified (KOI8-F) kodlaması, Fingertip Software tarafından yayılır.

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F

8.

2500

2502

250C

2510

2514

2518

251C

2524

252C

2534

253C

2580

2584

2588

258C

2590

9.

2591

2018

2019

201C

201D

2022

2013

2014
©
00A9

2122

00A0
»
00BB
®
00AE
«
00AB
·
00B7
¤
00A4

A.

00A0
ђ
0452
ѓ
0453
e
0451
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
љ
0459
њ
045A
ћ
045B
ќ
045C
ґ
0491
ў
045E
џ
045F

b.

2116
Ђ
0402
Ѓ
0403
sen
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408
Љ
0409
Њ
040A
Ћ
040B
Ќ
040C
Ґ
0490
Ў
040E
Џ
040F

KOI-8'in kiril olmayan varyantları

REV'in bazı ülkelerinde, Latince'nin ulusal varyantları için KOI-8'in modifikasyonları oluşturuldu. Temel fikir aynıydı - sekizinci bit "sıkıştırılmış" olduğunda, metin az çok anlaşılabilir olmaktan suçludur.

- Pekala, başla! - Dolokhov demek.
- Şey, - P'єr dedikten sonra böyle gülüyorsun. - Korkunçtu. Sağda olduğu, çok kolay başladığı, hiçbir şeyin kurtaramayacağı, zaten insanların iradesinden bağımsız olarak kendi kendine söndüğü ve ayakta durmaya yetmediği belliydi. Denisov, bar'eru'nun önündeki ilk viyshov ve seslendiriyor:
- Oskіlki rakipleri yoldan çekildi, o zaman başlamak iyi değil: tabancaları alın ve bir kelime için yakınlaşmaya başlayın.
- G ... "az! İki! T" ben! ... - Denisov'u öfkeyle bağırıyor ve her yerde. Saldırgan bir şekilde, birbirlerini tanıyarak sis içinde, çiğnenmiş yollarda daha da yaklaştılar. Rakipler doğru, bar'eru'ya gidiyor, ateş et, istersen. Dolokhov haklı olarak, tabancasını kaldırmıyor, rakibinin kılığında parlak, parıldayan siyah gözlerine hayran kalıyor. Yogo'nun ağzı, bir rüya gibi, kendi kendine gülüyor gibi.
- O zaman istersem - Ateş edebilirim! - P'єr'a, önceden, dövülmüş patikadan ve karlı kardan koşan üç swishy croques pishov'u söyledikten sonra. P'єr bir tabancayı kırpıyor, sağ eliyle öne doğru çekiyor, belki de tabancanın kendisini nasıl vurmayacağından korkarak. Şarabın sol elini özenle geri koydum çünkü sağ eli kaldırmak istiyordum ve yapamayacağımı biliyordum. Kayaları geçip patikadan karın içine sokulan P'er, ayaklarına baktı, yeniden Dolokhov'a keskin bir bakış attı ve bir yogo gibi parmağını çekti, vystriliv. Böyle güçlü bir sesi dinlemeyen P'er, yaptığı vuruşta titredi, sonra kendi yenilgisine sırıttı ve hırladı. Dim, özellikle siste yoğun, persha mete'de zadavay yoma bachiti; ama şarap çeki gibi başka bir şey çekmedim. Dolokhov'un küçükleri sadece biraz ağladı ve Dima yüzünden göreve geldi. Bir elimle gaga için titredim, diğer elimle tabancayı sıktım. Yoganın görünümü bulanıktı. Rostov, sana söylediğimi çok iyi biliyorum.
- Hayır ... e ... t, - dişlerini fırçaladıktan sonra Dolokhiv, - hayır, tenli değil, - ve daha fazla düşen hamsi çalkalayarak, kayaları çok şablona şant ederek, onun karına düşüyor. Yogo'nun sol eli kan içindeydi, şarabını surduta silip sakladı. Yoganın görünümü soluk, kasvetli ve tremthylo idi.
- Mabut ... - pochav Dolohov, ama anmak için bir an değil ... - Nazik ol, ikametgah vin z zusillyam. P'єr, en azından sürüşü kolaylaştırarak Dolokhov'a koştu ve şimdiden, Dolokhov gibi bağırarak bar'єri'yi biriktiren geniş alanı geçmek istedi: - Bar'єru'ya! - ve P'єr, konuşmanın ne hakkında olduğunu anlayarak, zupinivsya desenlerinin beyazı. Onları 10 krokiv'den az aldı. Dolokhov başını kara indirdi, karı açgözlülükle tattı, başını tekrar kaldırdı, okşadı, bacaklarını kaldırdı ve ağırlık merkezini yükseltti. Sahte soğuk karda ve smoktav yogada; yoga tremtiliyi yok et ama herkes gülüyor; gözler zusillis ve kalan seçilmiş güçlerin kötülüğü ile parladı. Vіdnyav pіstolet ben şehir haline geliyorum.
Nesvitsky dürttükten sonra, "Yana bir tabancayla kapatın," dedi.
- 3ak "bekle!" - Gösteriş yapmadan, Denisov'a rakibine bağırmak.
P'er sinsi bir sırıtışla, pişmanlık ve pişmanlık duyuyorum, bacaklarını ve kollarını utanmadan yayarak, geniş göğsüyle Dolokhov'un önünde dik duruyor ve yenisine hayret ediyorum. Denisov, Rostov ve Nesvitsky evlendi. Bir anda koku hissedildi ve Dolokhov'un öfkeli çığlığı duyuldu.
- Geçmiş! - Dolokhov'u bağırmak ve çaresizce karda dibe uzanmak. P'єr başının arkasına toplandı ve geri dönerek tilkilere pishov, bol karla vırakladı ve makul olmayan sözler söyleyen bir sesle:
- Aptal... aptal! Ölüm… saçmalık… – yüzünü buruşturmaya devam et. Nesvitsky Zupiny yoga ve eve povіz.
Rostov, Denisov'dan yaralı Dolokhov'a götürüldü.
Dolokhov, movchki, basık gözlerden, kızağın yanında yatarak ve yemeğe tek bir kelime söylemeden, onun gibi soydular; ale, Moskova'ya gittikten sonra, bir raptom ile size geldi ve daha da önemlisi, başınızı kaldırarak, Rostov'u elinizden alarak, orada kendiniz için oturdunuz. Rostov, Dolokhov'un kılığına giren alt virüs tarafından tamamen değişmiş ve sürdürülemez bir şekilde boğulmuş olması karşısında hayrete düştü.
- Peki ne? kendini nasıl tanırsın - Rostov'a sordu.
- O kötü! ama o kadar zengin değil. Arkadaşım, - Dolokhov bir sesle dedi, neden bölüyorsun, - de mi? Moskova'dayız, biliyorum. Ben bir hiçim, ama її'ya girdim, içeri girdim ... Dayanamıyorum. Vaughn buna dayanamaz...
- Kim? - Rostov'a sordu.
- Annem. Annem, meleğim, sevgili meleğim, annem, - Dolokhov Rostov'un elini sıkarak ağladı. Biraz sakinleştiyseniz, Rostov'a annenizle birlikte yaşadığınızı, bir anne olarak ölmeye yardım etmeye dayanamayacağınızı açıkladınız. Rostov їhati'yi ondan önce kutsamak ve її hazırlamak.
Rostov, kazanmak için önceden gitmiş ve büyük bir sürprizle, Dolokhov, tsey soytarı, erkek kardeş Dolokhov'un yaşlı bir anne ve kambur bir kız kardeşi ve en küçük oğlu ve erkek kardeşi ile Moskova'da yaşadığını fark etti.

Saatin geri kalanında, vech-na-vich'in maiyetiyle nadiren tartıştım. І St. Petersburg'da ve Moskova'da budinok їkh zavzhd bv povny misafirleri. Şarap düellosunun ertesi gecesi, çoğu zaman çekingen olduğu gibi, yatak odasına gitmedi, Kont Bezuhy'nin öldüğü aynı yerde, görkemli babasının ofisinde kaldı.
Vіn kanepeye uzandı ve onunla birlikte olan her şeyi unutmak için uykuya dalmak istedi, ama Vіn en ufak bir şekilde büyümedi. Öyle bir duygu, düşünce fırtınası ruhuna battı ki, bir anda uyuyamadın, hatta yere bile oturmadın ve kanepeden toplanıp odanın içinde İsveç tığ işi ile dolaşmadın. Sonra ona elinin arkasında dostlukla, açık omuzlarla ve durgun, önyargılı bir bakışla göründü ve hemen arp'a, arsızca ve sıkıca Dolokhov'un kılığında sanki obid'deymiş gibi bakmasını söyledi ve Dolokhov'un aynı kisvesi, kasvetli, tremtyach. ve döndüğünde ve karın üzerine düştüğünde olduğu gibi acı çekti.
"Bu neydi? - Kendi kendine şarap istemek. - Bir kohant sürdüm, bu yüzden ekibimden bir kohant öldürdüm. Evet öyleydi. Neyi görüyorsun? Neye nasıl gideceğim? - Onunla arkadaş olana, - Bir iç ses duyuldu.
"Ne suçum var? - şarap içmek. - Sevgisiz її ile arkadaş olana, kendini її kandıran kişiye, - ve sana, o hvilina'nın Prens Vasil'deki akşamdan sonra, sözleri söylerse, çıkmadıklarını hayal etti. : “Aman Allahım”. [Seni seviyorum.] Her şey! Düşündüm, düşündüm, düşündüm, hakkım olmayanlar değil. Ve böylece oldu." Balayını tahmin etmek ve en iyi şansta chervonіv. Özellikle çiğnenmiş, mecazi ve iğrenç bir şekilde yeni bir arkadaş için, bir zamanlar olduğu gibi, takım arkadaşlarınızdan sonra aksamadan, günün 12. yıl dönümünde şarap, yatak odasından ofise ve ofisten dikişli bir bornoz geldi. başın başının karakolları, sanki eğiliyormuş gibi, P'єra'nın cübbesine hayran kalıyor ve biraz gülüyor, müdürünün mutluluğunun sesinde bir sırıtışla havada asılı duruyor.
“Ve kaç kez yazdım, harika bir güzellikle yazdım, її laik incelik, şarap düşünerek; Petersburg'un tamamını aldığı budinka'sıyla yazıyor, bu zaptedilemez güzellikle yazıyor. Peki ne hakkında yazıyorum?! Sadece anlamadığımı düşündüm. Ne sıklıkla її karakterini düşünerek, kendimi suçlu olduğumu, її anlamadığımı, günlük sakinliğin, memnuniyetin ve günlük yaşamın kadın gibi bir şey olduğunu anlamıyorum ve tüm çözüm O korkunç sözdeydi, o ahlaksız bir kadındı: Kendine korkunç bir söz söyledin ve herkes anladı!
“Anatole ondan önce gitti, kuruşlarını topladı ve çıplak omuzlarını öptü. Vaughn ona bir kuruş vermedi ama öpülmesine izin verdi. Batko, zhartom, zbudzhuvav її kıskançlık; sakin bir gülümsemeyle kıskanacak kadar kötü olmadığını söyledi: ne istersen çekinmekten çekinme, dedi benim hakkımda. Ben a gibi enerji verdim, chi bunu bir vagity işareti olarak görmüyorum. Vaughn saygısızca güldü ve aptal olmadığını, çocuk annesi olması gerektiğini ve çocuk yapmadığını söyledi.
Daha sonra, daha büyük aristokrat payda sallanmaya saygı duymadan, virazіv'in, güçlü olanların kabalık, її düşüncelerinin netliğini ve kabalığını tahmin ettik. "Ben aptal değilim... git kendin dene... allez vous promener," [içeri gir,] dedi. Genellikle, yaşlıların ve gençlerin ve kadınların gözünde її başarısına hayran olan P'єr, şarabı neden sevmediğini anlayamadı. Kendimi P'єr'yi gösterdikten sonra, її'yi hiçbir şekilde sevmediğimi; Suçluluğumu tekrar eden ahlaksız bir kadın olduğunu biliyordum ama kendim için görmedim.

Bugün sizlerle, site ve programlarda yıldızların stenografi olarak alındığı, metinlerin nasıl kodlanacağı ve nasıl izleneceği hakkında konuşacağız. Temel ASCII'den başlayarak ve CP866, KOI8-R, Windows 1251'in genişletilmiş sürümlerinden başlayarak ve Unicode konsorsiyumu UTF 16 ve 8'in mevcut kodlamasıyla biten gelişimlerinin tarihini rapor ediyoruz. Kimi ziyaret edebilirsin, ama aynı krakozyabriv'i yemeye daha ne kadar gelebileceğimi bilirsin (bir dizi karakter okumaz). Artık tüm makaleleri metne gönderme ve sövelerimi bağımsız olarak inceleme fırsatım olacak. Pekala, bilgileri almaya hazırlanın ve haberlerin yayılmasını takip etmeye çalışın.

ASCII - latin için temel metin kodlaması

Metinlerin kodlanmasının geliştirilmesi bir anda BT galerisinin kalıplanmasından yapıldı ve pis koku, bir saat içinde chimalih değişikliklerinin tanınmasını sağladı. Tarihsel olarak her şey, Latin alfabesinin harflerinin, Arap rakamlarının ve noktalama işaretlerinin siyah karakterlerle kodlanmasına izin verdiği için Rus dilinde kulağa hoş gelmeyen EBCDIC ile başladı. Ancak yine de, varto'daki metinlerin modern kodlanmasının geliştirilmesi için doğru nokta ünlüdür. ASCII(Bir Rus madeni “asky” gibi ses çıkardığından, Bilgi Değişimi için Amerikan Standart Kodu). Vaughn, en sık yazılan İngilizce harflerin ilk 128 sembolünü tanımlar - Latin harfleri, Arap rakamları ve farklı işaretler. ASCII'de açıklanan 128 işarette daha fazlası, kshtalt kemeri, ґrat, zirochok üzerinde ince servis sembolleri deaks kullandılar. Vlasne, sen kendin yapabilirsin:
ASCII koçanı varyantından gelen 128 karakter standart hale geldi ve dillerinde başka herhangi bir şekilde kodlanmışlar, bu sırayla kokuya değer. Sağdaki Ale, bir baytlık bilgi yardımıyla, Aska'nın temel versiyonunun arkasındakine 128 değil, 256 farklı değeri (ikisi en yüksek 256'ya eşittir) kodlamak mümkündür. , bütün bir satır göründü ASCII kodlama uzantıları, Ulusal kodlamanın sembolleri için kodun 128 temel işaretini oluşturmanın mümkün olduğu (örneğin, Rusça). Burada, tek tek, açıklamada muzaffer olan sayı sistemleri hakkında söylenecek biraz daha fazla şey var. Birincisi, hepinizin bildiği gibi, bilgisayar sadece iki sistemdeki sayılarla çalışır ve kendisi sıfırlar ve birlerle ("Boole cebiri", sanki koleje veya okula gitmişsiniz gibi). Bir bayt, her biri sıfırdan başlayarak ve somy'de ikiye kadar olmak üzere iki adımı temsil eden sekiz bitten oluşur:
Böyle bir tasarımdaki tüm olası sıfır ve bir kombinasyonlarının 256'dan az olabileceğini anlamak önemli değildir. Sayıyı iki sistemden onuncuya dönüştürmek kolaydır. Üzerinde tek başına durmak için ikisinin tüm adımlarını basitçe katlamak gerekir. Popomuz 1 (sıfır adımda 2) artı 8 (3 adımda iki), artı 32 (beşinci adımda iki), artı 64 (altıncı adımda) artı 128 (altıncı adımda) çıkıyor. Hemen onuncu sayı sisteminden 233 alıyorum. Yak bachite, her şey daha basit. Ancak, ASCII karakterli tablolara bakarsanız, on altıncı kodlamada sunulduğunu anlarsınız. Örneğin, "zіrochka" vіdpovіdaє On altıncı sayı 2A'ya sorun. Şüphesiz, on altıncı sistemde Arap rakamlarına ek olarak muzaffer sayıların ve A'dan (on anlamına gelir) F'ye (on beş anlamına gelir) kadar daha fazla Latin harflerinin olduğunu görebilirsiniz. Peki, eksen, için iki sayıyı on altıya çevirmek vdayutsya saldırgan basit ve bilimsel bir şekilde. Dış görünüm baytları, yukarıdaki ekran görüntüsünde gösterildiği gibi, bit sayısına göre parçalara ayrılır. dahil bir baytın cilt yarısında, iki kod yalnızca on altı değeri (dördüncü adımda iki) kodlayabilir ve bu on altı sayı ile kolayca ortaya çıkarılabilir. Ayrıca, baytın sol yarısında, adımın ekran görüntüsünde gösterildiği gibi sıfırdan sıfırlanması gerekecektir. Sonuç olarak, basit bir hesaplama ile ekran görüntüsünde E9 sayısının kodlanmış olduğunu çıkarıyoruz. Eminim ki yanlış anlamalarım ve bu bulmacanın çözümü size mantıklı geldi. Şimdi devam edelim, metni kodlama hakkında konuşalım.

Aska'nın genişletilmiş sürümleri - CP866 ve KOI8-R'yi pseudographics ile kodlama

Daha sonra tüm modern kodların (Windows 1251, unicode, UTF 8) geliştirilmesinin başlangıç ​​noktası olan ASCII'den bahsetmeye başladık. Latin alfabesinin 128'den fazla karakteri, Arap rakamları ve daha fazlası, ancak genişletilmiş sürüm, bir bayt bilgide kodlanabilen 256 değerin tümünü birleştirme yeteneğine sahiptir. Tobto. Asuka'ya kişinin dilinin harfinin sembollerini eklemek mümkün oldu. Burada tekrar konuşmanız gerekecek, açıklamak için kodlama metinleri için yeni ihtiyaçlar ve neden bu kadar önemli. Bilgisayarınızın ekranındaki semboller iki konuşma temelinde oluşturulur - güçlü işaretlerin bir dizi vektör formu (görünüm) (bilgisayarınızda yüklü olan yazı tiplerine sahip dosyalarda kokular bulunur) yazı tipi) ihtiyacınız olan aynı sembol gerekli alana eklemek için. Vektör formlarının kendileri için yazı tiplerinin kullanıldığını ve kodlama ekseninin, içine yazılan programların işletim sistemine dayandığını fark ettim. Tobto. Bilgisayarınızda herhangi bir metin varsa, bu bir bayt kümesi olacaktır, dış görünüm kodlamaları metnin kendisinin tek bir karakterine sahiptir. Metni ekranda görüntüleyen bir program (metin düzenleyici, tarayıcı vb.), kodu ayrıştırırken, siyah karakterin kodlamasını okur ve gerekli yazı tipi dosyasında doğru vektör formunu arar, hangi bağlantıyı görüntülemek için bağlantı verilen metin belgesi. Her şey çok basmakalıp. Bu nedenle, ihtiyacımız olan herhangi bir karakteri kodlamak için (örneğin, ulusal alfabeden), yalnızca iki kez düşünebilirsiniz - bu karakterin vektör biçimi özel yazı tipinden kaynaklanmaktadır ve bu karakter, genişletilmiş ASCII kodlamalarında kodlanabilir. bir bayt. Bu nedenle bu tür seçenekler önemlidir. Sadece genişletilmiş Aska'nın Rus orijinal kilkasındaki sembollerin kodlanması için. Örneğin, koçanın üzerinde göründü CP866, bir şekilde, Rus alfabesinin sembollerini ve ASCII'nin genişletilmiş bir versiyonunu kazanmak mümkün oldu. Tobto. її Tablonun üst kısmı, üzerine gelinen üç ekran görüntüsünde sunulduğu için Aska'nın temel sürümüyle (Latince'de 128 karakter, sayılar ve diğer saçmalıklar) neredeyse çakıştı ve eksen zaten CP866 ile tablonun alt kısmı kod işaretleri (Rus harfleri ve orada her türlü sözde grafik):
Bachite, sağ tarafta sayılar 8 ile başlar, çünkü 0'dan 7'ye kadar olan sayılar, ASCII temel bölümünden önce görülür (div. ilk ekran görüntüsü). dahil CP866 matematik kodu 9C'deki Rusça "M" harfi (çift sıra 9'un retinasında ve on altıncı sayı sisteminde C sayısı), bir bayt bilgi ile yazılabilir, ancak çiftin netliği için Rusça karakterlerle yazı tipinin metinde sorunsuz görünmesi. Sesler böyle bir miktardan geldi CP866'da sözde grafikler? Burada, grafik işletim sistemlerinin şimdi olduğu gibi bir genişlemesi varsa, Rusça metin için kodlamanın daha da değişken bir şekilde genişletildiğini belirtmekte fayda var. Ve Dosi'de ve buna benzer metin işlemleri, sözde grafik metinlerin biraz çirkin bir tasarımına bile izin verdi ve bunun için CP866 ve aynı yaştaki tüm diğerleri, Ask'ın genişletilmiş sürümleri kategorisinden temizlendi. CP866, IBM tarafından geliştirildi, ancak Rusça dil sembolleri için bir dizi kod da genişletildi, örneğin aynı türe (ASCII uzantıları) kadar görülebilir KOI8-R:
її çalışması ilkesi, daha önce açıklanan trohi CP866'nınkiyle aynıdır - metnin cilt karakteri tek bir bayt ile kodlanır. Ekran görüntüsü KOI8-R tablosunun diğer yarısını gösterir, çünkü ilk yarının ilk yarısı, bu makalenin ilk ekran görüntüsünde gösterildiği gibi temel Sor'a dayanmaktadır. KOI8-R kodlamasının özellikleri arasında, örneğin CP866 oluşturulduğundan, bu tablodaki Rusça harflerin alfabetik sırayla olmadığı not edilebilir. İlk ekran görüntüsüne (temel kısım, tüm genişletilmiş kodlamalara nasıl girileceğine) bakarsanız, KOI8-R'de Rus harflerinin tablonun aynı ortasında sıralandığına, Latin alfabesinin harflerinin içinde olduğuna dikkat edin. tablonun ilk kısmı. Toplamda bir vuruş (yedinci adımda iki veya 128) vermek için Rus sembollerinden Latin usulüne geçişin netliği adına bütün kırıldı.

Windows 1251 - ASCII'nin güncel sürümü

Metin kodunun daha da geliştirilmesi, grafik işletim sistemlerinin popülerlik kazanması ve kısa sürede bunlarda psödografi kullanımına duyulan ihtiyaçtan kaynaklanıyordu. Sonuç olarak, grubun adı, kendi hikayesinde olduğu gibi, daha önce olduğu gibi, Ask'ın genişletilmiş versiyonlarıydı (metindeki bir karakter, birden fazla bayt bilgi tarafından kodlanmıştır), ancak psödografikte semboller kullanılmamıştır. Koku, Amerikan Standartlar Enstitüsü tarafından bozulan sözde ANSI kodlarına kadar uzanıyor. Kiril alfabesinin adı da Rus dilinin desteğiyle varyant için seçilmiştir. Bunun poposu buti olabilir pencereler 1251. Вона вигідно відрізнялася від використовуваних раніше CP866 і KOI8-R тим, що місце символів псевдографіки в ній зайняли символи російської типографіки (крім знака наголосу), а також символи, що використовуються в близьких до російської слов'янських мовах (українській, білоруській і т. d.). ):
Bu kadar geniş bir Rus dili kodlama yelpazesi sayesinde, yazı tiplerinde ve yazılımda, ana akım yavaş yavaş doğrulandı ve sık sık sizi kullandık, shanovnі chitachі, sizin için krakozyabri, metinde muzaffer olan sürümde bir başıboş olsaydı. Дуже часто вони вилазили при надсиланні та отриманні повідомлень електронною поштою, що спричинило створення дуже складних перекодувальних таблиць, які, власне, вирішити цю проблему докорінно не змогли, і найчастіше користувачі для листування використовували трансліт латинських літер, щоб уникнути горезвісних кракозябрів при використання російських кодувань подібних CP866, KOI8-R veya Windows 1251'e. Aslında, Rusça metnin yerini almak için kullanılan hatalar, metin mesajının kodlandığı, görünmediği için bu filmin yanlış kodlanmasının sonucuydu. CP866'nın yardımı için kodlanmış semboller, Windows 1251 kod tablosunu taklit etmeye çalışın, kısayolu kullanın (sessizce yazarak karakterler) ve bildirim metnini tamamen değiştirdiğini görün.
Benzer bir durum genellikle sitelerin, forumların veya blogların oluşturulması ve özelleştirilmesi için suçlanır, eğer Rusça karakterli metin yanlış kodlamada affedilirse, sitede zamochuvannyam için saldırıya uğramış gibi veya yanlış metin düzenleyicide, yorulmak bilmeyen bir gözle gördüğüm bazı suçlamalar. Sürekli olarak zengin nabridla tırmanan kişisel olmayan coduvans ve krakozyabry ile böyle bir durum, yeni bir evrensel varyasyonun yaratılmasından önce, sanki her şeyin yerini alacakmış gibi ve metnin kökündeki virishila b, naresht'in fikrini değiştirmiş gibi görünüyordu. sorun Çince'ye benzer dil sorunu Kırım'a dayanıyordu, ancak dilin sembolleri daha zengindi, 256'nın altındaydı.

Unicode (Unicode) - evrensel kodlama UTF 8, 16 ve 32

Modern pvdenno-shidnoy Asia grubunun binlerce karakteri, ASCII'nin genişletilmiş sürümlerinde karakterleri kodlamak için görülen bir bayt bilgide tanımlanamadı. Sonuç olarak, adı altında bir konsorsiyum oluşturuldu. tek kod(Unicode - Unicode Konsorsiyumu), endüstride bugata olan spіvpratsі ile (bu, rіblyєє yazılımı, khto kodє zalіzo, khto svіdіє yazı tipi), evrensel koduvannya tekst görünümünde yakі bіlіkavlenі. Unicode konsorsiyumu altında tanıtılan ilk varyasyon bula idi. UTF-32. Kodlamanın başlığındaki sayı, bir karakteri kodlamak için gereken bit sayısı anlamına gelir. 32 bit, yeni evrensel UTF kodlamasında tek bir karakteri kodlamak için gereken 4 bayta kadar bilgi ekler. Sonuç olarak, metin içeren aynı dosya, ASCII'nin genişletilmiş sürümünde ve UTF-32'de kodlamalar, davanın geri kalanında genişleme (önem) dört kat daha fazladır. Bu kötü, ama şimdi PTF'nin yardımıyla iki kişilik daha pahalı olan işaretlerin sayısını otuz diğer adımda kodlama fırsatımız var ( milyarlarca sembol, yaki pokriyut be-yak devasa bir rezervden gerçekten gerekli değer). Ale Bagan, Büyük Movari Gruplarının Ülkesi Büyük Kilkіst işaretidir Vikoristovati codovanniym'de keskisiz pişirmedim, nit-iki etiketinin yerlisindeki prote etiketlendi ve sonuç olarak kurtarıldı. Bu zengin ve böyle bir para israfına kimse izin veremezdi. Unicode'un geliştirilmesinden sonra ortaya çıktı UTF-16, Uzakta Yaka vyyshla nastіlki, umovchannyam için alınan scho bula, biz vikoristovuyutsya gibi tüm semboller için temel bir genişlik olarak. Bir karakteri kodlamak için iki bayt vardır. Nasıl göründüğümüzü merak edelim. Windows işletim sisteminde "Başlat" - "Programlar" - "Aksesuarlar" - "Hizmetler" - "Sembol Tablosu" yolundan gidebilirsiniz. Sonuç olarak, sisteminizde kurulu tüm font sistemlerinin vektör formları ile bir tablo görüntülenir. "Ek Seçenekler"de Unicode karakterleri seçerseniz, dış görünüm yazı tipi için yenisi de dahil olmak üzere tüm karakter aralığını kullanabilirsiniz. Konuşmadan önce, olup olmadıklarına tıklayarak iki bayt yogo söyleyebilirsiniz. UTF-16 biçim kodu, On dört on altı basamakla eklenenler:
UTF-16'da 16 bit yardımı ile kaç karakter kodlanabilir? 65536 (on altı adımda iki) ve sayının kendisi Unicode'da taban alanı olarak alındı. Krіm tsgogo, ona yardım etmek için kodlamanın bir yoludur ve iki milyona yakın znіkіv, ayrıca genişleyen metin genişliğiyle çevrilidir. Ne yazık ki, Unicode kodlamanın sürümü, örneğin yalnızca İngilizce dilinde programlar yazanlar için fazla memnuniyet getirmedi, çünkü ASCII'nin genişletilmiş sürümüne UTF-16'ya geçtikten sonra, belgeler iki katına çıktı (her bir bayt için bir bayt). UTF-16'da aynı karaktere bayt cinsinden bir karakter). Unicode konsorsiyumundaki herkesin ve her şeyin memnuniyeti için iptal edildi bir kodla gel hayatın değişimi. Її UTF-8 olarak adlandırılmıştır. Popri adından da anlaşılacağı gibi, tobto dovzhina değil. Metnin dış görünüm karakteri, altı bayta kadar bir dizide kodlanabilir. Uygulamada, UTF-8'in yalnızca bir ila iki bayt aralığı vardır, bu nedenle teorik olarak birkaç baytlık bir kod için herhangi bir şey ortaya çıkarmak imkansızdır. İçindeki tüm Latin karakterleri, eski güzel ASCII'de olduğu gibi bir bayt olarak kodlanmıştır. Dikkat çekicidir, kodlama zamanlarında Latince'den daha az şey vardır, bu programlarda gezinin, Unicode'u anlamıyorlarsa, hepsi aynı, UTF-8'de kodlanmış olanları okuyun. Tobto. Aska'nın temel kısmı basitçe Unicode konsorsiyumunun beynine geçti. UTF-8'deki Kiril karakterler iki bayt olarak kodlanmıştır ve örneğin Gürcüce karakterler üç bayt olarak kodlanmıştır. UTF 16 ve 8'in oluşturulmasından sonra Unicode Konsorsiyumu ana sorunu çözdü - şimdi elimizde yazı tipleri tek kod alanı kullanır. Ve şimdi onların yazıcıları metindeki sembollerin vektör biçimlerini doldurmak için kendi güçlerini kullanamıyorlar. "Simgeler Tablosu"nun üzerinde gezinirken, farklı yazı tiplerinin karakter sayısını vurguladığı açıktır. Unicode yazı tiplerinin çoğu, makul düzeyde bile önemli olabilir. Ve şimdi, kokular farklı kodlamalar için yaratıldıkları için değil, yazı tipini bir yazı tipine doldurdukları için ya da bu chi ve diğer vektör formları ile tek bir kod boşluğunu sonuna kadar doldurmadıkları için değerlendiriliyor.

Rus mektuplarının Krakozyabri vekili.

Şimdi krakozyabri metnini nasıl değiştireceklerini merak edelim, yoksa Rusça metin için doğru kodlama nasıl seçilir. Peki, ya metnin kendisini düzenlediğiniz ya da farklı metin parçaları için kod oluşturduğunuz o programda ayarlanmıştır. Bu metin dosyalarının oluşturulmasını düzenlemek için, bence, özellikle Html ve PHP editörü Notepad ++ iyidir. Vіm, vіn, yüzlerce iyi programlama ve düzenin sözdizimini ve ayrıca ek eklentiler için genişletme olasılığını değiştirebilir. Yardım için mucizevi programın rapor incelemesini okuyun. Notepad ++'ın üst menüsünde, sitenizde mevcut olan seçeneği kilitlemek için değiştirebileceğiniz bir “Kodlama” öğesi vardır:
Joomla 1.5 ve daha fazlasındaki bir sitenin yanı sıra WordPress'teki bir blog için, bir seçenek belirlemek için kısayolların görünümünü izleyin Malzeme Listesi olmadan UTF8. BOM öneki nedir? Sağda, UTF-16 kodlaması kırılmışsa, doğrudan bir sırayla (örneğin, 0A15) olduğu gibi bir sembole bir kod yazmak mümkün olduğu için, böyle bir cümleyi ona vidaladılar. (150A). Ve programların anlaması, sırayla kodu okuması ve ortaya çıkması için malzeme listesi(Bayt Sırası İşareti veya başka bir deyişle bir imza), belgelerin koçanı üzerine üç ek bayt eklenmesiyle kendini gösterir. UTF-8 kodlamasında, Unicode konsorsiyumuna hiçbir Malzeme Listesi aktarılmadı ve buna bağlı olarak, bu tür programlara bir imza (belgenin koçanı üzerindeki en iyi üç baytı) eklemek, kodu okumaya değer. Bu nedenle, dosyaları UTF'ye kaydetmek adına BOM'suz (imzasız) seçeneği seçmek sizin sorumluluğunuzdadır. Bu rütbede çok uzaktasın kendinizi krakozyabriv şeklinde güvenceye alın. Windows'taki bazı programların bu işi yapamaması dikkat çekicidir (UTF-8'den BOM olmadan metin kaydedemez), örneğin aynı sefil Windows Not Defteri. Vіn belgeyi UTF-8'den alır, ancak hepsi aynı şekilde koçana bir imza (üç ek bayt) ekler. Ayrıca, bu baytlar yalnızca kendileri olacaktır - kodu doğrudan sırayla okuyun. tsyu drіbnitsyu aracılığıyla sunuculardaki Ale sorunu suçlayabilir - vilіzu krakozyabri. Yani herhangi bir zamanda harika Windows not defterine aldanmayın Sitenizdeki belgeleri düzenlemek için, böylece yanlışlıkların ortaya çıkmasına aldırmazsınız. En iyi ve en basit seçenek olarak, pratik olarak kısa ömürlü olmayan ve bazı avantajlardan oluşan Notepad ++ düzenleyicisini kullanıyorum. Notepad ++ ile bir kodlama seçerken, metni özünde Unicode standardına daha yakın olan UCS-2 kodlamasına dönüştürebileceksiniz. Not defteri, metni ANSI'de de kodlayabilir, bu nedenle. %100 Rusça bizim tarafımızdan üç kat daha fazla Windows 1251 anlatılacaktır. Herhangi bir bilgi alıyor musunuz? Windows işletim sisteminizin kayıt defterinde kayıtlıdır - ANSI zamanlarından kodlama seçimi gibi, OEM zamanlarından seçim gibi (Rus filmi için CP866 olacaktır). Kilitleme için bilgisayarınıza başka bir dil yüklerseniz, kodlama, kendi diliniz için aynı ANSI veya OEM koduyla değiştirilecektir. Belgeyi ihtiyacınız olan kodlamadan Notepad++'a kaydederseniz veya belgeyi düzenlemek için siteden açarsanız, düzenleyicinin sağ alt köşesine adı ekleyebilirsiniz: Shchob niknut krakozyabriv, yukarıdaki açıklamalar dışında, sitenin tüm taraflarının çıktı kodunun başlığına kodlamanın kendisiyle ilgili bilgileri yazmak daha iyi olacaktır, böylece sunucu veya yerel ana bilgisayar dolandırıcıyı suçlamaz. Vzagali, hypertext düzeninin tüm movs'larında, kodlamanın metne belirtildiği, keyfi olarak seslendirilmiş xml, Html creme kullanılır.< ? xml version= "1.0" encoding= "windows-1251" ? >Her şeyden önce, kodu analiz edin, tarayıcı galip olanın hangi sürümünün olduğunu ve filmdeki karakterlerin kodunun nasıl yorumlanması gerektiğini bilecektir. Ancak, belgeyi varsayılan Unicode'dan kaydederseniz, xml belirsizliğini atlayabilirsiniz (kodlama UTF-8'de olacaktır, bu da BOM veya UTF-16 olmaması anlamına gelir, yani BOM є anlamına gelir). Eklemek için Html film belgesinin zamanında, kodlama değiştirilir meta öğesi, kıvrılan ve kapanan Head etiketinin arasına yazılır: < head> . . . < meta charset= "utf-8" > . . . < / head>Bu giriş, Html 4.01 standardında benimsendiği gibi güçlü bir şekilde revize edilmiştir, ancak daha sonra yavaş yavaş tanıtılan yeni standart Html 5'te ve verilen anda galip gelen tarayıcılar tarafından doğru bir şekilde anlaşılacaktır. Bir fikir olarak, belgenin Html kodlamasındaki Meta öğesi daha kısa olacaktır. yakomoga belge başlığında daha yüksektir, böylece ilk karakterin metnine yazarken, temel ANSI (her zaman ve herhangi bir varyasyonda doğru bir şekilde okunur) değildir, tarayıcı, bu karakterlerin kodunun nasıl yorumlanacağı hakkında anne bilgisinden suçludur. Posilannya en uzaklarda

© 2022 androidas.ru - Android hakkında her şey