Виразки та граблі CSV та Excel: проблеми та рішення. Excel у CSV з кодуванням UTF8 Кодування з csv в excel

Головна / Основний функціонал

У мене є файл Excel, який має деякі іспанські символи(Тільди і т. д.), що мені потрібно перетворити на файл CSV для використання як файл імпорту. Однак, коли я зберігаю як CSV, він спотворює "спеціальні" іспанські символи, які не є символами ASCII. Здається, що це також відбувається з лівими та правими лапками та довгими тире, які, здається, походять від вихідного користувача, що створює файл Excel у Mac.

оскільки CSV - це просто текстовий файл, я впевнений, що він може обробляти UTF8 кодування, тому я припускаючи, що це обмеження Excel, але я шукаю спосіб отримати з Excel в CSV і зберегти символи, відмінні від ASCII.

30 відповідей

Примітка: будьте обережні з конфіденційними даними з листів Google.

після збереження CSV під Excel в командному рядку ставимо:

Iconv -f cp1250 -t utf-8 file-encoded-cp1250.csv > file-encoded-utf8.csv

(Не забудьте замінити CP1250 вашим кодуванням).

працює швидко і відмінно підходить для великих файлів, таких як база даних поштових кодів, які не можуть бути імпортовані до GoogleDocs (межа 400 000 осередків).

передбачаючи середовище Windows, збережіть і працюйте з файлом, як завжди, в Excel, але потім відкрийте збережений файл Excel у Gnome Gnumeric (безкоштовно). Збережіть таблицю Gnome Gnumeric як CSV, яка для мене в будь-якому випадку зберігає її як UTF-8 CSV.

простий спосіб зробити це: скачати open office (), завантажте електронну таблицю та відкрийте файл excel (.xls або .xlsx). Потім просто збережіть його як текстовий CSV-файл, і відкриється вікно з проханням зберегти поточний формат або зберегти як формат ODF. виберіть "Зберегти поточний формат" і в новому вікні виберіть варіант, який працює краще для вас, відповідно до мови, якою написаний ваш файл. Для іспанської мови виберіть Західна Європа (Windows-1252/WinLatin 1) і файл працює лише штраф. Якщо вибрати Unicode (UTF-8), він не працюватиме з іспанськими персонажами.

Я також зіткнувся з такою самою проблемою, але для цього є просте рішення.

Відкрийте файл xlsx в Excel 2016 або вище.
У "Зберегти як" виберіть цю опцію: "(CSV UTF-8 (з роздільниками комами)*.csv)"

Він працює відмінно, і створюється файл CSV, який можна імпортувати в будь-яке програмне забезпечення. Я імпортував цей csv-файл у свою базу даних SQLITE, і він добре працює з усіма символами unicode.

Я написав невеликий скрипт Python, який може експортувати листи до UTF-8.

вам просто потрібно надати файл Excel як перший параметр, а потім листи, які ви хочете експортувати. Якщо аркуші не надані, сценарій експортує всі аркуші, які є у файлі Excel.

#!/usr/bin/env python # export data sheets from xlsx to csv from openpyxl import load_workbook import csv from os import sys reload(sys) sys.setdefaultencoding("utf-8") def get_all_sheets(excel_filework): s = load_workbook(excel_file,use_iterators=True,data_only=True) all_worksheets = workbook.get_sheet_names() для worksheet_name в all_worksheets: sheets.append(worksheet_name) return sheets def csv book(excel_file,use_iterators=True ,data_only=True) для worksheet_name в листах: print("Export" + worksheet_name + "...") try: worksheet = workbook.get_sheet_by_name(worksheet_name) except KeyError: print("Could not find "+ works. (1) your_csv_file = open("".join(), "wb") wr = csv.writer(your_csv_file, quoting=csv.QUOTE_ALL) для ряду в worksheet.iter_rows(): = = = = cell in row: lrow. append(cell.value) wr.writerow(lrow) print(" ... done") your_csv_file.close() if not 2<= len(sys.argv) <= 3: print("Call with " + sys.argv + " ") sys.exit(1) else: sheets = if len(sys.argv) == 3: sheets = list(sys.argv.split(",")) else: sheets = get_all_sheets(sys.argv) assert( sheets != None and len(sheets) > 0) csv_from_excel(sys.argv, sheets)

З потребою змінювати кодування тексту часто стикаються користувачі, які працюють у браузерах, текстових редакторах і процесорах. Тим не менш, і при роботі в табличному процесорі Excel така необхідність також може виникнути, адже ця програма обробляє не лише цифри, а й текст. Давайте розберемося, як змінити кодування в Екселі.

Урок: Кодування в Microsoft Word

Кодування тексту - це набір електронних цифрових виразів, які перетворюються на зрозумілі для користувача символи. Існує багато видів кодування, у кожного з яких є свої правила та мова. Вміння програми розпізнавати конкретну мову і перекладати її на зрозумілі для звичайної людини знаки (літери, цифри, інші символи) визначає, чи додаток зможе працювати з конкретним текстом чи ні. Серед популярних текстових кодувань слід виділити такі:

Windows-1251;
KOI-8;
ASCII;
ANSI;
UKS-2;
UTF-8 (Юнікод).

Останнє найменування є найпоширенішим серед кодувань у світі, оскільки вважається свого роду універсальним стандартом.

Найчастіше програма сама розпізнає кодування і автоматично перемикається на неї, але в окремих випадках користувачеві потрібно вказати додатку її вигляд. Тільки тоді він зможе коректно працювати з кодованими символами.

Найбільша кількість проблем із розшифровкою кодування у Excel зустрічається при спробі відкриття файлів CSV або експорті файлів txt. Часто замість звичайних букв при відкритті цих файлів через Ексель ми можемо спостерігати незрозумілі символи, так звані «кракозябри». У цих випадках користувачеві потрібно зробити певні маніпуляції для того, щоб програма почала коректно відображати дані. Існує кілька способів вирішення цієї проблеми.

Спосіб 1: зміна кодування за допомогою Notepad++

На жаль, повноцінного інструменту, який дозволяв би швидко змінювати кодування в будь-якому типі текстів Ексель немає. Тому доводиться з цією метою використовувати багатокрокові рішення або вдаватися до допомоги сторонніх додатків. Одним із найнадійніших способів є використання текстового редактора Notepad++.

Незважаючи на те, що цей спосіб базується на використанні стороннього програмного забезпечення, він є одним із найпростіших варіантів для перекодування вмісту файлів під Ексель.

Спосіб 2: застосування Майстра текстів

Крім того, зробити перетворення можна і за допомогою вбудованих інструментів програми, а саме Майстра текстів. Як не дивно, використання цього інструменту дещо складніше, ніж застосування сторонньої програми, описаної в попередньому методі.

Спосіб 3: збереження файлу у певному кодуванні

Буває й обернена ситуація, коли файл потрібно не відкрити з коректним відображенням даних, а зберегти у встановленому кодуванні. В Екселі можна виконати і це завдання.

Документ збережеться на жорсткому диску або знімному носії в кодуванні, яке ви визначили самі. Але потрібно врахувати, що тепер документи, збережені в Excel, завжди зберігатимуться в даному кодуванні. Для того, щоб змінити це, доведеться знову заходити у вікно "Параметри веб-документа"та змінювати налаштування.

Існує й інший шлях зміни параметрів кодування збереженого тексту.

CSV є стандартом де-факто для зв'язку між собою різнорідних систем, передачі та обробки об'ємних даних з «жорсткою», табличною структурою. У багатьох скриптових мовах програмування є вбудовані засоби розбору та генерації, він добре зрозумілий як програмістам, так і рядовим користувачам, а проблеми з самими даними в ньому добре виявляються, як кажуть, на око.

Історія цього формату налічує щонайменше 30 років. Але навіть зараз, в епоху повального використання XML, для вивантаження та завантаження великих обсягів даних, як і раніше, використовують CSV. І, незважаючи на те, що сам формат досить непогано описаний RFC, кожен його розуміє по-своєму.

У цій статті я спробую узагальнити існуючі знання про цей формат, вказати на типові помилки, а також проілюструвати описані проблеми на прикладі кривої реалізації імпорту-експорту в Microsoft Office 2007. Також покажу, як оминати ці проблеми (в т.ч. автоматичне перетворення типів Excel-ом DATETIME і NUMBER) при відкритті.csv.

Почнемо з того, що форматом CSV насправді називають три різні текстові формати, що відрізняються символами-розділювачами: власне сам CSV (comma-separated values - значення, розділені комами), TSV (tab-separated values - значення, розділені табуляціями) та SCSV (Semicolon separated values - значення, розділені крапкою з комою). У житті всі три можуть називатися одним CSV, символ-розділювач у кращому випадку вибирається під час експорту чи імпорту, а частіше його просто «зашивають» усередину коду. Це створює безліч проблем у спробі розібратися.

Як ілюстрацію візьмемо здавалося б тривіальне завдання: імпортувати до Microsoft Outlook дані з таблиці до Microsoft Excel.

У Microsoft Excel є засоби експорту до CSV, а Microsoft Outlook — відповідні кошти імпорту. Що могло бути простіше — зробив файлик, «годував» поштовій програмі і справа зроблена? Як би не так.

Створимо в Excel тестову табличку:

… і спробуємо експортувати її до трьох текстових форматів:

Який висновок ми робимо з цього?.. Те, що тут Microsoft називає CSV (розділювачі - коми), насправді є форматом з роздільниками крапка з комою. Формат у Microsoft – суворо Windows-1251. Тому, якщо у Excel є Unicode-символи, вони на виході в CSV відобразяться в знаки запитання. Також те, що перекладами рядків завжди є пара символів, те, що Microsoft тупо бере в лапки все, де бачить крапку з комою. Також те, що якщо у вас немає Unicode-символів взагалі, можна заощадити на об'ємі файлу. Також те, що Unicode підтримується тільки UTF-16, а не UTF-8, що було б дуже логічним.

Тепер побачимо, як на це дивиться Outlook. Спробуємо імпортувати ці файли з нього, вказавши такі джерела даних. Outlook 2007: Файл -> Імпорт та експорт… -> Імпорт з іншої програми або файлу. Далі вибираємо формат даних: «Значення, розділені комами (Windows)» та «Значення, розділені табуляцією (Windows)».

Два майкрософтівські продукти не розуміють один одного, у них геть-чисто відсутня можливість передати через текстовий файл структуровані дані. Для того, щоб усе запрацювало, потрібні «танці з бубном» програміста.

Ми пам'ятаємо, що Microsoft Excel може працювати з текстовими файлами, імпортувати дані з CSV, але у версії 2007 він робить це дуже дивно. Наприклад, якщо просто відкрити файл через меню, то він відкриється без будь-якого розпізнавання формату, просто як текстовий файл, повністю вміщений в першу колонку. Якщо зробити дабл-клік на CSV, Excel отримує іншу команду і імпортує CSV як слід, не ставлячи зайвих питань. Третій варіант – вставка файлу на поточний аркуш. У цьому інтерфейсі можна налаштовувати роздільники, одразу ж дивитися, що вийшло. Але одне: працює це погано. Наприклад, Excel при цьому не розуміє загартованих перекладів рядків усередині полів.

Більше того, одна і та ж функція збереження CSV, викликана через інтерфейс і через макрос, працює по-різному. Варіант із макросом не дивиться в регіональні налаштування взагалі.

Стандарту CSV як такого, на жаль, немає, але тим часом існує т.зв. memo. Це RFC 4180 2005 року, в якому описано все досить толково. Через відсутність нічого більшого, правильно дотримуватися хоча б RFC. Для сумісності з Excel слід врахувати його собенности.

між рядками - переведення рядка CRLF [на мій погляд, їм не варто обмежувати двома байтами, тобто. як CRLF (0×0D, 0×0A), так і CR 0×0D]
роздільники - коми, в кінці рядка не повинно бути комою,
в останньому рядку CRLF не обов'язковий,
перший рядок може бути рядком заголовка (не позначається при цьому)
прогалини, що оточують кому-розділювач, ігноруються.
якщо значення містить у собі CRLF, CR, LF (символи-розділювачі рядків), подвійну лапку або кому (символ-розділювач полів), то укладання значення в лапки обов'язково. В іншому випадку – припустимо.
тобто. допустимі переклади рядків усередині поля. Але такі значення полів повинні бути обов'язково загартовані,
якщо всередині загартованої частини зустрічаються подвійні лапки, то використовується специфічний квотинг лапок CSV - їх дублювання.

Ось у нотації ABNF опис формату:

File = record * (CRLF record) header = name * (COMMA name) record = field * (COMMA field) name = field field = (escaped / non-escaped) escaped = DQUOTE * (TEXTDATA / COMMA / CR / LF / 2DQUOTE ) DQUOTE non-escaped = *TEXTDATA COMMA = %x2C DQUOTE = %x22 LF = %x0A CRLF = CR LF TEXTDATA = %x20-21 / %x23-2B / %x2D-7E

Також при реалізації формату слід пам'ятати, що оскільки тут немає вказівників на число та тип колонок, оскільки немає вимоги обов'язково розміщувати заголовок, тут є умовності, про які необхідно не забувати:

рядкове значення з цифр, не укладене в лапки може бути сприйняте програмою як числове, через що може бути втрачена інформація, наприклад, нулі, що лідирують,
кількість значень у кожному рядку може відрізнятись і необхідно правильно обробляти цю ситуацію. В одних ситуаціях потрібно попередити користувача, в інших – створювати додаткові колонки та заповнювати їх порожніми значеннями. Можна визначити, що кількість колонок задається заголовком, а можна додавати їх динамічно, в міру імпорту CSV,
Квотити лапки через "слеш" не за стандартом, робити так не треба.
Оскільки типізації полів немає, немає вимоги до них. Розділювачі цілої та дробової частин у різних країнах різні, і це призводить до того, що той самий CSV, згенерований додатком, в одному екселі «розуміється», в іншому — ні. Тому що Microsoft Office орієнтується на регіональні налаштування Windows, а там може бути будь-що. У Росії там зазначено, що роздільник - кома,
Якщо CSV відкривати не через меню "Дані", а безпосередньо, то Excel зайвих питань не ставить, і робить як йому здається правильним. Наприклад, поле зі значенням 1.24 він розуміє за умовчанням як "24 січня"
Ексель вбиває провідні нулі і наводить типи навіть тоді, коли значення вказано у лапках. Робити так не треба, це помилка. Але щоб оминути цю проблему екселя, можна зробити невеликий «хак» — значення почати зі знака «рівно», після чого поставити в лапках те, що необхідно передати без зміни формату.
Ексель має спецсимвол «рівно», який у CSV розглядається як ідентифікатор формули. Тобто, якщо CSV зустрінеться =2+3, він складе два і три і результат впише в комірку. За стандартом він цього робити не повинен.

Приклад валідного CSV, який можна використовувати для тестів:

Прізвище, Ім'я, Адреса, Місто/штат, індекс, просто рядок Іванов,Іван, Леніна 20, Москва, 08075, "1/3" Tyler, John,110 terrace, PA,20121, "1.24" "Петрів ""Кул" "", Петро,120 Hambling St., NJ,08075, "1,24" Смирнов,Вася,"7452 Street ""Near the Square"" road", York, 91234, "3-01" ,Миша,Ленинград, 00123, "03-01" "Джон ""Чорна голова"", Клод",Рок,"", Маями бич,00111, "0000" Сергій,

Точно такий же SCSV:

Прізвище; Ім'я; Адреса; Місто/штат; індекс; просто рядок Іванов; Іван; Леніна 20; Москва; 08075; "1/3" Tyler; John;110 terrace; PA; 20121; "1.24" "Петрів ""Кул"""; Петя;120 Hambling St.; NJ; 08075; "1,24" Смирнов; Вася; "7452 Street" "Near the Square" "road"; York; 91234; "3-01"; Міша;; Ленінград; 00123;"03-01" "Джон ""Чорна голова""; Клод";Рок;""; Травнями бич;00111; "0000" Сергій;

Перший файлик, який реально COMMA-SEPARATED, будучи збереженим в .csv, Excel не сприймається взагалі.

Другий файл, який за логікою SCSV, екселом сприймається і виходить ось що:

Помилки Excel-я при імпорті:

Вчилися прогалини, навколишні роздільники
Останній стовпець взагалі до ладу не розпізнався, незважаючи на те, що дані в лапках. Виняток становить рядок із «Петровим» — там коректно розпізналося 1,24.
У полі індекс Excel опустив провідні нулі.
у правому полі останнього рядка прогалини перед лапками перестали вказувати на спецсимвол

Якщо ж скористатися функціоналом імпорту (Дані -> З файлу) і обізвати при імпорті всі текстові поля, то буде наступна картина:

З приведенням типів спрацювало, зате тепер не обробляються нормально переклади рядків і залишилася проблема з провідними нулями, лапками та зайвими пробілами. Та й користувачам так відкривати CSV украй незручно.

Є ефективний спосіб, як змусити Excel не наводити типи, коли нам це не потрібно. Але це буде CSV "спеціально для Excel". Робиться це приміщенням знака "=" перед лапками скрізь, де потенційно може виникнути проблема з типами. Заодно прибираємо зайві прогалини.

Прізвище;Ім'я;Адреса;Місто/штат;індекс;просто рядок Іванов;Іван;Леніна 20;Москва;="08075";="1/3" Tyler; John;110 terrace;PA;="20121";="1.24" "Петрів ""Кул""";Петя;120 Hambling St.;NJ;="08075";="1,24" Смирнов;Вася;" 7452 Street ""Near the Square"" road";York;="91234";="3-01"; ;Клод";Рок;"";Маями бич;="00111";="0000" Сергій;;

І ось що трапляється, якщо ми відкриваємо цей файлик в екселі:

Резюмую.

Щоб згенерувати такий CSV, яким можна було б користуватися, користувачеві потрібно дати можливість зробити наступні параметри перед експортом:

вибрати кодування. Як правило, важливим є UTF-8, UTF-16, Windows-1251, KOI8-R. Найчастіше інших варіантів немає. Одна з них має йти за умовчанням. Якщо дані містять символи, що не мають аналогів у цільовому кодуванні, потрібно попереджати користувача, що дані будуть биті;
вибрати роздільник між полями. Варіанти - табуляція, кома, крапка з комою. За замовчуванням – точка з комою. Не забути, що й роздільник вводиться у тексті, то буде дуже непросто ввести туди табуляцію, це ще й недрукований символ;
вибрати роздільник між рядками(CRLF 0×0D 0×0A або CR 0×0D);
вибрати роздільник цілої та дробової частини для числових даних(Точка або кома).
вибрати, чи виводити рядок заголовка;
вибрати, яким чином здійснювати квотинг спецсимволів(особливо перекладів рядків та лапок). В принципі, можна відмовитися від стандарту і квотувати їх як \n і \", але потрібно в цьому випадку не забути квотувати самі \n, якщо вони зустрінуться і не забути зробити це опцією при експорті-імпорті. Але сумісність піде лісом, бо будь-який RFC-стандартний парсер конструкцію...,"abc", порахує за помилку;
зовсім в ідеалі - поставити галочку для Excel і враховувати там ті нестандартності, які внесла Майкрософт. Наприклад, замінювати значення числових полів, «схожих дату», на конструкцію ="<значение поля>«.
визначитися, чи потрібно залишати «хвіст» із порожніх роздільниківякщо він утворюється. Наприклад, з 20 полів лише перше містить дані, інші ж порожні. У підсумку, у рядку можна або ставити після першого 19 роздільників або не ставити. Для великих обсягів даних це може врятувати мілісекунди обробки та зменшити розмір файлу.

Щоб побудувати хороший і зручний імпортер CSV, необхідно пам'ятати наступне:

розбір файлу потрібно робити за лексемамивідповідно до граматики вище або користуватися готовими бібліотеками, що добре зарекомендували себе(Excel працює інакше, бо з імпортом проблема);
надавати користувачеві можливість вибрати кодування(топ 4 достатньо);
надавати користувачеві можливість вибрати роздільник між полями(кома, табуляція, точка з комою достатньо);
надавати користувачеві можливість вибрати роздільник між рядкамиАле крім варіантів CR і CRLF потрібно передбачити «CR або CRLF». Це пов'язано з тим, що, наприклад, Excel під час експорту таблиці з перекладами рядків всередині осередків експортує ці переклади рядків як CR, інші рядки поділяє CRLF. При цьому при імпорті файлу йому байдуже, CR там або CRLF;
надавати користувачеві можливість вибрати роздільник між цілою та дробовою частинами(кома або точка);
визначитися з методом розбору— спочатку читаємо все на згадку, потім обробляємо чи обробляємо рядок за рядком. У першому випадку може знадобитися більше пам'яті, у другому випадку помилка в середині викликає лише частковий імпорт, що може викликати проблеми. Переважно перший варіант.

Рауф Алієв,
заступник технічного директора Mail.Ru Group

Часто, працюючи з різними файлами у програмі "Ексель", користувач може зіткнутися з тим, що замість виразних букв буде незрозумілий шрифт, який неможливо прочитати. Виною всьому неправильне кодування. У цій статті ми поговоримо про те, як Excel змінити кодування, щоб слова можна було прочитати.

Спосіб перший: за допомогою Notepad ++

Так склалося, що змінити кодування тексту простіше в сторонній програмі, ніж у самому "Екселі". Саме тому ми зараз розглянемо спосіб, як Excel змінити кодування за допомогою програми Notepad++.

Отже, щоб правильно виконати всі дії, дотримуйтесь інструкцій:

Запустіть програму "Нотпад++".
Натисніть кнопку "Файл".
У меню виберете "Відкрити" (також це можна зробити, натиснувши поєднання клавіш CTRL+O).
У вікні провідника прокладіть шлях до потрібного файлу, кодування в якому неправильне, і натисніть кнопку "Відкрити".
У файлі натисніть кнопку "Кодіювання", що знаходиться над панеллю інструментів.
У меню виберіть пункт "Перетворити на UTF-8", оскільки саме це кодування програма "Ексель" сприймає на ура.
Натисніть кнопку "Зберегти", що знаходиться в лівій частині панелі інструментів, та закрийте вікно програми.

Ось і все, тепер ви знаєте, як в Excel поміняти кодування одним із способів. Хоч він є найшвидшим, найзручнішим і найпростішим, але є ще інші, про які замовчати ніяк не можна.

Спосіб другий: використання "Майстра текстів"

Безпосередньо в самій програмі Microsoft Excel теж є інструменти, які дозволять змінити кодування. Саме про таке і піде зараз мова, а точніше, про "Майстра текстів":

Відкрийте програму "Ексель". Зверніть увагу, що її потрібно запускати не подвійним кліком по файлу, який неправильно відображається, а безпосередньо програму з порожнім листом.
Перейдіть на вкладку "Дані".
Натисніть кнопку "Отримання зовнішніх даних", а у випадаючому меню виберіть "З тексту".
У вікні провідника вкажіть шлях до файлу, який має проблеми з кодуванням, і натисніть кнопку "Імпорт".
Тепер відкриється саме вікно "Майстра текстів". У ньому необхідно змінити формат файлу, тому натисніть на однойменний і виберіть звідти "Юнікод (UTF-8)".
Натисніть "Далі".
Наступне вікно також пропустіть, натиснувши кнопку "Далі", всі налаштування в ньому мають стояти за замовчуванням.
Тепер вам необхідно визначити формат даних стовпця файлу та відповідно до нього вибрати один із пунктів однойменного списку. За підсумком натисніть "Готово".

Після всього цього необхідно вказати найперший осередок, щоб дані помістилися на початок таблиці.

Як змінити кодування в Excel другим методом, відомо. Переходимо до третього.

Спосіб третій: збереження

Як змінити кодування в Excel? Для реалізації третього способу необхідно зробити низку таких дій:

Відкрийте файл у програмі.
Натисніть "Файл".
Виберіть "Зберегти як".
У меню виберіть розширення і натисніть "Сервіс", з випадаючого меню - "Параметри веб-документа".
У вікні, перейдіть у вкладку "Кодування" і оберіть її зі списку "Зберегти документ як".
Натисніть "OK".

Тепер залишається лише вказати папку, куди файл буде збережено. При подальшому відкритті текст повинен відображатися коректно.

Файли та документи, створені на комп'ютері, завжди мають кодування. Часто трапляється так, що при обміні файлами або завантаженні їх з інтернету кодування, в якому вони створені, не читається нашим комп'ютером. Причини можуть бути різні - як відсутність необхідного кодування в програмі, якої ми хочемо відкрити файл, так і просто відсутність деяких компонентів програми (додаткового пакета шрифтів, наприклад).

Нижче розглянемо, як змінити кодування файлу чи документа, що не читається, в різних програмах.

Зміна кодування на сторінці браузера

Для Google Chrome

Вибираємо меню «Параметри» → «Інструменти».
Рядок "Кодування" - наводимо мишею, і з'являється список можливих кодувань у браузері.
Вибираємо для російських сайтів "Windows 1251". Якщо не допоможе, пробуємо «Автоматично».

Для Opera

Натискаємо «Opera» → «Налаштування»
Зліва меню «Веб-сайти» → поле 2 «Відображення» → «Налаштувати шрифти»
У полі «Кодування» вибираємо «Кирилиця (Windows 1251)».

Для Firefox

Firefox → Установки → Вміст.
Навпроти рядка «За замовчуванням шрифт» натискаємо кнопку «Додатково».
Внизу вікна вибираємо "Кодування" &rarr "Кирилиця (Windows 1251)".

Зміна кодування у Word

Розглянемо процедуру зміни кодування на прикладі Word 2010

Відкриваємо документ.
Вкладка "Файл" → "Параметри".
Вибираємо рядок "Додатково". У розділі "Загальні" навпроти рядка "Підтверджувати перетворення формату файлу при відкритті" ставимо галочку. Натискаємо ОК.
Далі відкриється вікно "Перетворення файлу". Вибираємо "Кодований текст", тиснемо ОК.
Далі у вікні відзначаємо «Інше» і вибираємо зі списку кодування, яке відобразить необхідний текст. У вікні «Зразок» можна переглянути, як відображається текст у тому чи іншому кодуванні, яке ви вибрали.

Якщо пройдена процедура не допомогла відобразити документ, можна спробувати змінити шрифт. Іноді документ може відображатися у вигляді «квадратиків» або інших знаків, якщо програма не має відповідного шрифту.

Зміна кодування в Excel

Розглянемо процедуру зміни кодування для Excel 93-2004 та 2007:

Відкриваємо документ, що не читається, за допомогою програми Notepad++.
Вибираємо меню Encoding (Кодування) → Конвертувати в UTF-8.
Символи не зміняться, зміниться лише кодування внизу екрана. Далі вибираємо набір символів. Якщо це російська мова: Encoding → Character sets → Cyrillic → Windows-1251.
Натискаємо "Зберегти". Відкриваємо файл у Excel. Якщо текст не читається, спробуємо повторити кроки 3-4.

Зміна кодування тексту

Відкриваємо файл у стандартному текстовому процесорі Блокнот.
Натискаємо "Зберегти як".
У вікні збереження, що відкрилося, вибираємо місце, куди хочемо зберегти файл, тип документа - текстовий, а також ставимо інший тип кодування.
Зберегти.
Пробуємо відкрити документ.

Додатково читайте статтю