Який універсальний формат текстових файлів зберігає повністю. Формати текстових файлів

Головна / 2 Cool Reader

Слово "формат" має багато значень. В області комп'ютерних технологійпід терміном "формат" розуміється структура інформаційного об'єкта. Наприклад, форматом файлу називають спосіб організації елементів інформації (бітів, байтів) у файлі, а формат електронного документа визначає спосіб розташування та подання даних в електронному документі.

Існує багато різних форматів електронних документів. Загалом їх можна розділити на «однопрограмні», тобто контрольовані та підтримувані лише одним програмним розробником, та «багатопрограмні», які підтримуються кількома розробниками і можуть оброблятися різними програмами.

Основні формати електронних документів

1. Текстові формати. Вони найчастіше створюються за допомогою текстових процесорів. Найбільш поширеними текстовими форматами є:

1) однопрограмні формати Microsoft Word, WordPerfect, які мають розширення тієї програми, де створюються;

2) формат RTF, який підтримується різними програмними програмамиі при цьому зберігає задане форматування тексту;

в) формат PDF (Portable Document Format), який містить зображення сторінки, що включає текст та графіку. Файли у форматі PDF можуть бути прочитані за допомогою різних програм, призначених лише для читання файлів, однак створюються лише за допомогою програми Adobe Acrobat.

2. Графічні формати. Вони зберігають зображення (наприклад, фотографію, малюнок) і поділяються на два основні типи:

1) векторні формати, які зберігають зображення як набір геометричних фігур. Серед них найбільш поширені:

а) формат DXF (Drawing Interchange Format), який широко застосовується в програмах комп'ютерного дизайну, використовуваних інженерами, архітекторами;

б) формат EPS (Encapsulated PostScript), який широко використовується в настільних видавничих системах;

в) формат CGM (Computer Graphics Metafile) широко застосовується у багатьох графічних редакторах (наприклад, у редакторі Photoshop);

2) растрові формати, які зберігають зображення як набір пікселів. При зміні масштабу зображення растровий графіка отримує спотворення. Серед растрових форматів найпоширеніші:

а) формат BMP (Bitmap) – відносно низькоякісний формат, який найчастіше використовується в текстових процесорах;

б) формат TIFF (Tagged Image File Format), який широко застосовується в багатьох програмних додатках;

в) формат GIF (Graphics Interchange Format), який широко використовується в програмах, призначених для Інтернету.

3. Формати баз даних створюються з допомогою систем управління базами даних (СУБД). Вони складаються з полів та таблиць, що містять окремі елементи інформації. Програма дозволяє встановлювати зв'язок між розрізненими елементами. Наприклад, база даних про покупців може містити поля з іменами покупців, адресами та відомостями про покупки. Ці поля можуть бути організовані окремі таблиці (наприклад, одна таблиця всім полів з іменами покупців). Бази даних можна конвертувати в текстовий формат, але при цьому будуть втрачені зв'язки між полями та таблицями (наприклад, може вийти 10 сторінок імен, 10 сторінок адрес та 1000 сторінок відомостей про покупки, тобто нескладна інформація).

4. Формати електронних таблиць. Файли у форматі електронних таблиць зберігають у комірках числа та взаємозв'язку між цими числами. Так, один осередок може містити формулу, яка підсумовує дані двох інших осередків. Як і файли баз даних, файли електронних таблиць зазвичай мають формат тієї програми, з якої створено. Деякі програми можуть імпортувати та експортувати дані інших джерел, у тому числі програм, призначених для такого обміну даними (наприклад, формат DIF (Data Interchange Format). Файли електронних таблиць можна перетворити на текстові файли, але значення та взаємозв'язки між числами при цьому будуть втрачені .

5. Відео - та аудіоформати. Ці формати містять зображення, що рухаються (цифрове відео, анімацію) і звукові дані, які найчастіше створюються і переглядаються за допомогою відповідних програм і зберігаються в однопрограмному форматі. Найбільш використовуваними є формати Quick Time і MPEG (Motion Picture Experts Group).

6. Мови розмітки, також звані форматами розмітки, містять вбудовані інструкції щодо відображення та зрозумілості вмісту файлу. До них відносяться:

1) SGML (Standard Generalized Markup Language), який використовуєте у багатьох країнах світу у державних органах та є міжнародним стандартом;

2) HTML (Hypertext Markup Language), який використовується для відображення майже всієї інформації у мережі World Wide Web;

3) XML (Extensible Markup Language) – відносно проста мова, заснована на SGML і набула популярності при управлінні інформацією та обміні нею.

Формат PDF, створений фірмою Adobe Systems Inc., дуже популярний при обміні документами і широко використовується для документів мережі Інтернет, тому що дозволяє зберегти оригінальний зовнішній вигляд документів і ускладнює внесення змін до документа. За оцінкою компанії Adobe, вже півмільярда людей завантажили її. безкоштовну програмуПереглядаючи PDF-файли, багато підприємств вибрали цей формат як стандарт для передачі та зберігання документів, а чимало незалежних розробників пропонують продукти, що підтримують PDF, причому деякі безкоштовно.

Модифікована версія формату, названа PDF-Archive (PDF-A), розглядається за кордоном як один із двох основних форматів, які можуть у майбутньому використовуватися для архівного зберігання електронних документів. Другим форматом є XML.

Можна стверджувати, що найбільшого поширення у сфері управління нині отримали документи, створювані з допомогою текстових процесорів, особливо програми Microsoft Word. Значна кількість управлінських документів створюється і у форматі електронних таблиць (найчастіше за допомогою табличного процесора Microsoft Excel), та у форматі презентаційних слайдів (підготовлених за допомогою системи підготовки презентацій Microsoft PowerPoint). Чимало електронних документів породжують такі технології, що недавно з'явилися, як електронна пошта, відеоконференції, веб-сайти. У перспективі великими «виробниками» електронних документів можуть стати інші технології, наприклад геоінформаційні системи, операторські центри.

Кожен із форматів електронних документів має свої переваги та недоліки при використанні у документаційному забезпеченні управління. Наприклад, текстові формати (Word Perfect, Microsoft Word, RTF та ін.) зручні для проведення контекстного пошуку документів у базі даних, а графічні формати (PDF, TIFF та ін.) дозволяють отримати при скануванні зображення документа з усіма його зовнішніми особливостями, зберігати документи у тому вигляді, як і папері, з усіма підписами і візами.

Формат MS Word дуже зручний при редагуванні документа та групової роботі з ним, проте файл MS Word зберігає багато прихованої інформації (передусім про зроблені у файлі зміни) і, отже, дуже небезпечний з погляду витоку службової інформації. У ряді випадків, таких як комерційна пропозиціяабо проект контракту, прихована інформація дозволяє встановити, які були вихідні припущення і хто вплинув на текст найбільший вплив.

При груповій підготовці документа аналіз редагування дає можливість дізнатися не тільки прізвища людей, які її зробили, але і хто який саме внесок вніс у підсумковий варіант.

Основне питання, що виникає у зв'язку з форматами електронних документів, це питання конвертації та (або) міграції електронних документів. При конвертації змінюється формат електронного документа, а під час міграції відбувається переміщення електронного документа з однієї програмної платформи чи носія іншою без зміни формату. Однак і під час міграції може знадобитися конвертація електронного документа. Наприклад, при переміщенні електронного документа з операційної системи Macintoch до операційної системи Microsoft Windowsнеобхідно конвертувати електронний документ у новий формат (наприклад, RTF або Word 2000).

При цьому можливі 3 основні типи втрат, які необхідно враховувати при зберіганні електронних документів:

1) втрата даних. При втраті даних певною мірою втрачається і змістом документа. Електронний документ стає неповноцінним та недостовірним;

2) втрата зовнішнього вигляду, структури електронного документа. Наприклад, при конвертації текстових документівформат RTF можна втратити деякі особливості зовнішнього вигляду документів;

3) втрата зв'язків між даними (в електронних таблицях, базах даних) також робить документ неповноцінним.

Необхідно враховувати, що копія документа може бути юридично визнана такою лише у випадку, якщо вона створена перевіреним способом та є точною, повноцінною та надійною для тривалого використання.

Друге питання, пов'язане з форматами та управлінням електронними документами, - Це питання стиснення файлів (компресії). Перевагами стиснення файлів є економія місця при зберіганні, швидша і проста передача файлів. Недоліки стиснення файлів у тому, що може призвести до втрати даних. Крім того, воно викликає необхідність використання додаткового програмного забезпечення– програм стиснення файлів (WinZip, ZipMagic та інших.), яким також присуши проблеми старіння, багатоверсійності, залежність від платформи.

Можливості використання PDF-Archive формату в електронних архівах обмежені: зокрема, формат PDF-A не підходить для архівного зберігання аудіовізуальних документів.

Підбиваючи підсумки:Слід зазначити, що жоден із форматів електронних документів не може вважатися універсальним для тривалого архівного зберігання, оскільки досить швидко змінюються техніка, технології та програмне забезпечення.

Текстові файли - найпоширеніший тип даних у комп'ютерному світі. Існує кілька проблем, пов'язаних з текстовими файлами. Перша – надзвичайно велика кількість символів, потрібних для підтримки різних мов. Американські програмісти для роботи зі 128 символами використовують набір символів US ASCII (американський стандартний код обміну інформацією). Для підтримки інших мов найчастіше не вистачає і 256 символів, тому зараз здійснюється поступовий перехід до кодування Unicode, в якому для зберігання одного символу відводиться вже два байти (тобто є можливість закодувати 65536 різних символів).

Друга проблема полягає в тому, що люди хочуть, щоб документи, що роздруковуються, містили графіки, діаграми, примітки, заголовки і щоб при цьому використовувалися різні шрифти. Документи, що розповсюджуються в Інтернет ( онлайновідокументи), можуть містити мультиплікацію, посилання різні мережні ресурси і звуковий супровід.

Багато текстових файлів передаються у вигляді простого тексту (plain text). Простий текст складно зробити привабливим і легко читати, тому що в ньому немає шрифтів різних накреслень, графіки, заголовків, підзаголовків і т. д. Ці додаткові особливості мають назву розмітки тексту(Markup).

Говорячи про розмітку тексту, виділяють поняття фізичноїі логічноюрозмітки. Під час використання фізичної розмітки тексту вказується точний вигляд кожного фрагмента. Наприклад, "центрований текст, 14 кеглем, жирний, гарнітура Times". При логічній розмітці вказується логічне значенняцього фрагмента, наприклад, "це заголовок глави". Ці два способи розмітки призначаються, як правило, для використання у різних ситуаціях. Щоб роздрукувати текст на принтері, потрібно використовувати фізичну розмітку. Повинні бути прийняті рішення про розмір полів та абзацні відступи. Ранні версіїтекстових процесорів використовували лише фізичний тип розмітки. При цьому для кожного фрагмента вказувався шрифт, розмір та стиль.

Під час обміну інформацією з іншими людьми фізичне оформлення тексту накладає низку обмежень, особливо онлайнових документів. Розмір екрана, роздільна здатність, шрифти різні для різних систем. З цих причин дедалі частіше використовується логічне оформлення тексту. У деяких випадках логічне оформлення практично необхідне: під час створення електронних документів типу сторінок WWW чи створення та публікації об'ємних праць, як-от книги.

Для збереження розмітки документів під час передачі текстової інформації від машини до машини застосовують різні способи. Текстові процесори та видавничі системи використовують спеціально розроблені формати файлів, що містять не лише текст, а й інформацію про те, як він має бути оформлений. Основна проблема тут у несумісності таких форматів, хоча найбільше складні програмизазвичай, можуть читати файли у форматах програм-конкурентів. Прикладами такого підходу є текстові процесори Word та StarWriter.

За іншого підходу безпосередньо до тексту документа вставляються спеціальні команди розмітки. Навіть якщо у вас немає програмного забезпечення, що підтримує такий формат, ви все ж таки зумієте в ньому розібратися. Існує чимало способів подібного представлення розмітки тексту, зокрема:

  • HyperText Markup Language (HTML), що використовується у World Wide Web;
  • TeX і LaTeX, що користуються популярністю у багатьох академічних видань, а також математиків, фізиків, хіміків і навіть музикантів.

Прикладами програм, які дозволяють розмітити текст подібним чином, є Netscape Composer і LyX (KLyX).

Файли, створені різними редакторами, мають унікальні розширення, що дозволяють, не заглядаючи всередину документа, здогадатися про способи розмітки тексту. Так файли, створені редакторами підготовки plain-тексту, часто мають розширення .txt, а підготовлені в редакторі Lyx - .lyx. Текстовий процесор Word за промовчанням створює файли у форматі MS Word (розширення.doc), але підтримує інші формати, наприклад RTF (расширение.rtf). Документи, що містять команди розмітки мови HTMLмають розширення.html або.htm.

Очевидно, що неможливо перерахувати всі текстові редактори. Багато хто з них "заточений" під ту чи іншу специфічну діяльність. У списку, розглянутому нижче, подано лише невелику частину текстових редакторів.

Редактори неформатованих текстів

NotePadвбудований в операційну систему Windows, зрозумілий і простий у використанні; McEditмає подібність до редактора Edit з MS DOS, компонента файлового менеджера mc(Midnight Commander) ОС Linux; KEditнайпростіший текстовий редактор, входить до складу KDE Linux; KWriteтекстовий редактор, що має ряд додаткових налаштуваньпорівняно з іншими найпростішими текстовими редакторами; Emacsпоєднує в собі функції файлового менеджера та текстового редактора; однією з відмінних рис є можливість створення макрокоманд (макросів); є у всіх клонах Unix, у тому числі й Linux; Emacs можна використовувати й у MS Windows.

Редактори, які створюють текст із елементами розмітки

Wordслужить для створення різноманітних друкованих документів, є компонентом офісних програм у MS Windows; StarWriterвходить до складу програми StarOffice, зовнішнім виглядомі функціональністю він нагадує Word, однаково добре працює як і MS Windows, і у ОС Linux; LyX(KLyX в KDE) сучасний текстовий редактор, призначений для людей, які хочуть отримати документ, що виглядає професійно, але витратити на його створення мінімум часу; редактор вставляє у текст команди розмітки TeX і LaTeX; Netscape Composerвставляє у текст команди розмітки мови HTML, існують версії як ОС Linux, так MS Windows.

Електронні документи стали так само важливою частиною архівів, як і принтер на столі секретаря. Тексти, фотографії, креслення, бази даних, аудіо- та відеофайли стрімко йдуть у «цифру», викликаючи до життя дискусії про те, які формати найбільше придатні для постійного зберігання електронних документів. На щастя, російським архівістам є до кого звернутися по допомогу.

Про електронні документи говорять все частіше та голосніше. У США архівісти присвятили цьому напряму роботи повноцінне професійне свято – День електронного документа (Electronic Records Day), що відзначається 10 жовтня. Цього дня вчені та практики збираються разом для обговорення актуальних питань збереження електронних документів.

Російська наукова спільнота також не залишається осторонь вирішення практичних завдань, хай і не приурочених до червоних днів календаря. Минулого року вчені з Російського державного гуманітарного університету (РДГУ) провели масштабне дослідження різних форматівфайлів електронних документів із детальним описом нюансів кожного з них.

Висновки, основні тенденції представлені у науковій доповіді РДГУ « Порівняльний аналізформатів файлів електронних документів постійного (довготривалого) зберігання».1 Це одна з перших подібних науково-дослідних робіт в Росії, що дозволяє архівістам федеральних органіввиконавчої влади, державних та недержавних організацій, а також державних та муніципальних архівів об'єктивно підійти до питання вибору найбільш оптимального формату постійного (довготривалого) зберігання електронних документів.

Деякі вимоги щодо зберігання електронних документів

Вже на етапі проектування СЕД система вибудовується таким чином, щоб протягом усього терміну зберігання забезпечувати автентичність, надійність та придатність документа незалежно від змін у системі2. Такі зміни можуть бути викликані конвертацією форматів, міграцією3 між технічним обладнанням, операційними системами або програмними додатками. При цьому слід зазначити, що при конверсії форматів відомості про досконале конвертування мають бути збережені у складі контрольної информации4. Важливо також знати, що, крім оригіналу електронного документа, протягом всього терміну зберігання необхідно зберігати документ метаданих (опис документа)5 , який містить усі метадані про електронний документ. Якщо термін зберігання електронного документа перевищує очікуваний термін існування систем зберігання даних, необхідно задокументувати плани міграції нових систем6 .

Читабельність - невід'ємна характеристика електронного документа. Вона забезпечується відповідністю технічних характеристикдокумента та програмного забезпечення, доступного працівникам архіву. Формат файлу, визначений для постійного (довготривалого) зберігання, повинен відповідати технічним можливостям органів державної влади, державних та муніципальних архівів, недержавних організацій та ін. щодо відтворення інформації у довгостроковій перспективі7. Більше того, законодавчо закріплено, що електронні документи приймаються на зберігання у супроводі програмних засобів, що дозволяють їх відтворити, та комплекту супровідної документації8.

Щодо форматів файлів, відображення яких має підтримуватись системами електронного документообігу, немає точної одноманітності. Наявні на сьогодні нормативно-правові акти дещо відрізняються у своєму баченні фінального списку. Наприклад, згідно з Рекомендаціями з підготовки федеральними органами влади переліків документів, створення, зберігання та використання яких має здійснюватися у формі електронних документів при організації внутрішньої діяльності (утв. наказом Росархіву від 29.04.2011 року № 32), присутність у ВЕД ФЗІВ електронних документів рекомендовано здійснюється у форматах PDF, DOC, RTF, TXT, XML.

Відповідно до Вимог до інформаційних систем електронного документообігу федеральних органів виконавчої влади, що враховують у тому числі необхідність обробки за допомогою даних систем службової інформації обмеженого поширення (утв. Наказом Мінкомзв'язку РФ від 02.09.2011 року № 221), обов'язковими є наступні чотири формати: PDF, RTF, DOC, TIFF. Інші нормативні документидопускають можливість присутності у електронних системах органів структурі державної влади інших форматів файлів електронних документів.

У вересні 2014 року експертна рада при Мінкомзв'язку використовувати PDF/A як формат міжвідомчої взаємодії у СЕД та довготривале зберігання електронних документів. Поряд із PDF/A пропонується передавати XML-файл із реквізитами електронного документа. Відомо, що разом із ФСТ буде підготовлено відповідний наказ із вимогами до документообігу.

Рекомендації щодо вибору зберігання формату електронних документів

Вибір оптимального формату зберігання визначається видом інформації, характеристиками технічних засобівзберігання (магнітних, оптичних, твердотільних носіїв електронних даних), особливостями доступу користувачів до даних та програмних засобів. У зв'язку з здешевленням носіїв інформації та підвищенням їх ємності, доступність ПЗ та зчитуваність формату файлу в довгостроковій перспективі визнаються головними факторами при виборі способу кодування. У порівняльному аналізі форматів електронних документів (текстових, графічних, аудіо- та відеофайлів, баз даних, презентацій), проведеному співробітниками РМДГУ, враховувалися такі критерії:

  • розробник та права власності;
  • рік розроблення формату файлів;
  • рік його останньої модернізації;
  • частота оновлень програмного коду;
  • наявність версій;
  • відкритий чи закритий програмний код;
  • опис та порівняння математичних алгоритмів стиснення;
  • призначення формату файлів;
  • наявність та доступність конвертерів;
  • стійкість при множинних реплікаціях 9 .

Текстові формати

Текст - основний масив інформації, що зберігається в архівах. До нього відносяться як тексти мовами людського спілкування (за винятком ієрогліфічної писемності, близької до графічної форми), так і мовами програмування. Часто текстові файли включають фрагменти графічної інформації. На відміну від ілюстрацій, аудіо- та відеозаписів текстові дані піддаються значному стиску за допомогою спеціальних архіваторних програм.

Згідно з рекомендаціями РДГУ, архівування файлів краще проводити в незашифрованому вигляді за допомогою ZIP (*.zip), а текстову інформаціюдоцільніше записувати у таких форматах: XML (includes XSD/XSL/XHTML), PDF/A-1 (ISO 19005-1) (*.pdf), PDF/A-2 (ISO 19005-2:2011) (*.pdf ). З деякими умовами можуть використовуватися текстові формати: Plain text (ISO 8859-1encoding), PDF (*.pdf) (embedded fonts), Rich Text Format 1.x (*.rtf), HTML (include a DOCTYPE declaration), SGML (*.sgml), Open Office (*.sxw/*.odt), OOXML (ISO/IEC DIS 29500) (*.docx), EPUB (unencrypted) (*.epub). Найбільшу стабільність при міграції з одного формату у вибраному програмному забезпеченні до іншого поводяться формати *.doc і *.xml. У таблиці 1 наведено результати змін обсягів інформації при міграції.

Таблиця 1. Матриця зміни обсягів інформації під час міграції (у скільки разів)

Формати файлів вихідні/
Формати файлів міграції
*.doc
Microsoft Word 97-2003
*.odt*.xml*.rtf*.pdf*.pdf (PDF/A)
*.doc
Microsoft Word 97-2003
початковий<3,3 >2,2 >2,7 >3,2 >3,7
*.odt>3,4 початковий>8,4 >7,7 >10 >18,4
*.xml<2,2 <8,2 початковий>1,04 >1,4 >2,6

Зазначимо, що офісний пакет OpenOffice, який набув поширення завдяки вільній ліцензії, має низку обмежень, наприклад, у порівнянні з Microsoft Word 2007. Так, для створення файлу у форматі XML в OpenOffice 4 (Writer) будуть потрібні додаткові технічні налаштування системи (наявність встановленого оточення Java (JRE) Рідний же формат XML OpenOffice 4 *.stw поки що не отримав значної підтримки та опису. Microsoft Word 2007 не відображає інформацію у такому форматі, відкриваючи його як порожній документ.

Графічні формати

Графічна інформація з високою роздільною здатністю, особливо поліхромні та напівтонові зображення, практично не піддається архівному стиску. Як правило, для її зберігання застосовують растрові формати, які забезпечують зберігання реалістичних сцен з великою глибиною кольору. За підсумками порівняльного аналізу лише три формати виявились найбільш придатними для довготривалого зберігання растрових зображень: TIFF (uncompressed), JPEG2000 (lossless) (*.jp2), PNG (*.png).

Для векторних зображеньрекомендованим форматом є SVG (Java script binding) (*.svg). Креслення, структурні схеми, графічно представлені алгоритми, що складаються з графічних примітивів (відрізків та ламаних ліній, багатокутників, кіл і еліпсів), найбільш ефективно реалізуються в таких векторних форматах, як SWG, WMF, CGM та подібних до них. Однак не можна забувати про те, що векторні формати зазвичай призводять до спотворення. колірної схемискладного зображення.

Для кодування 3D-зображень (віртуальних форматів даних) прийнятне використання X3D (*.x3d).

Аудіо- та відеоформати

Як і графічна інформація, аудіо- та відеоінформація майже не піддається ефективному архівуванню: в середньому їх стиск не перевищує 5%. Вибір різних видівкодування таких даних істотно впливає на обсяг файлу, що зберігається, тому від необхідної якості відтворення і, як наслідок, доступного обсягу архівного сховища залежить перевага того чи іншого формату. Рекомендовані формати зберігання аудіоінформації: AIFF (PCM) (*.aif, *.aiff), WAV (PCM) (*.wav), AES3 (LPCM) (*.aes). Найкращі результатиза підсумками порівняння для збереження відеоданих показали формати: Motion JPEG 2000 (ISO/IEC 15444-4) (*.mj2), AVI (uncompressed, motion JPEG) (*.avi), QuickTime Movie (uncompressed, motion JPEG) (*. mov).

Бази та банки даних

Вибір формату зберігання бази залежить переважно від її структури. Якщо база є один файл, то доцільно зберігати її в кодуванні, що відповідає цьому типу файлу. При зберіганні бази, записи якої складаються з полів різної структури, найчастіше застосовуються кодування RTF і PDF, але в тому випадку, якщо в базі немає аудіо-і відеофрагментів. Найбільш універсальними форматами для тривалого зберігання баз даних є Comma Separated Values ​​(*.csv), Delimited Text (*.txt), SQL DDL. В окремих випадках можуть бути використані формати: DBF (*.dbf), OpenOffice (*.sxc/*.ods), OOXML (ISO/IEC 29500)(*.xlsx).

Презентації

Жоден з існуючих форматівне забезпечує високий рівень надійності безпеки презентації. З деякими застереженнями можна рекомендувати формати OpenOffice (*.sxi/*.odp) та OOXML (ISO/IEC DIS 29500) (*.pptx). Формат PowerPoint (*.ppt) та інші формати презентаційних файлів не відповідають вимогам тривалого зберігання.

Гібридна інформація

Для зберігання комплексних документів, структуру яких входять фрагменти різної природи (текст, фотографія, креслення тощо.), найбільш придатні сучасні текстові формати типу MS WORD, RTF. Вони дозволяють включати графічні зображенняу растрових кодуваннях. Якщо ілюстрацій багато, такий документ рекомендується зберігати як єдиного зображення – у разі кращими є графічні формати.

Примітки:

  1. Науково-дослідна робота проводилась у рамках державного контракту № 016-3 від 31 травня 2013 року «Дослідження сучасних процесів документаційного забезпечення управління та розвитку електронного документообігу. "Наукова доповідь "Порівняльний аналіз форматів файлів електронних документів постійного (довготривалого) зберігання" (в рамках реалізації заходів федеральної цільової програми "Культура Росії" (2012-2018 роки)).
  2. ДСТУ ISO 15489-1-2007 «Національний стандарт Російської Федерації. Система стандартів з інформації, бібліотечної та видавничої справи. Управління документами. Загальні вимоги» (утв. наказом Ростехрегулювання від 12.03.2007 року № 28-ст).
  3. Міграція електронних документів – дія з переміщення записів з однієї системи в іншу систему при збереженні їхньої автентичності, цілісності, надійності та зручності у використанні.
  4. Структура опису документа складається з опису його фізичної чи технічної структури та її логічної структури, тобто відносин між елементами даних, складових документ. Докладніше про створення, управління та використання метаданих див. ДСТУ ISO 23081-1-2008. Система стандартів з інформації, бібліотечної та видавничої справи. Процеси керування документами. Метадані для документів. Частина 1. Принципи (утв. наказом Ростехрегулювання від 13.11.2008 року № 310-ст).
  5. ГОСТ Р 54471-2011 «Системи електронного документообігу. Управління документацією. Інформація, що зберігається в електронному вигляді. Рекомендації щодо забезпечення достовірності та надійності».
  6. Правила організації зберігання, комплектування, обліку та використання документів Архівного фонду РФ та інших архівних документів у державних та муніципальних архівах, музеях та бібліотеках, організаціях Російської Академії наук (утв. наказом Міністерства культури та масових комунікацій РФ від 18 січня 2007 № 19).
  7. Там же п 4.4.3.
  8. Реплікація – це спосіб збереження цифрової інформаціїшляхом створення однієї чи кількох повних копій (клонів) цифрових матеріалів. Реплікація потребує спеціальних заходів щодо підтримки всіх копій в актуальному стані.

У сучасному світіінформація є найціннішим ресурсом, який можна порівняти хіба що з часом. Інформація виконує безліч завдань у житті суспільства, забезпечуючи комунікаційну взаємодію всіх його складових, фіксуючи, зберігаючи та передаючи отримані та накопичені знання. І все ж таки ключову роль інформація грає саме в управлінні.

Управлінська інформація фіксується у документах. Документ як носій інформації є інформаційним ресурсом, управління яким покладено на фахівців-документознавців, покликаних організувати технологічний процесдокументування та роботу з документами, у тому числі і з використанням сучасних інформаційні технології.

На сучасному етапі вже ні в кого не викликає сумнівів необхідність впровадження нових інформаційних технологій у процеси управління і насамперед у сферу документаційного забезпечення управління (ДОУ), як одну з найважливіших складових цих процесів. Говорячи про впровадження нових інформаційно-комунікаційних технологій (ІКТ) у сферу ДНЗ, як правило, мається на увазі проектування та впровадження автоматизованої системи документаційного забезпечення управління (АС ДНЗ) з безліччю варіантів вбудованих та доданих модулів.

Але що стоїть за цими інформаційними технологіями, зокрема системами АС ДОП? Мало хто із фахівців-документознавців розуміє це в повному обсязі. У той же час, цілком очевидно, що без базових знань у сфері інформаційних технологій (ІТ) жоден документознавець вже обійтися не може.

В останньому національному стандарті, що регулює процеси управління документами ДСТУ ISO 15489-1-2007 чітко прописано відповідальність «керуючих документацією», тобто фахівців у галузі документаційного забезпечення управління, за проектування, впровадження та використання автоматизованої системи ДОП . Це говорить про те, що документознавці вже не можуть бути сторонніми спостерігачами при проектуванні та впровадженні АС ДОП та лише потім її користувачами. Вони повинні вже на початковому етапі її проектування брати активну участь у процесі та встановлювати основні вимоги до функціональної складової цієї системи.

Відповідно до вимог до кваліфікації, документознавець бере участь у постановці завдань, проектуванні, експлуатації та вдосконаленні (у частині інформаційного забезпечення) автоматизованих інформаційних системта систем управління. Також бере участь у розробці новітніх інформаційних технологій, проектуванні та актуалізації баз та банків даних. Вивчає та узагальнює передовий вітчизняний та зарубіжний досвід у галузі ДНЗ.

Вивчення комп'ютерних інформаційних технологій в управлінській діяльності стає важливим завданням загальнопрофесійної підготовки за спеціальністю «Документознавство та документаційне забезпечення управління» . Сучасний фахівець повинен добре орієнтуватися у різноманітті програмних засобів та уявляти собі рівень варіантності програмно-технологічних рішень для реалізації завдань ДОП.

Звідси можна дійти невтішного висновку необхідність розширення кругозору документознавців у сфері застосування інформаційних технологій у ДОП та його особливостей.

Найважливішою проблемою, що виникає при впровадженні ІТ у діяльності будь-якої, особливо державної організації є проблема збереження електронних документів і доступ до неї після закінчення значного періоду часу. Ще одна з проблем виникає під час обміну електронними документами в управлінні, особливо на міжвідомчому рівні. На сучасному етапі ці проблеми почасти допоможуть вирішити відкриті формати електронних документів.

У країні активно обговорюється та розробляється питання впровадження електронного документообігу на рівні уряду (наприклад, програми «Електронна Росія») , «Електронна Москва» , концепції формування електронного уряду , впровадження електронних адміністративних регламентів , об'єднання державних інформаційних ресурсів ). Вирішення питань, поставлених у цих документах, не можливе без урахування форматів електронних документів (ЕД).

Важливими документами, що задають основні напрямки розвитку інформаційних технологій у Російській Федерації, є Доктрина інформаційної безпеки та Стратегія розвитку інформаційного суспільства . Особливу увагу приділено Програмам і Концепціям, зважаючи на те, що саме в них закладено методологію впровадження сучасних ІТ у Росії, у тому числі у сферу ДНЗ. Серед них особливий інтерес представляють Федеральна цільова програма«Електронна Росія (2002-2010 рр.)» , Концепція формування в Російській Федерації електронного уряду до 2010 р. , Концепція використання інформаційних технологій у діяльності федеральних органів державної влади до 2010 р.та ін.

Концепція розвитку національної системи стандартизації є системою поглядів на проблеми розвитку національної системи стандартизації в Російській Федерації до 2010 р. і містить обґрунтовані цілі, завдання та напрями розвитку.

Розгляду цього питання ми маємо намір присвятити цикл статей, в яких будуть описані основні формати електронних документів, становлення та розвиток вільного програмного забезпечення, специфіка відкритих форматів електронних документів, практика їх застосування в Росії та за кордоном.

Формат електронного документа – це, точніше, формат файлу, в якому міститься текстова та/або аудіовізуальна інформація у закодованому вигляді. "Закодований" не слід плутати з поняттям "зашифрований". Шифрування відноситься до засобів приховування інформації, а кодування - лише перетворення інформації з однієї форми в іншу.

Якщо проаналізувати сучасні словники комп'ютерних технологій, то поняття «формат» різноманітне та складне. Для користувача достатньо знати, що формат електронного документа - це певна логіка або алгоритм, слідуючи яким інформація з машиночитаної перетворюється на зрозумілу для людини і навпаки. Формати можуть мати різні види, від простих і обмежених можливостей до складних і здатних нести безліч функцій, включаючи можливості створення верстки, стискування і шифрування.

У сфері комп'ютерних технологій терміном «формат» розуміється структура інформаційного об'єкта. Наприклад, форматом файлу називають спосіб організації елементів інформації (бітів, байтів) у файлі, а формат електронного документа визначає спосіб розташування та подання даних в електронному документі .

Перерахуємо коротко формати електронних документів, які використовуються в ДОП .

Текстові формати використовуються для створення текстів документів і найчастіше створюються за допомогою текстових процесорів.
Наприклад:

DOC – популярний формат електронного документа, призначений для перегляду та зміни (редагування) тексту документа. Формат дуже зручний при одночасної роботи над документом кількох виконавців.
.PDF – формат відображення документа в ідентичному вигляді на будь-який операційній системіта в будь-якому додатку. Популярний при складанні документів, презентаційних матеріалів, рекламних буклетів тощо. З огляду на те, що формат призначений для перегляду документа і не дозволяє вносити до нього несанкціоновано (або непомітно) зміни, його використання в ДОП вкрай зручно. Слід зазначити, що всі стандарти міжнародної організації зі стандартизації (ІСО) надсилаються до Ростехрегулювання саме у форматі PDF.

RTF – призначений для перегляду документів та їх редагування у різних версіях програмних продуктів. Наприклад, версії Word for Windows. У ДОП формат активно використовується завдяки тому, що дозволяє перетворювати файли без втрати структури та змістовної частини документа та працювати з ними в одній операційній системі, але у різних її тимчасових версіях.
Графічні формати зберігають зображення (наприклад, фотографію, малюнок) і поділяються на два основних типи: векторні формати, які зберігають зображення як набір геометричних фігур (DXF, EPS, CGM), та растрові формати, які зберігають зображення як набір точок-пікселів (BMP) , TIFF, GIF). Збережене зображення можна додати до тексту документа та використовувати його для оформлення презентації.

Формати баз даних створюються з допомогою систем управління базами даних (СУБД). Вони складаються з полів та таблиць, що містять окремі елементи інформації. Програма дозволяє встановлювати зв'язки між розрізненими елементами. Наприклад, база даних про співробітників може містити поля з прізвищами співробітників, адресами та відомостями про роботу, що виконується.

Файли у форматі електронних таблиць зберігають у комірках числа та взаємозв'язку між цими числами. Так, один осередок може містити формулу, яка підсумовує дані двох інших осередків. Як і файли баз даних, файли електронних таблиць зазвичай мають формат тієї програми, з якої створено. Цей формат зручний при врахуванні робочого часу тощо.

Відео- та аудіоформати містять рухомі зображення (цифрове відео, анімацію) і звукові дані, які найчастіше створюються і переглядаються за допомогою відповідних програм і зберігаються в однопрограмному форматі. Найбільш використовуваними є формати QuickTime і MPEG. У ДОП з їхньою допомогою можна протоколювати засідання, наради тощо.

Докладніше зупинимося на форматах розмітки, які містять вбудовані інструкції щодо відображення та зрозумілості змісту файлу.

Визначати мову розмітки текстів електронних документів можна на метамову SGML (Standard Generalized Markup Language). Спочатку він був розроблений для спільного використаннямашиночитаних документів у великих урядових та аерокосмічних проектах. Він широко використовувався у друкованій та видавничій сфері, але його складність ускладнила його широке поширення для повсякденного використання.

SGML було затверджено Міжнародною організацією зі стандартизації ISO в якості міжнародного стандарту ISO 8879:1986 «Information processing – Text and office systems – Standard Generalized Markup Language (SGML)» і використовується у державних органах багатьох країн світу.

Від мови розмітки текстів документів SGML походять нові, більш досконалі мови розмітки HTML і XML.

HTML (Hypertext Markup Language – «мова розміткигіпертексту ») - Це додаток SGML. Він використовується для відображення майже всієї інформації в мережі. Відповідає міжнародному стандарту ISO 8879:1986 і є стандартниммовою розмітки документів у Всесвітнього павутиння(www).

XML (Extensible Markup Language) – підмножина мови SGML. Набув популярності при управлінні інформацією та обміні нею, як відносно просту мову розмітки текстів документів. XML – текстовий формат, призначений для зберігання структурованих даних (замість існуючих)файлів баз даних ), для обміну інформацією міжпрограмами , а також для створення на його основі більш спеціалізованих мов розмітки, які іноді називають словниками.

Формат XML прийнятий органами стандартизації інтернет-спільноти в особі консорціуму World Wide Web (W3C), який розробляє та впроваджує технологічні стандарти дляВсесвітньої павутини та організації UDDI (Universal Description, Discovery and Integration), що розвиває стандарт Універсального опису, виявлення та інтеграції, призначеного для визначення, реєстрації та виявлення Web-служб, які пропонують компанії. Це специфікація, яка встановлюється вимогами до розподіленого інформаційного регістру Web-служби. .

За призначенням формати електронних документів можна умовно поділити на:
- Формати для перегляду документа;
– формати для перегляду та зміни документа;
– формати зміни документа.

По можливості перенесення форматів електронних документів бувають:
– переносяться міжплатформно;
- Перенесені міжпрограмно;
- Спеціалізовані.

Як правило, чіткого кордону між цими категоріями немає. Формати, що переносяться між різними платформами, можуть бути переносними міжпрограмно. Спеціалізовані формати застосовуються у вузьких завданнях і використовуються, як правило, лише додатками однієї фірми та найчастіше є закритими.

За доступністю формати можуть бути відкритими та закритими. Закриті формати завжди є власністю конкретної організації, яка використовує їх для того, щоб гарантувати споживачеві якість продукту, так і для захисту від запозичення технології конкурентами.

Відкритий формат – це загальнодоступна специфікація зберігання цифрових даних, вільна від ліцензійних обмежень при використанні. Зокрема, має бути можливість включати підтримку відкритих форматів яквільне (відкрите), так і пропрієтарне (власне, невільне) ПЗ , що поширюється поліцензіям характерним для кожного з цих типів. Головна мета відкритих форматів – гарантувати можливість доступу до даних протягом тривалого часу без огляду на ліцензійні права та технічні специфікації. Відкритий формат електронного документа захищає споживача не тільки при зміні версій програми, а й дає можливість читати документи в умовах недоступності програми, за допомогою якої було створено електронний документ.

Чим примітний формат XML? Розширювану мову розмітки Extensible Markup Language містить у собі як дані, а й «несе інформацію, описує ці дані. Він застосуємо до будь-якого комп'ютерному додаткута дозволяє передавати великі обсяги інформації без необхідності трудомісткого перетворення структур даних» .

На даний час виробники програмного забезпечення оперативно перейшли на використання XMLу своїй продукції і таким чином реалізують ідею стандартизації форматів документів на основі XML, по суті відкритого форматуелектронних документів

Продовження у наступному номері.

ДСТУ ISO 15489-1-2007. Управління документами. Загальні вимоги.

Катерина Колесникова,радник державної цивільної служби РФ 3 класи.

Спеціально для компанії «Такська».

Електронні формати рахунків-фактур, журналу обліку отриманих та виставлених рахунків-фактур, книг покупок та книг продажів, додаткових листів до них відомі нам з того моменту, як вийшов Наказ ФНП Росії від 05.03.2012 № ММВ-7-6/ [email protected], який застосовувався з 23.05.2012 та втратив чинність 13.04.2015 у зв'язку з виданням Наказу ФНП Росії від 04.03.2015 № ММВ-7-6/ [email protected]

Формати первинних документів представлені нам з 21.03.2012, відповідно до Наказу ФНП Росії від 21.03.2012 № ММВ-7-6/ [email protected](змінено в редакції від 02.02.2015). Цим наказом було затверджено формати електронної товарної накладної (ТОРГ-12) та акта приймання-здачі робіт (послуг). Проте, відомо, що з 2013 року Федеральним законом від 06.12.2011 № 402-ФЗ визначення назви та складу показників первинних облікових документів, а також форм їх подання покладено на керівника економічного суб'єкта. У зв'язку зі змінами законодавства затвердження ФНП Росії форматів та форм первинних облікових документів з альбомів уніфікованих форм, що втратили обов'язковість застосування, стало не актуальним.

На законодавчому рівні вже давно велася робота щодо приведення форматів електронних документів у відповідність до сучасних вимог. «Модернізовані» формати накладних ТОРГ-12 та актів приймання-здачі робіт представлені нам наприкінці 2015 року відповідно до Наказів ФНП Росії від 30.11.2015 № ММВ-7-10/ [email protected]та від 30.11.2015 № ММВ-7-10/ [email protected]

Як заявили у ФНП Росії старі формати накладних ТОРГ-12 та актів приймання-здачі робіт будуть дійсні протягом усього 2016 року. Таким чином, в учасників електронного документообігу вистачить часу на освоєння нових форматів та переналаштування інформаційних систем компаній для роботи з ними.

Нові формати подання документів про передачу товарів, робіт, послуг, що діють з 01.01.2016

Накази ФНП Росії від 30.11.2015 № ММВ-7-10/ [email protected]та від 30.11.2015 № ММВ-7-10/ [email protected], що затвердили нові формати документів (далі – нові формати), покликані розширити сферу застосування електронного документообігу. Наразі перелік документів, які платники податків відповідно до п. 7 ст. 80 та п. 2 ст. 93 НК РФ можуть подавати до податкових органів по ТКС у рамках процедур витребування або разом із податковою декларацією, значно збільшений.

Формат, затверджений Наказом ФНП Росії від 30.11.2015 № ММВ-7-10/ [email protected], визначає вимоги до xml-файлів передачі ТКС первинного облікового документа, що оформляє приймання-передачу товарів у виконанні договорів у межах відносин, регульованих главою 30 ДК РФ «Купля-продаж». Такий електронний «накладний» можна оформлювати передачу будь-яких видів цінностей одного суб'єкта господарювання іншому. Документ про передачу товару є два файли. Один містить відомості продавця про правочин та електронний підпис уповноваженої особи. Другий – ідентифікаційні відомості про перший файл, інформацію про угоду з боку покупця, а також електронний підпис уповноваженої особи.

У свою чергу, формат, затверджений Наказом ФНП Росії від 30.11.2015 № ММВ-7-10/ [email protected], описує вимоги до хml-файлів передачі ТКС первинного документа в електронної форми, що оформляє приймання-передачу результатів виконаних робіт (наданих послуг). Він також складається з двох файлів. В одному міститься інформація виконавця: відомості передавальної сторони про угоду та електронний підпис. В іншому - ідентифікаційні відомості про файл виконавця, дані про угоду з боку замовника та його електронний підпис. При цьому новим форматом передбачена ситуація, в якій виникає необхідність, виходячи з умов угоди, або через розгляди з контрагентом у формуванні одностороннього акту. У цьому випадку в електронному документі буде лише один файл із кваліфікованим електронним підписом сторони, що відправляє.

Нові формати містять реквізити, які були й у раніше рекомендованих форматах, та відповідають вимогам, встановленим Федеральним законом від 06.12.2011 № 402-ФЗ до первинних документів. При цьому нові формати відрізняються гнучкістю у використанні за рахунок наявності в них вільних інформаційних полів, які організація може заповнювати на власний розсуд.

Так звані вільні поля можуть заповнюватися організаціями будь-якими додатковими реквізитами (50 символів), що дозволяють враховувати специфіку операції, що оформляється, а також значеннями цих реквізитів (2000 символів). Крім того, платникам податків надається можливість включення до первинного облікового документа окремого файлу будь-якої структури та виду, що дозволяє відобразити в документі більше повну інформаціюфакт господарського життя.

Крім того, у нових форматах можна формувати різні версії документа з урахуванням виправлень. І ще один плюс нових форм – це можливість змінювати найменування типу електронного документа. Наприклад, замість "Акту виконаних робіт" можна написати тип документа "Акт прийому-передачі результату робіт", форма якого розроблена в організації.

Як і попередні формати, встановлені для первинних документів (накладних ТОРГ-12 та актів приймання-здачі робіт), нові формати лише рекомендовані нам до застосування в роботі, а їх затвердження не вимагає їх обов'язкового використання. Інакше висловлюючись, організації можуть обмінюватися документами у будь-яких форматах, зокрема і розроблених самостійно. Але, ще раз хочу зазначити, що доцільніше використовуватиме рекомендовані ФНП Росії формати, оскільки такі електронні документи можна буде передавати до податкової інспекції на вимогу про подання документів без зайвих трудовитрат.

Новий формат первинного документа, що включає рахунок-фактуру

Наказом ФНП Росії від 24.03.2016 № ММВ-7-15/ [email protected]затверджено формат рахунку-фактури та формат подання документа про відвантаження товарів (виконання робіт), передачу майнових прав (документ про надання послуг), що включає в себе рахунок-фактуру, в електронній формі.

При цьому затверджений формат має різні варіанти документального оформлення факту фінансово-господарського життя організації:

Варіант №1.
Рахунок-фактура з додатковою інформацієюз функцією рахунку-фактури, що використовується при розрахунках з податку на додану вартість, є файлом обміну від продавця і містить відомості, передбачені для рахунків-фактур відповідними нормативно-правовими документами. Файл підписується посиленим кваліфікованим електронним підписом особи, уповноваженої на підписання рахунків-фактур.

Варіант №2.
Рахунок-фактура з додатковою інформацією з функцією рахунку-фактури, що використовується при розрахунках з податку на додану вартість, та документа про відвантаження товарів (виконання робіт), передачу майнових прав (документ про надання послуг), результатом яких є зміна фінансового стану передавальної та приймаючої сторін. Документ включає:

  • файл обміну для подання інформації продавця, що включає рахунок-фактуру, що застосовується при розрахунках з податку на додану вартість, а також додаткові відомостіпередавальної сторони про що беруть участь у угоді економічних суб'єктів, предмет угоди та інші істотні обставини оформлюваної угоди. Файл підписується посиленим кваліфікованим електронним підписом особи, уповноваженої на підписання рахунків-фактур, а також електронним підписом особи, відповідальної за оформлення факту господарської діяльностіз боку суб'єкта, що передає;
  • файл обміну для подання додаткової до рахунку-фактури інформації покупця у вигляді відомостей приймаючої сторони по угоді, що оформляється. Файл підписується електронним підписом особи, відповідальної за оформлення факту господарської діяльності з боку суб'єкта, що приймає.

Варіант №3.
Рахунок-фактура з додатковою інформацією з функцією документа про відвантаження товарів (виконання робіт), передачу майнових прав (документ про надання послуг), результатом яких є зміна фінансового стану сторони, що передає та приймає. Документ включає:

  • файл обміну для подання інформації продавця, що включає відомості передавальної сторони про що беруть участь у угоді економічних суб'єктів, предмет угоди та інших істотних обставинах оформлюваної угоди у структурі файлу обміну рахунку-фактури (інформації продавця). Файл підписується електронним підписом особи, відповідальної за оформлення факту господарського життя з боку суб'єкта, що передає;
  • файл обміну для подання додаткової інформації продавця інформації покупця як відомостей приймаючої сторони по угоді, що оформляється. Файл підписується електронним підписом особи, відповідальної за оформлення факту господарського життя з боку суб'єкта, що приймає. Цей файлможе бути відсутнім, якщо відповідно до цивільного законодавства складання двостороннього документа не потрібне.

Отже, в залежності від свого призначення набір обов'язкових реквізитів XML-файлу документа про передачу товарів (робіт, послуг, майнових прав) буде різним.

Для складання рахунку-фактури це буде файл обміну із відомостями, передбаченими Постановою Уряду від 26.12.2011 № 1137 та ст. 169 НК РФ, підписаний уповноваженою особою. При цьому відчутних відмінностей із чинним відповідно до Наказу ФНП Росії від 04.03.2015р. № ММВ-7-6/ [email protected]форматом рахунку-фактури в електронному вигляді немає.

Для складання первинного документа файл міститиме реквізити, задані вимогами Федерального законувід 06.12.2011 № 402-ФЗ, та складатися з двох файлів обміну з інформацією про економічних суб'єктів, які беруть участь у ній, та про предмет угоди. Один титул підписуватиметься відповідальною особою за оформлення факту господарської діяльності з сторони, що відправляє, інший - відповідальною з приймаючої.

Для складання подібного універсального документа, що поєднує в собі функції рахунку-фактури та первинного документа, файл повинен складатися з двох файлів обміну та містити обов'язкові реквізити обох документів.

Таким чином, на даний момент в організації є повний набір форматів документів для оформлення в електронному вигляді будь-якої ситуації її фінансово-господарської діяльності, пов'язаної з передачею товарів, робіт, послуг, майнових прав від одного суб'єкта господарювання іншому. Формати розроблені всім документів, які найчастіше запитуються податковими органами в платників податків, що зрештою призводить до оптимізації процесу роботи з-поміж них.

Обмінюватись електронними документами з контрагентами набагато швидше, ніж паперовими. Їх зручно зберігати, шукати та представляти на вимогу ФНП. Дізнайтеся про переваги використання електронного документообігу для вашої компанії.

Дата публікації: 24.05.2016

© 2022 androidas.ru - Все про Android