Підсумки другого науково-практичного семінару «Оцифроване надбання: збереження, доступ, репрезентація»

Поділитися: 

16-17 грудня 2014 року у Державному політехнічному музеї при НТТУ «КПІ» було проведено другий [33, 33] науково-практичний семінар «Оцифроване надбання: збереження, доступ, репрезентація» Тема заходу - «Оцифрування як інформаційне виробництво і сервіс». Мета заходу ознайомлення фахівців з передовими світовими практиками, навчання технологіям оцифрування, формування та інтеграції цифрових колекцій, методам їх розповсюдження та використання. Другий семінар присвячений питанням організаційно-технологічного і нормативного забезпечення процесів оцифрування і організації сервісів з цифровим контентом.

Підсумки першого науково-практичного семінару «Оцифроване надбання: збереження, доступ, репрезентація»

 

Методика оцифрування документів [2, 5, 48, 50]

Одним із характерних трендів у гуманітарній сфері на початку третього тисячоліття стали процеси оцифрування і представлення в електронному середовищі об'єктів історико-культурної спадщини: музейних артефактів, книжкових зібрань, архівних документів. Спочатку це була невід'ємна частина створення електронних каталогів зібрань найбільших бібліотек, музеїв та архівів, електронні копії виконували роль презентаційних (мультимедійних) продуктів, але цифрові проекти досить швидко набули статусу самостійного, самодостатнього, надзвичайно капітало- і наукоємного напряму у діяльності фондоутримувачів. Це пов'язано не стільки з організацією «широкого доступу» до фондів, скільки з необхідністю забезпечити фізичне збереження оригіналів шляхом створення їх електронних копій та вилучення оригіналів з читальних залів, а також виконанням державних планів і програм із перетворення історико-культурного надбання у цифровий формат.

Можна виділити два типи вимог до оцифрування у залежності від цілей:

  1. обов'язковий – отримання копій сторінок у вигляді графічних зображень, здійснюване шляхом сканування з подальшою обробкою і збереженням в одному з форматів графічних файлів. У цьому випадку повністю зберігається оригінальна верстка книги і виключається спотворення змісту. Можливість пошуку по тексту відсутня.
  2. пошуковий (факультативний) – оптичне розпізнавання тексту з подальшим збереженням розпізнаного тексту як підкладки набору графічних символів. У цьому випадку стає можливий повнотекстовий пошук по книзі.

Оцифрування документів «своїми силами» ставить перед установою наступні завдання:

  • Визначення параметрів відбору документів для оцифрування;
  • Аналіз параметрів документів з метою визначення матеріально-технічної бази, необхідної для оцифрування документів та вимог, що пред'являються до електронного контенту;
  • Забезпечення матеріально-технічної бази (придбання обладнання, його налаштування);
  • Навчання кадрів, що займатимуться оцифруванням;
  • Введення комплексу оцифрування в експлуатацію, стажування кадрів;
  • За необхідності організація додаткових курсів підвищення кваліфікації;
  • Визначення планових показників, впровадження системи звітності;
  • Навчання спеціалістів центрів оцифрування у напрямку обробки цифрових ресурсів – каталогізації.

Інший спосіб оцифрувати свої фонди це скористуватися послугами організацій що займаються оцифруванням. Наприклад спеціалізований центр «БАЛІ» пропонує широкий спектр послуг, серед яких не тільки послуги з оцифрування і обробки зображень, фото послуги, а і дистрибуція, локалізація і супровід спеціалізованого програмного забезпечення для електронних бібліотек, краєзнавчих ресурсів, електронних енциклопедичних довідників; розробка, впровадження та супровід технологічних рішень для електронних бібліотек і цифрових колекцій; послуги з оцифрування, обробки зображень, очищення і розпізнавання текстів; спільні проекти і партнерство у створенні інтегрованого цифрового контенту, удосконалення систем повнотекстового пошуку у багатомовних ресурсах і веб- репрезентації оцифрованих об'єктів.

Через необхідність розробки інструментальних засобів контролю якості оцифрованих зображень та нормативної документації для країн СНГ, ЗАО «ДиМи-Центр», за підтримки Російської державної бібліотеки (РДБ), та Державної науково-технічної бібліотеки Росії (ДПНТБ Росії) розробили методичні вказівки і технічні інструкції з оцифрування «Методика контроля качества сканирования бумажных документов».

У процесі роботи вивчався закордонний досвід розробки універсальних засобів об’єктивного контролю якості сканування документів. Було враховано результати проектів Metamorfoze (Нідерланди) і The National Digital Information Infrastructure and Preservation Program (США), та інших.

Як джерело освітлення можна використовувати «холодні» електролюмінесцентні або флуоресцентні лампи з фільтром, що захищає від ультрафіолетового випромінювання і поглинає тепло, також можна використовувати світлодіоди, або волоконно-оптичні системи освітлення. Освітлювачі мають не завдавати шкоди об'єкту сканування потоком ІЧ і УФ випромінювання. Ще одною вимогою до освітлення є забезпечення рівномірності освітлення по всьому формату оригіналу для отримання якісних результатів і збереження природного світло-тіньового балансу. У деяких бібліотеках газети, архівні матеріали, рукописи розшивають перед оцифруванням, а потім не зшивають, зберігають у спеціальних картонних коробках виготовлених з безкислотного картону.

 

Технічні засоби обробки і управління оцифрованими документами [6, 7, 42]

Компанія ABBYY, провідний світовий розробник програмного забезпечення та постачальник послуг у галузі лінгвістики, розпізнавання документів та введення даних. Своєю місією компанія обрала допомогу людям розуміти один одного. Створюючи рішення у галузі штучного інтелекту, введення документів, обробки даних та перекладу, ABBYY перетворює інформацію у корисні знання.

ABBYY розробляє ключові технології у 4-х напрямках:

  • розпізнавання документів (OCR – оптичне розпізнавання тексту; ADRT – розпізнавання структури документу; MRC – зменшення розміру зображення при зберіганні у PDF; перетворення PDF-файлів);
  • потокове внесення даних (ICR – оптичне розпізнавання символів, написаних від руки; OMR – розпізнавання міток; OBR – розпізнавання одновимірних і двовимірних штрихкодів; класифікація документів; інтелектуальний аналіз сторінки; вилучення даних з будь-яких типів документів);
  • аналіз та розуміння тексту (інтелектуальний корпоративний пошук; вилучення даних; eDiscovery. Перспективні напрямки: класифікація документів; порівняння документів; аналіз тональності висловлювань; охорона інформаційного периметра організації з виявленням фактів передачі несанкціонованої інформації; система прогнозування та оповіщення про події; багатомовний пошук);
  • лінгвістика та переклад (морфологія, синтаксис, семантика; управління термінологією; впровадження лінгвістичних технологій; послуги з локалізації; переклад документації; лінгвістична підтримка міжнародних заходів; створення глосаріїв і баз пам'яті перекладу; електронні та друковані словники).

Автоматизація введення документів і даних:

  • Переведення оцифрованих документів, зображень та PDF-файлів у редаговані формати;
  • Створення електронних архівів з можливістю швидкого пошуку потрібних документів;
  • Введення даних в інформаційну систему підприємства з будь-яких видів паперових бланків, анкет та фінансових документів.

Лінгвістичні рішення і послуги:

  1. ABBYY Language Services – Лінгвістична підтримка корпоративних клієнтів:
    • Локалізація програмного забезпечення, веб-сайтів, мультимедіа і маркетингових матеріалів з англійської більш ніж на 80 мовах;
    • Послуги письмового перекладу великих обсягів документації. Лінгвістичний супровід великих міжнародних заходів, послуги перекладу телефонних переговорів, відео-конференцій;
  2. Видавництво ABBYY Press – випуск словників, енциклопедій, а також робота над путівниками;
  3. ABBYY Compreno – Система розуміння, аналізу та перекладу текстів на природних мовах.

Спеціалізований центр "БАЛІ" розробив систему формування та інтеграції цифрових колекцій DC-Visu онлайнових репрезентацій оцифрованих документів. DC-Visu реалізує: репрезентацію оцифрованих документів, якісно відтворюючи його у цифровій формі, яка передає всі особливості зовнішнього вигляду оригіналу; посимвольне подання тексту для повнотекстового пошуку; візуалізацію оригіналу, пошук та інші можливості роботи з текстом в єдиному інтерфейсі; представлення документа єдиним об'єктом у якому зосереджено кілька електронних форматів; розвантаження користувача: інтуїтивно зрозумілий інтерфейс без локальних інсталяцій; використання наявних систем для бібліотечних сервісів; збагачення інформаційного змісту та візуальних сервісів. Система управління електронними колекціями розрахована на використання в електронних бібліотеках. Може бути використана як інструментарій для перегляду зовнішніх об'єктів у бібліографічних та повнотекстових інформаційно-пошукових системах.

DC-Visu V 2.0 дозволяє керувати колекціями оцифрованих документів, сумісна з, популярною у бібліотеках країн СНД, СУБД «ІРБІС»; надає можливість цитування книг; використовує ABBYY-сервіси для розпізнавання тексту, для покращення пошуку; підтримує можливість імпорту метаописів у форматі XML у колекції Europeana.

У наступних версіях, планують реалізувати можливість представлення різних типів документів, наприклад листових. Крім того, слід зазначити, що всі розробки орієнтовані на проект Europeana, тому всі мета описи є і будуть сумісними з вимогами цього проекту.

 

Метадані [8, 9, 10, 30, 58, 61]

Центр з проблем інформатизації сфери культури (Центр ПІК) опублікував переклад брошури «Оцифровка: ландшафт стандартов для европейских музеев, архивов, библиотек», виданої робочою групою проекту Athena, який є агрегатором інформаційних ресурсів європейських музеїв, бібліотек та архівів і передає зібрані матеріали у європейську цифрову бібліотеку Europeana. У брошурі даються визначення основних понять, пов'язаних зі стандартами, а потім за схемою описуються міжнародні стандарти метаданих, формати представлення мультимедіа інформації, протоколи передачі інформації, стандарти кодування символів, які використовуються у закладах культури - постачальниками інформаційних ресурсів.

Для створення карткових каталогів у бібліотеках використовуються правила каталогізації – стандарти змісту. Для створення електронного каталогу, також використовуються стандарти змісту, але для взаємодії з комп’ютером їх недостатньо, тому на їх основі було розроблено комунікативні формати, що можуть оброблятися машиною. Для можливості обміну описами і створення зведених каталогів було розроблено стандарти обміну даними. Розглянемо деякі приклади.

Концептуальні моделі:

  • FRBR (функціональні вимоги до бібліографічних описів) – концептуальна модель метаданих «об’єкт-зв’язок» для інформаційних об’єктів; пов’язує завдання користувача із пошуку та доступу у бібліографічних базах даних з точкою зору користувача; розроблено IFLA – 1998 р., остання редакція 2009 р., перекладено на 21 мову.
  • FRAD (функціональні вимоги до авторитетних даних) – пов’язує дані, що записані у бібліотечних авторитетних записах з потребами користувачів цих записів та просуває і розповсюджує ці дані; допомагає знайти об’єкт чи набір об’єктів відповідно до заданих критеріїв; ідентифікувати об’єкт; контекстуалізувати (місце особи, організації, роботи тощо у контексті) і обґрунтувати; розроблено IFLA – 2009 р., остання редакція 2013 р., перекладено на 13 мов.
  • FRSAD (функціональні вимоги до предметних авторитетних даних) – пояснює, як об’єкти, що є предметами інтелектуальної чи мистецької творчості, можуть пов’язуватися і контролюватися у межах бібліографічного універсуму; розроблено IFLA – 2010 р., продовження FRBR.
  • CIDOC CRM (концептуальна базова модель Міжнародної ради музеїв) – для інтеграції, посередництва та обміну інформацією в області світової культурної спадщини та пов’язаних областей; розроблено – 1998 р., стандарт ISO 21127 – 2006 р.; останнє поновлення 2011 р.
  • FRBRoo (об’єктно-орієнтовані функціональні вимоги до бібліографічних записів) – формальна онтологія, призначена для збирання та представлення базової семантики бібліографічної інформації та для полегшення інтеграції, посередництва та обміну бібліографічною та музейною інформацією; розроблено IFLA та CIDOC – 2008 р.; об’єднала Базову модель Міжнародної ради музеїв та FRBR.
  • DELOS DLRM (базова модель цифрової бібліотеки) – концептуальна модель для системи управління цифровою бібліотекою; для розробки більш вузьких моделей з конкретною архітектурою для реалізації систем цифрових бібліотек; розроблено Асоціацією цифрових бібліотек – 2007 р.
  • OAIS RM (базова модель для відкритої архівної інформаційної системи) – розроблено Консультативним комітетом із космічних інформаційних систем – 2002 р.; довготермінове зберігання та доступ; ISO 14721:2003 та ISO 14721:2012.

Правила каталогізації (стандарти змісту):

  • ГОСТ 7.1:2003 (Бібліографічний запис, бібліографічний опис. Загальні вимоги та правила складання) – розроблено Російською книжковою палатою, РГБ, РНБ, Міждержавним технічним комітетом із стандартизації – 2003 р.; Використовується у Вірменії, Білорусії, Казахстані, Киргизстані, Молдові, Росії, Таджикистані, Туркменістані, Узбекистані, Україні; Україна ДСТУ – 2006 р.
  • ISBD (C) (консолідований міжнародний стандарт бібліографічного опису) – розроблено IFLA; консолідований стандарт ISBD – 2007 р.; відповідає моделіFRBR.
  • ACCR2 (Англо-Американські правила каталогізації 2) – розроблено Об’єднаним керівним комітетом – 1978 р.; Останнє поновлення – 2002 р.; Замінено на RDA;
  • RDA (опис ресурсу та доступ) – розроблено Об’єднаним керівним комітетом – 2009; Відповідає моделям FRBR, FRAD; Узгоджено з форматами MARC21, MODS, DUBLIN CORE, стандартом ONIX; використовується у національних бібліотеках США, Канади, Австралії, Великої Британії, Сінгапуру, Малайзії, Філіппін, Німеччини, Нідерландів, Фінляндії, Ірландії, Шотландії; перекладено китайською, французькою, німецькою та іспанською мовами.
  • CCO (каталогізація культурних об’єктів – принципи опису культурних об’єктів та їхніх зображень) – розроблено на замовлення Асоціації візуальних ресурсів.
  • ISAD(G) (загальний міжнародний стандарт архівного опису) – розроблено Міжнародною Радою Архівів; переклад українською – 2002 р.; правила описування архівних документів (ISAD(G): 1999, NEQ): ДСТУ 4331:2004 – Чинний від 01.07.2005.

Для опису бібліографічних ресурсів, використовуються комунікативні формати, що розроблені у відповідності до правил каталогізації:

Стандарти описових метаданих призначені для опису змісту цифрових об’єктів:

  • MARCXML – призначений для представлення даних MARC21 у XML структурі; розроблений Бібліотекою Конгресу США:
    • як розширена схема стандарту кодування та передачі метаданих - METS;
    • для представлення метаданих для OAI збирання (харвестингу);
    • для опису оригінальних ресурсів у XML синтаксисі;
    • для метаданих XML, які можуть постачатись разом із електронним ресурсом;
  • Dublin Core (Дублінське ядро) – набір елементів метаданих, значення яких описують вміст інформаційного ресурсу; розроблений Dublin Core Metadata Initiative у 1998 році; 15 елементів метаданих з відповідними множинами кваліфікаторів.
  • MODS (Схема метаданих опису об’єктів) – XML розмітка для вибраних метаданих з існуючих MARC21 записів додатково до оригінальних описів ресурсів; розроблено Бібліотекою Конгресу США:
    • як розширена схема стандарту кодування та передачі метаданих – METS;
    • для представлення метаданих для OAI збирання (харвестингу);
    • для опису оригінальних ресурсів у XML синтаксисі;
    • для метаданих XML, які можуть постачатись разом із електронним ресурсом;
  • MADS (схема метаданих опису авторитетних даних) – XML розмітка для вибраних авторитетних даних; розроблено Бібліотекою Конгресу США:  для набору авторитетних елементів, що можуть бути використаними для надання метаданих про агентів (людей, організації), події і поняття (теми, жанри, тощо);  пов’язана зі схемою метаданих опису об’єктів (MODS) для надання метаданих про авторитетні об’єкти, що використовуються в описах MODS.
  • EAD (кодований архівний опис) – стандарт кодування архівних допоміжних засобів пошуку з використанням XML; розроблено Бібліотекою Конгресу США у партнерстві з Товариством американських архівістів:
    • специфікує елементи, які будуть використані для опису рукописних колекцій;
    • багато елементів є чи можуть бути відображені у стандартах змісту (наприклад, ISAD(G) – загальний міжнародний стандарт архівного опису) чи інших структурованих стандартах (наприклад MARC чи Dublin Core).
  • VRA CORE – стандарт даних та XML схема для опису робіт візуальної культури, а також зображень, що документують їх; розроблено Бібліотекою Конгресу США у співпраці з Асоціацією візуальних ресурсів; містить набір елементів метаданих та початкову модель ієрархічної структуризації цих елементів.
  • CDWA Lite – XML схема для опису робіт мистецтва та матеріальної культури; базується на CDWA (категорії для опису творів мистецтва) та CCO (правила каталогізації об’єктів культури та їх зображень); використовується у зведених каталогах та репозиторіях, які побудовані на OAI-PMH.

Стандарти структурних та адміністративних метаданих призначені для керування колекціями цифрових об’єктів та доступом до них, описують носії та середовище цифрових об’єктів, збереження, управління правами, формати метаданих:

  • METS (стандарт кодування та передачі метаданих)
  • PREMIS (метадані збереження: стратегії впровадження)
  • MIX-NISO (метадані для зображень XML)
  • TextMD (технічні метадані для тексту)
  • ISO 20775 (Schema for Holdings Information – схема для інформації про місце утримання)
  • ALTO (об’єкт комплекту тексту та макету) – стандарт метаданих що використовується для зберігання інформації про зміст і структуру розділів.

Стандарти обміну даними призначені для пошуку, отримання та обміну інформацією між базами даних:

  • Z39/50 – стандарт протоколу пошуку та отримання інформації з віддалених баз даних;
  • OAI-PMH – протокол збору метаданих ініціативи відкритих архівів;
  • OpenURL – визначає тип URL, що містить набори контекстно-залежних метаданих ресурсів; база даних може експортувати URL посилання на ресурс, який відсутній у базі даних; створює зв’язок між ідентифікованим ресурсом та відповідною послугою (дозволяє шукати в інших базах даних, щоб користувач міг отримати доступ до примірника онлайн, замовити через міжбібліотечний абонемент або електронну доставку документів).

Міжнародні стандарти в Україні необхідні для того щоб відповідати вимогам сучасності, мати можливість стати частиною глобального професійного та інформаційного простору. Для інтеграції українських бібліотек у світовий інформаційний простір необхідно вивчати та перекладати міжнародні стандарти, адаптувати та легалізувати їх в Україні, навчати бібліотекарів та впроваджувати застосування для бібліотек.

У музеях дуже складно було прийти до єдиного стандарту, адже у кожному музеї використовувалися свої стандарти та програмне забезпечення, що несумісне із стандартами та програмним забезпеченням інших музеїв. Але 17 липня 2014 року у Києві відбувся «круглий стіл» з питань впровадження електронного обліку музейних предметів в Україні. Застосування уніфікованих автоматизованих комп’ютерних систем обліку у роботі музеїв не лише сприятиме оптимізації та інтенсифікації фондово-облікових процедур, підвищить рівень безпеки музейних колекцій, а й забезпечить дієвий механізм включення інформації про рухомі культурні цінності до Державного реєстру національного культурного надбання та міжнаціональних банків даних.

Також, під час обговорення концептуальних засад організації музейного обліку в Україні та участі професійного середовища у процесі розвитку та імплементації відповідних стандартів у тісній комунікації із зарубіжними колегами, була висловлена ініціатива створення української секції документації (CIDOC) національного комітету Міжнародної ради музеїв (ІСОМ).

CIDOC CRM визначає семантику схем баз даних і структур документів, що використовуються у культурній спадщині та музейній документації, у термінах формальної онтології. Модель не визначає термінологію, що з'являється у конкретних структурах даних, але має характерні відносини для її використання. Модель може служити як керівництвом для розробників інформаційних систем, так і спільною мовою для експертів предметної області та фахівців з інформаційних технологій. Вона призначена для покриття контекстної інформації історичного, географічного і теоретичного характеру про окремі експонати і музейні колекції в цілому.

Структурно CIDOC CRM складається з ієрархії класів і широкого набору властивостей (бінарних відносин), що пов'язують класи між собою. Всі концепти (класи і властивості) моделі можна розділити на три групи. Перша група включає класи та відносини, які охоплюють найбільш загальні поняття навколишнього світу: постійні та тимчасові суті, відносини участі, залежності, збіги у часі. Друга група містить поняття, що частково підтримують функції управління: придбання та облік одиниць зберігання, передача прав власності на об'єкти культури. До третьої групи відносяться класи і властивості, використовувані для внутрішньої організації самої онтології: кошти, необхідні для підключення зовнішніх джерел термінів, наприклад, тезаурусів по галузях культури. Ієрархія класів моделі CIDOC CRM ділиться на 2 гілки: Постійні сутності й Тимчасові сутності. Інші класи є допоміжними.

На самих нижніх рівнях ієрархії класів з'являються поняття, характерні для сфери культури: Зберігання, Переміщення (цінностей), Проект або Процедура (у тому числі техніка виробництва), Період (у тому числі художній стиль). Ієрархія класів може бути гнучко розширена із застосуванням вбудованого класу Тип. Найбільший інтерес представляють властивості. Класи на нижніх рівнях ієрархії мають близько 10-15 властивостей, причому більша частина властивостей успадковується від класів-предків. Назви властивостей являють собою дієслівні фрази, вибрані так, що при послідовному зв'язуванні двох класів властивостей виходить осмислена фраза з суб'єктом (перший, якщо рахувати зліва направо, клас), предикатом (властивістю) і об'єктом (другий клас).

LIDO поєднує у собі формати:

  • CDWA Lite (Getty) це XML-схема кодування основних описів творів мистецтва і матеріальної культури на основі елементів даних і керівних принципів у CDWA і після стандартного змісту, дані по каталогізації культурних цінностей, передбачених Гетті і Framework Tools#ARTstor. Він призначений для обміну описами, та постачання інформації у зведені каталоги з використанням OAI / PMH (той же протокол, використовує Europeana);
  • museumdat (German Museums Association) це XML-схема, що базується на CDWA Lite, але має свою специфічну спрямованість головним чином на мистецтво, реконфігурує елементи CDWA Lite, і орієнтується на підхід CIDOC CRM;
  • CRM (CIDOC);
  • SPECTRUM XML (Collections Trust) базується на однойменному британському міжнародному стандарті для управління колекціями. Це забезпечує можливість обміну описами між різними системами управління колекціями і агрегування даних.

LIDO призначений спеціально для експорту метаданих та агрегування їх у зведені каталоги. Це мало б надати стимул постачальникам метаданих для використання стандарту LIDO у своїх системах. Одним з найважливіших зведених каталогів сьогодні є Europeana, який використовує формат ESE / EDM, LIDO моделі яких, засновані на протоколі збору метаданих OAI-ORE. Одним з проектів Europeana який використовує LIDO є Athena, цим проектом було опубліковано буклет «Lightweight information describing objects (lido): the international harvesting standard for museums». Крім того інструмент, який використовується Europeana конвертує будь який стандарт, у тому числі і LIDO у EDMMint.

 

Хмарні сервіси [4, 65]

Хмарні сервіси є інформаційною технологією (ІТ), що надається за вимогою як інтернет-сервісу або виділеній мережі, який оплачується залежно від використання. Хмарні сервіси представлені у широкому діапазоні - від повноцінних додатків і платформ для розробки до серверів, систем зберігання і віртуальних робочих місць.

Комерційні та державні компанії використовують хмарні сервіси як різноманітні додатки. На відміну від традиційної ІТ інфраструктури, у якій фонд програмного і апаратного забезпечення поповнюється протягом місяців, хмарні сервіси надають ІТ-ресурси протягом хвилин або годин, при цьому вартість залежить від фактичного використання. У зв’язку з цим можуть швидше обробляти дані і оптимізувати витрати. Аналогічно споживачі використовують хмарні сервіси для спрощення роботи з додатками, зберігання і передача даних та захисту змісту, при цьому маючи доступ до послуги з будь-якого пристрою, підключеного до мережі.

Хмарні сервіси мають кілька загальних атрибутів:

  1. Віртуалізація – під час роботи хмарних технологій інтенсивно застосовується віртуалізація сервера і сховища, щоб швидко розподіляти / перерозподіляти ресурси;
  2. Функціональність розрахована на велику кількість користувачів – ресурси об'єднуються і надаються великій кількості користувачів;
  3. Мережевий доступ – надає можливість доступу до ресурсів через браузер або спеціальний клієнт для безлічі підключених до мережі пристроїв (комп'ютера, планшета, смартфона);
  4. Надання за вимогою – надає можливість самостійного виділення ресурсів з інтерактивного каталогу з встановленими налаштуваннями;
  5. Гнучкість – масштаб ресурсів може бути збільшений або зменшений автоматично;
  6. Засоби вимірювання і розподілу витрат між підрозділами – дозволяють відстежувати і визначати вартість ресурсів згідно з договором про надання послуг.

Серед багатьох типів хмарних сервісів, що надаються постачальниками послуг, найбільш поширеними є такі:

  1. ПО як послуга (SaaS) – програмне забезпечення працює на комп'ютерах, які належать постачальнику SaaS і керуються ним, при цьому вони не встановлюються і не керуються за допомогою комп'ютерів користувача. Доступ до них надається через загальну мережу Інтернет і, як правило, надається на основі щомісячної або річної передплати.
  2. Інфраструктура як послуга (IaaS) – обчислювальні та мережеві ресурси, а також ресурси зберігання даних та інші елементи (безпека, інструменти) надаються постачальником IaaS через загальну мережу Інтернет, VPN або підключення до виділеної мережі. Користувачі отримують у користування та управління операційну систему, додатки та інформацію, наявні в інфраструктурі і оплачують послуги відповідно з використанням.
  3. Платформа як послуга (PaaS) – Всі компоненти програмного і апаратного забезпечення, необхідні для створення та управління додатками, що працюють на основі «хмарних обчислень», надаються провайдером PaaS за допомогою загальної мережі Інтернет, VPN або підключення до виділеної мережі. Користувачі оплачують послуги відповідно до використання і контролюють використання додатків у їхньому життєвому циклі

Хмарні сервіси мають багато переваг, серед яких:

  • Хмарні сервіси швидше окупаються;
  • Постійний доступ до додатків і вмісту;
  • Швидка масштабованість відповідно до вимог;
  • Більш вигідне використання інфраструктурних інвестицій;
  • Більш висока продуктивність ІТ персоналу і всієї організації;

Серед недоліків хмарних сервісів можна виділити основні:

  • Вимога постійного підключення до Інтернету;
  • Сумнівна конфіденційність;
  • Сумнівна безпека;
  • Дороге обладнання.

Сучасні хмарні сервіси все ще важко уявити як альтернативу власному жорсткому диску, але вони дуже зручні як буфер обміну між комп'ютером і мобільним пристроєм. Крім того онлайн ресурси незамінні коли потрібно мати під рукою всі важливі файли з можливістю їх перегляду на будь-якому пристрої. Крім того ви завжди зможете поділитися цими файлами зі співробітниками, відкривши доступ або відправивши посилання на файл. Є і ще один плюс, у випадку поломки комп'ютера, ваші файли у хмарі залишаться цілими і неушкодженими. Щоб розпочати роботу з будь-яким хмарним сервісом необхідно пройти реєстрацію, у деяких випадках досить мати поштову скриньку цих служб, далі можна скопіювати файли через веб-інтерфейс або використати спеціальний клієнт, що встановлюється на комп’ютер. Клієнт створює на комп'ютері папку, яка синхронізується з хмарним сервісом.

Документи Google (Google Docs) – безкоштовний онлайн-офіс, що включає у себе текстовий, табличний процесор і сервіс для створення презентацій, а також інтернет-сервіс хмарного зберігання файлів з функціями файлообміну, що розробляється компанією Google. Утворений у результаті злиття Writely і Google Spreadsheets. Пізніше функціональність програми була розширена за допомогою офісного пакету Quickoffice, придбаного пошуковою корпорацією у 2012 році. Для мобільних платформ Google Android і Apple iOS компанія розробляє спеціальний варіант програм, створених за допомогою Android SDK і Xcode.

Google Docs являє собою веб-орієнтоване програмне забезпечення, що працює у рамках веб-браузера і не потребує установки на комп'ютер користувача. Документи і таблиці, створювані користувачем, зберігаються на спеціальному сервері Google, або можуть бути експортовані у файл. Це одна з ключових переваг програми, оскільки доступ до введених даних може здійснюватися з будь-якого комп'ютера, підключеного до Інтернету (при цьому доступ захищений паролем).

Picasa – безкоштовна програма для роботи з цифровими фотографіями, створена компанією Lifescape у 2002 р. 13 червня 2004 Picasa була придбана компанією Google. Picasa інтегрована з фотохостингом Picasa Web Albums (веб-альбоми Picasa), а також Blogger, Gmail, YouTube, Google Earth і Google Plus.

Серед можливостей Picasa – завантаження фотографій до комп'ютера зі сканера та камери, автоматична індексація фотографій на жорсткому диску комп'ютера, перегляд фотографій у звичайному і повноекранному режимі, у тому числі у вигляді слайд-шоу, геотегінг: Picasa може записувати координати у метадані EXIF, редагування фотографій, включаючи ретушування, кадрування та вирівнювання, застосування до фотографій різних ефектів, у тому числі корекція ефекту червоних очей, присвоєння фотографіям ярликів і ключових слів, при редагуванні зображення Picasa зберігає його оригінал у прихованій папці, яка знаходиться у тій же папці що і редагований файл.

Dropbox є засновником напряму хмарних сховищ даних. Dropbox – хмарне сховище даних, яке належить компанії Dropbox Inc., що дозволяє користувачам зберігати свої дані на серверах у хмарі і ділитися ними з іншими користувачами в Інтернеті. Робота побудована на синхронізації даних. З Dropbox користувач працює за допомогою клієнта або з використанням веб-інтерфейсу через браузер. При установці клієнтського програмного забезпечення Dropbox на комп'ютері з’являється папка, що синхронізується із хмарним сховищем. Хоча головний акцент технології робиться на синхронізацію і обмін інформацією, Dropbox веде історію завантажень, щоб після видалення файлів з сервера була можливість відновити дані. Також ведеться історія зміни файлів, яка доступна на період до 30 днів.

Файли, завантажені через клієнт, не мають обмеження на розмір, але файли, завантажені через веб-інтерфейс, обмежені 300 МБ. Є також можливість завантажувати файли для загального доступу через папку «Public», що дозволяє використовувати сервіс як файлообмінник. Для спільної роботи над проектами сервіс має можливість створення папок спільного доступу осіб, які мають різні облікові записи на сервісі. Доступна автоматична синхронізація файлів і папок і зберігання версій з можливістю відкату.

Evernote – веб-сервіс і набір програмного забезпечення для створення та зберігання заміток. Заміткою може бути фрагмент тексту, веб-сторінка, фотографія, аудіофайл або рукописний запис. Нотатки можуть також містити вкладені файли іншого типу. Нотатки можна сортувати за блокнотами, присвоювати їм мітки, редагувати і експортувати.

Evernote підтримує кілька комп'ютерних і мобільних платформ, включаючи OS X, iOS, Chrome OS, Android, Microsoft Windows, Windows Phone, BlackBerry і webOS, а також пропонує онлайн-синхронізацію і резервне копіювання.

Evernote був заснований Степаном Пачіковим і представлений у вигляді відкритої бета-версії 24 червня 2008 р. Evernote доступний як у платному, так і в обмеженому безкоштовному варіантах. Використання безкоштовної версії передбачає щомісячний ліміт на обсяг заміток, що розміщуються, який можна збільшити при заміні безкоштовної версії на платну. 4shared – хмарний файлообмінний хостинг. 4shared – сервіс, який надає послуги хостингу файлів і їх обміну. Базова безкоштовна реєстрація дає можливість завантажувати до 10 Гбайт у свій обліковий запис. Після підтвердження реєстрації електронною поштою обсяг збільшується до 15 Гбайт. Преміум-користувачі отримують у своє розпорядження 100 Гбайт. Після успішного завантаження файлу користувач отримує унікальне посилання, за яким можна завантажити цей файл. Всі завантажені файли зберігаються протягом 180 днів з моменту останнього відвідування акаунта. Файли преміум-користувачів зберігаються на весь термін дії облікового запису.

 

Міжнародні проекти [2]

All Our Yesterdays (Все наше минуле) – «Життя через призму перших фотографів Європи (1839 - 1939)». Музеї, архіви, університети, приватні підприємства та державні органи з усієї Європи об'єдналися у проекті EuropeanaPhotography оцифрувати свої фото-колекції за період 1839-1939 років. Тут представлені відретушовані, рідкісні фотографії, що задокументували минуле.

All Our Yesterdays пропонує відвідувачам можливість відкрити для себе, як люди жили в Європі, як вона відрізнялася від тієї яку ми знаємо сьогодні, які були зміни до народження сучасної Європи. All Our Yesterdays це інтерактивна віртуальна виставка, відвідувачі можуть продивлятися електронні версії фотографій переміщуючись ресурсом. Виставка представлена і реалізована EuropeanaPhotography, європейським проектом, що фінансується Європейською комісією, з метою вибору і оцифрування більш ніж 430 000 зображень першого сторіччя існування фотографії (1839-1939), які представляють історичну, культурну та художню цінність, оцифровані зображення доступні також всім проектам Europeana – європейської цифрової бібліотеки.

Деякі з експонатів цієї виставки були надані Музеєм однієї вулиці і Національним Києво-Печерським історико-культурним заповідником. Координатором і представником українських учасників у фотовиставці виступив «Спеціалізований центр БАЛІ», асоційований партнер проектів EuropeanaPhotography і AthenaPlus – агрегаторів історико-культурного оцифрованого контенту у Europeana. [35]

 

Додаткові матеріали

Проекти з оцифрування.

Metamorfoze (metamorfoze digitalization project) це загальнонаціональна програма Нідерландів, що сприяє збереженню культурного надбання. Програма існує з 1997 року, головний офіс розміщується у Королівській бібліотеці (Національна бібліотека Нідерландів – Koninklijke Bibliotheek). Будь-яка установа пам’яті Нідерландів може внести у список пропозиції щодо створення нових проектів і збереження фондів в офісі Metamorfoze. Після цього комітет з декількох незалежних експертів розглядає та оцінює ці пропозиції і їх релевантність для програми Metamorfoze. Основне завдання комітету це розробка рекомендацій з фінансування пропозицій, які подаються у Metamorfoze. Програма віддає перевагу матеріалам голландського походження, які зберігаються в установах культурної спадщини: наукових бібліотеках, великих регіональних або місцевих бібліотеках, архівних установах, регіональних історичних центрах, історичних центрах документації, музеїв та науково-дослідних інститутів.

Національна інфраструктура цифрової інформації та програма збереження (The National Digital Information Infrastructure and Preservation Program (NDIIPP)) це програма яку веде Бібліотека Конгресу США з архівування і надання доступу до цифрових ресурсів. Конгрес США організував програму у 2000 році. Бібліотека Конгресу як одна з провідних постачальників високоякісного контенту в Інтернеті була обрана головним офісом проекту. У липні 2010 року бібліотека організувала Національний електроний опікунський Альянс (National Digital Stewardship Alliance (NDSA)), щоб залучити до проекту більше установ. Основними цілями NDSA є розвиток існуючих стандартів і методів збереження, для цього організована співпраця з експертами для визначення форматів цифрової інформації, які є найбільш придатними для збереження. Крім того NDSA бере участь в об’єднанні цифрового контенту у загальнонаціональній колекції. Серед членів NDSA є університети, професійні асоціації, комерційні підприємства, консорціуми, і державні установи.

Digidaily проект з оцифрування шведських газет, тривав з 2010 року по 2013 рік. Digidaily розвивався у Media Conversion Center (MKC), Національному архіві (Riksarkivet in Swedish) і Національній бібліотеці Швеції (Kungl. biblioteket in Swedish), де і було розроблено раціональні методи і процеси оцифрування та інтерпретації тексту газет. Оцифровувалися відібрані видання шведських газет, як оригіналів так і копій з мікрофільмів. SAP – проект з оцифрування шведсько-американської преси, розвиток якого підтримується у Центрі конверсії медіа ресурсів (Media Conversion Center (MKC)), Національному архіві (Riksarkivet in Swedish) і Національній бібліотеці Швеції (Kungl. biblioteket in Swedish). Національна бібліотека Швеції співпрацює з Europeana у проекті EUscreenXL. У проектах SAP і Digidaily, для опису цифрових об’єктів використовується декілька стандартів метаданих – METS, PREMIS, MODS, MIX, ALTO. [35]

ELuxemburgensia це другий проект з оцифрування у Національній бібліотеці Люксембургу (Bibliothèque nationale de Luxembourg (BnL)) що був відкритий у грудні 2009 року. Перший – luxemburgensia був менш досконалим, тепер є можливість шукати не тільки за змістом але повнотекстовим пошуком через новий інтерфейс на www.eluxemburgensia.lu. Крім того, оцифровані ресурси були інтегровані у систему цифрового архівування. Для реалізації повнотекстового пошуку оцифрований контент було повністю переведено у текстовий формат за допомогою програмного забезпечення оптичного розпізнавання символів. Цілями проекту є фізичне збереження друкованої спадщини, забезпечення доступу в Інтернеті (у межах регулювання авторських прав), забезпечення сучасних методів пошуку цифрового змісту.

Національна бібліотека Люксембургу використовує METS і ALTO у своїх проектах з оцифрування. Формат METS дозволяє структурувати і шукати у логічній структурі документів (сторінок, статей і т.д.). Він також відстежує технічні метадані (права, цифрове обладнання і т.д). Формат метаданих ALTO описує структуру окремих сторінок і зберігає результат обробки програмами OCR (Optical Character Recognition). Поєднання METS і ALTO, дозволяє здійснити пошук за специфічними термінами, які знаходяться в оригінальній статті на зображеннях сторінок.

У The Australian Newspaper Digitisation Program (Австралійська программа з оцифрування газет) розроблено сервіс, який забезпечує Інтернет доступ до газет. Державні і територіальні бібліотеки та інші власники мікрофільмів майстер-якості з копіями газет забезпечили мікрофільми необхідних екземплярів для оцифрування. Цифрові зображення перетворили у повнотекстовий контент за допомогою OCR. Контент аналізується людиною оператором і розбивається на статті, сегменти, сторінки (зони) і створює метадані для статей.

Газети описуються таким чином. XML файл для кожної сторінки, відповідає схемі ALTO і містить результати OCR обробки. Файл XML для кожного блоку газет, відповідає схемі METS і містить велику частину створених людиною метаданих для кожного випуску.

 

Доповіді

  1. Писаревська Н. В. Колекції Державного політехнічного музею при НТУУ «КПІ»
  2. Баркова О. В. Введення в оцифровку
  3. Кривулькін І. М., Подорожній В. І. Страховий фонд документації: вирішення актуальних проблем довготривалого збереження оцифрованих документів на об’єкти історичного, культурного і наукового надбання
  4. Стіренко С. Г. Цифрові сховища і хмарні рішення для гарантованого збереження оцифрованої спадщини
  5. Баркова О. В. Вибір скануючого обладнання, організація робочого місця сканування
  6. Шумбар Д. Л., Баркова О. В. Система репрезентації та інтеграції оцифрованого контенту і керування цифровими колекціями
  7. Бейрак М. Сучасні рішення у сфері розпізнавання тексту, вилучення даних і прикладної лінгвістики
  8. Бруй О. М. Міжнародні стандарти для створення цифрових бібліотек та архівів
  9. Баркова О. В. Ландшафт стандартів для оцифрованих об’єктів
  10. Піоро В. І. Щодо розробки проекту Порядку обліку музейних предметів в електронній формі
  11. Баркова О. В. Організаційні та технологічні аспекти інтеграції тематичних цифрових колекцій у державні та світові інформаційні системи. Досвід українських Установ Пам’яті з постачання контенту до EUROPEANA

 

Корисні посилання

Інформаційні сервіси та утиліти:

  1. About Greenstone / О Greenstone
  2. Alfresco (software)
  3. Cambridge Imaging Systems
  4. CD Collection
  5. CONTENTdm
  6. Digital Commons
  7. DSpace
  8. EPrints
  9. Fedora Commons
  10. Invenio
  11. Islandora
  12. Nicomsoft OCR
  13. Pleade
  14. SimpleDL
  15. SobekCM
  16. Безкоштовні АБІС
  17. Безкоштовні АБІС – вільне відкрите програмне забезпечення
  18. Сервисы Интернета в работе библиотек

 

Про інформаційні технології у музеях:

  1. Піоро В. І. У Києві презентували проект порядку електронного музейного обліку
  2. Шевцов І. П. Сучасний стан розвитку музейних інформаційних систем
  3. Шевцов І. П. Майбутнє музеїв (інформаційний аспект)

 

Про минулий семінар:

  1. Доповіді з першого науково-практичного семінару «Оцифроване надбання: збереження, доступ, репрезентація»
  2. Підсумки першого науково-практичного семінару «Оцифроване надбання: збереження, доступ, репрезентація»

 

Про міжнародні проекти, та співробітництво з ними:

  1. Välkommen till projekt Digidaily (Ласкаво просимо у проект Digidaily)
  2. История Европы через призму фотошедевров / Цифровая евроинтеграция
  3. Інформаційні ресурси у вільному доступі
  4. Клочок С. Г. Міжнародна щорічна конференція «Promoting innovation in Europe: The European Library partnership of research and national libraries»

 

Про оцифрування і представлення  документів:

  1. A Newsletter on Digital Culture
  2. Бібліотечний світ: дайджест. Вип. 4 / ОУНБ ім. В. Г. Короленка ; Підгот. А. Матюшенко; Відп. за вип. О. Сльозка. – Чернігів. – 2011. – 19 с.
  3. Волохін О. М. Електронні ресурси сучасної регіональної бібліотеки
  4. Доповіді про систему керування електронними колекціями «Digitized Content Visualizator» на порталі спеціалізованого центру БАЛІ
  5. Збереження бібліотечно-інформаційних ресурсів України: нова політика і нові технології / Матеріали Всеукраїнської науково-практичної конференції (Харків, 20–22 листопада 2006 р.)
  6. Інноваційна діяльність у бібліотеках
  7. «Минуле у «цифрі»: місто, історія та цифрові технології»
  8. Оцифрування власного фонду. Досвід НІБ України: оптимізація процесу
  9. Разнообразие книжных сканеров: плюсы и минусы
  10. Рекомендации по оцифровке материалов из фондов библиотек
  11. Тюрменко І. Цифрова історико-культурна спадщина на веб-сайтах архівних установ України та Франції: порівняльний аналіз
  12. Юмашева Ю. Ю. Информационные технологии в архивах и музеях
  13. Ярошенко Т. Бібліотека,бібліотекарі та користувачі бібліотек в епоху ВЕБ 2.0: виклики часу

 

Про стандарти метаданих:

  1. Cataloging Cultural Objects A Guide to Describing Cultural Works and Their Images, Online Edition
  2. ISO 21127:2014 - Information and documentation - A reference ontology for the interchange of cultural heritage information
  3. Ison T. Metadata in the Digitisation Process. Cultural unity and diversity of the Baltic Sea Region – common history, different languages, mixed culture Helsinki, 21st–22nd October 2010
  4. Lee Bronwyn Use of METS and ALTO in the Australian Newspapers Digitisation Program (ANDP) at the National Library of Australia (NLA) / Australian Newspapers Digitisation Program
  5. Metadata for digitized newspapers in Project SAP Specification documents
  6. Zarndt F. The ALTO Editorial Board: Collaboration and Cooperation across Borders
  7. Бруй О. М. Міжнародні бібліотечні стандарти як засіб інтеграції українських бібліотек у глобальне інформаційне середовище
  8. ДСТУ ГОСТ 7.1:2006 «Бібліографічний запис, бібліографічний опис. Загальні вимоги та правила складання» Методичні рекомендації з впровадження
  9. Межгосударственный стандарт Библиографическая запись. Библиографическое описание: Общие требования и правила составления
  10. Резниченко В. А. Концептуальная модель электронной библиотеки / В.А. Резниченко, Г. Ю. Проскудина, К. А. Кудим

 

Про хмарні сервіси:

  1. Гриб’юк О. О. Перспективи впровадження хмарних технологій в освіті
  2. Кабатов Д. А. Что такое облачные сервисы для небольших компаний?
  3. «Облака» в тумане: чем опасны cloud-сервисы
  4. Облачные сервисы
  5. Овчаренко С. Хмарні технології у бібліотеках
  6. Маккендрік Дж. Хмарні сервіси – не такі вже й страшні (переклад статті)
  7. Сабліна М. А. Можливості використання хмарних технологій в освітній та соціальній сферах
  8. Хмарні сервіси стануть ключовими у розвитку Інтернету речей

Інформацію підготувала: Клочок С. Г., м. н. с.

Фотоматеріали: 
Баркова О. В. Введення в оцифровку
науково-практичний семінар «Оцифроване надбання: збереження, доступ, репрезентація»
Бруй О. М. Міжнародні стандарти для створення цифрових бібліотек та архівів
Піоро В. І. Щодо розробки проекту Порядку обліку музейних предметів в електронній формі