27
Проблеми розробки термінологічного забезпечення Проблеми розробки термінологічного забезпечення бібліотечно-інформаційної діяльності бібліотечно-інформаційної діяльності та його гармонізація з міжнародною термінологією та його гармонізація з міжнародною термінологією Технології та якість оцифровки Технології та якість оцифровки бібліотечних фондів і формування цифрових ресурсів бібліотечних фондів і формування цифрових ресурсів Програмно-технологічні рішення Програмно-технологічні рішення для інтеграції бібліотечних електронних ресурсів для інтеграції бібліотечних електронних ресурсів на базі АБІС і веб-засобів на базі АБІС і веб-засобів Міжнародна науково-практична конференція “ Науково-методичні та організаційні засади інформаційно-аналітичного забезпечення педагогічної науки, освіти і практики України: стан і перспективи ” 9–11 листопада 2011 р. ДНПБ України ім. В. О. Сухомлинського

Технології та якість оцифровки бібліотечних фондів і формування цифрових ресурсів

Embed Size (px)

DESCRIPTION

Міжнародна науково-практична конференція “ Науково-методичні та організаційні засади інформаційно-аналітичного забезпечення педагогічної науки, освіти і практики України: стан і перспективи ”. - PowerPoint PPT Presentation

Citation preview

Page 1: Технології та якість оцифровки  бібліотечних фондів і формування цифрових ресурсів

Проблеми розробки термінологічного забезпечення Проблеми розробки термінологічного забезпечення бібліотечно-інформаційної діяльності бібліотечно-інформаційної діяльності

та його гармонізація з міжнародною термінологієюта його гармонізація з міжнародною термінологією

Технології та якість оцифровки Технології та якість оцифровки бібліотечних фондів і формування цифрових ресурсівбібліотечних фондів і формування цифрових ресурсів

Програмно-технологічні рішення Програмно-технологічні рішення для інтеграції бібліотечних електронних ресурсів для інтеграції бібліотечних електронних ресурсів

на базі АБІС і веб-засобівна базі АБІС і веб-засобів

Міжнародна науково-практична конференція“ Науково-методичні та організаційні засади інформаційно-аналітичного забезпечення

педагогічної науки, освіти і практики України: стан і перспективи ”

9–11 листопада 2011 р.ДНПБ України ім. В. О. Сухомлинського

Page 2: Технології та якість оцифровки  бібліотечних фондів і формування цифрових ресурсів

Мета створення ТК-144: визначення пріоритетних напрямків розвитку стандартизації в галузі інформації та документації; розроблення національних стандартів, гармонізованих з міжнародними і європейськими; розроблення національної науково-технічної термінології у сфері інформації, документознавства, бібліотечної та архівної справ.

Сфера діяльності комітету: термінологія інформаційних наук (інформатика, документознавство, видавнича, бібліотечна та архівна справа); інформатика, включаючи документування, бібліотечну та архівну справу; організаційно-розпорядча документація; використання інформаційних технологій в інформаційній діяльності, документуванні і видавничій справі

Page 3: Технології та якість оцифровки  бібліотечних фондів і формування цифрових ресурсів

Серед колективних членів ТК-144:

Український інститут науково-технічної і економічної інформації Книжкова палата України імені Івана Федорова Інститут кібернетики імені академіка Глушкова НАНУ Український державний науково-дослідний інститут архівної справи та документознавства Державна науково-технічна бібліотека України Державна науково-технічна бібліотека України Національна бібліотека України імені В.І. Вернадського Національна парламентська бібліотека України

За період діяльності ТК 144 розроблено 25 проектів національних стандартів, з них:

• термінологічних національних – 8; • термінологічних, гармонізованих з ISO – 8.

Page 4: Технології та якість оцифровки  бібліотечних фондів і формування цифрових ресурсів

Національні ДСТУДСТУ 4419: 2005 Інформація і документація. Документи аудіовізуальні.

Терміни та визначення понять. ДСТУ 5034:2008 Інформація і документація. Науково-інформаційна

діяльність. Терміни та визначення понять. ДК 022:2008 [Державний класифікатор]

Рубрикатор науково-технічної інформації ДСТУ 888.2.1-2009 (у стані

затвердження) Інформація і документація. Бібліотечно-

інформаційна діяльність. Терміни та визначення понять.

ДСТУ ____ (у розробці) Інформація і документація. Бібліографічна

діяльність. Терміни та визначення понять.

 Гармонізовані ДСТУ ISO

ДСТУ ISO 8459-5:2005 Інформація і документація. Довідник бібліографічних елементів даних. (Частини 1 – 5)

ДСТУ ISO 5127:2010 Інформація і документація. Довідник термінів.

 

Термінологічні стандарти

Page 5: Технології та якість оцифровки  бібліотечних фондів і формування цифрових ресурсів

- електронна бібліотека, - електронний документ,- електронний бібліотечний фонд - електронні ресурси,

- електронний каталог, - електронний читальний зал ,- електронна картотека, - віртуальний читальний зал,

- електронне доставляння документів, - електронна пошта, - віртуальна довідка, - веб-сайт бібліотеки,

- веб-портал бібліотеки

БІБЛІОГРАФІЧНА ДІЯЛЬНІСТЬ

- комунікативний формат бібліографічного запису,- віртуальна бібліографічна довідка,- віртуальна довідкова служба

ДСТУ 888.2.1-2009

Терміни та визначення понятьБІБЛІОТЕЧНО-ІНФОРМАЦІЙНА ДІЯЛЬНІСТЬ

ДСТУ ____-200_

Page 6: Технології та якість оцифровки  бібліотечних фондів і формування цифрових ресурсів

г. Королев, Московская область, г. Королев, Московская область, 19-20 апреля 2011 года 19-20 апреля 2011 года

Международная научно – практическая конференция

«Оценка и контроль качества сканирования бумажных документов»«Оценка и контроль качества сканирования бумажных документов»

Общая позиция участников сводилась к следующему:- бесконтрольное сканирование и отсутствие знаний о том, как работает сканирующая техника, у работников учреждений культуры, приводят к тому, что памятникам истории и культуры наносится вред;- формирование единого электронного архива позволит избежать ненужного сканирования уже обработанных в разных учреждениях книг и других предметов; - существование общих для всей отрасли норм и правил сканирования позволит исключить некачественную работу, наносящую вред сканируемым объектам и оттягивающую средства из бюджетов учреждений…

Проблемный семинар Проблемный семинар «Нормативно-технические и технологические «Нормативно-технические и технологические

аспекты создания электронных копий документов»аспекты создания электронных копий документов»

Мероприятия организованы при поддержке Компании «ДиМи-Центр», Москваwww.dimi.ruwww.dimi.ru

Page 7: Технології та якість оцифровки  бібліотечних фондів і формування цифрових ресурсів

СТАНДАРТЫ ЦИФРОВЫХ КОЛЛЕКЦИЙСТАНДАРТЫ ЦИФРОВЫХ КОЛЛЕКЦИЙ

ПроблемыПроблемы нормативнойнормативной базыбазы длядля технологийтехнологий оцифровкиоцифровки

ТЗ на оцифровку редких книг - параметры оцифровки; - требования к изображениям оригинала (постраничные, разворотами, корешок книги, форзац, общий вид) - формат представления оцифрованного объекта; - параметры изображения оцифрованного объекта; - технологические нюансы, начиная с имени файла, заканчивая содержанием идентификатора цифрового объекта; - требования к обработке изображений, сжатию; - требования к качеству, целостности объекта; - требования к контролю качества цифрового объекта; - требования к разным формам презентации объекта (визуальное, символьное представление текстового контента, ...); - требования к структуре файлового хранилища …

Page 8: Технології та якість оцифровки  бібліотечних фондів і формування цифрових ресурсів
Page 9: Технології та якість оцифровки  бібліотечних фондів і формування цифрових ресурсів
Page 10: Технології та якість оцифровки  бібліотечних фондів і формування цифрових ресурсів

Чтобы покинуть галактику Гуттенберга, благодаря частному и государственному финансированию были осуществлены крупномасштабные проекты по оцифровке. Йорн Зиглершмидт

• 1971 год – Проект «Гутенберг» (Project Gutenberg )

• 1994 год – библиотеки Максима Мошкова, первая электронная библиотека в Рунете.

• 1990 год – библиотекой конгресса США начат проект «Память Америки». В рамках проекта предоставляется свободный и бесплатный доступ к электронным материалам по истории США.

• 2002 год – Google начинает собственный проект по оцифровке книг.

• 2004 год – начало работы библиотечного проекта «Google Print», который в 2005 году был переименован в «Поиск книг Google» (Google books).

• 20 ноября 2008 года – начала функционировать общеевропейская цифровая библиотека Europeana.

• 21 апреля 2009 года – официальное открытие Всемирной цифровой библиотеки.

• 27 мая 2009 года в Санкт-Петербурге открыта Президентская библиотека имени Бориса Ельцина.

• 2010 год 2010 год – начало крупномасштабного проекта IMPACT по улучшению доступа к историческим текстам (Европейская цифровая библиотека)

Page 11: Технології та якість оцифровки  бібліотечних фондів і формування цифрових ресурсів

www.impact-project.eu/about-the-project/concept

IMPACTIMPACT проект ЕС оцифровки европейского культурного наследия, призван значительно улучшить доступ к историческим текстам.

Цель проекта IMPACT – преобразовать в цифровые ресурсы широкий спектр материалов европейского печатного наследия, опубликованных в период с начала эры Гуттенберга в 15 веке и до начала промышленного производства книг в середине 19 века.

Полная интеграция интеллектуального содержания в современной информационной среде и коммуникационных технологиях может быть достигнута только путем полнотекстовой оцифровки: преобразование цифрового изображения отсканированных книг в электронный текст.

За последние 2-3 года массовая оцифровка печатного контента стала одной из самых важных задач в библиотечном мире.

Проект призван продвигать инновации в технологиях оптического распознавания (OCR) и языковые технологии для обработки исторической документов и поиска.

Page 12: Технології та якість оцифровки  бібліотечних фондів і формування цифрових ресурсів

Оцифровка исторических документов поможет вывести исследования на качественно новый уровень. Ведь возможность получать доступ к информации на цифровых, а не физических, носителях дает огромные преимущества. Однако и это – лишь первый шаг к тому, чтобы сделать эти документы доступными.

Чтобы информацию можно было найти, просмотреть, сравнить и проанализировать, необходимы системы оптического распознавания (OCR), индексация, анализ текста и сложные браузерные приложения.

Проект стимулирует улучшение и развитие этих технологий и, в результате, помогает расширить границы исследований: дать инструменты, благодаря которым печатное наследие Европы можно перевести с физических носителей в «цифру».

Ричард Болдерстоун, директор по электронным стратегиям

и информационным системам Британской библиотеки

Page 13: Технології та якість оцифровки  бібліотечних фондів і формування цифрових ресурсів

ПараметрыПараметры оцифровкиоцифровки текстовыхтекстовых документовдокументов

В начале любой работы очень важно ответить на вопрос:- Для чего мы это делаем?

Практика оцифровки показывает, что такое очевидное соображение не всегда учитывается и, как следствие, происходит потеря времени и денег. Работу приходится переделывать.

В действительности возможных конечных целей оцифровки немного: 1. Размещение цифровых копий в интернете для ознакомительных целей.2. Репринтное переиздание.3. Изготовление факсимильных копий.4. Формирование страховых электронных фондов в виде базы графических файлов.5. Микрофильмирование результатов оцифровки.6. Создание электронных библиотек с полнотекстовым поиском7. Изготовление копий книг на долгоживущих физических носителях.

Page 14: Технології та якість оцифровки  бібліотечних фондів і формування цифрових ресурсів

В результате теоретических и экспериментальных исследований были разработаны стандартные требования, необходимые и достаточные для всех видов работы с изображениями текстов. Они оказались очень простыми, немногочисленными и пригодными для всех видов письменности: алфавитной, иероглифической и пиктографической; текст может быть как печатным, так и рукописным. • ширина самой тонкой линии в тексте равна от 3 до 5 пикселей.• формат графических файлов: только TIF без сжатия по LZW.• глубина пикселя: 1, 8, 16, 24 или 48 бит.

Реальным параметром, определяющим качество сканирования текста, является количество пикселей, которым отображается самая тонкая линия в документе.

В общем случае текст включает в себя графические элементы: схемы, чертежи, разметку таблиц, структурные формулы, рукописный текст и т. д., поэтому самая тонкая линия не обязательно является элементом литеры.

ПараметрыПараметры оцифровкиоцифровки текстовыхтекстовых документовдокументов

Page 15: Технології та якість оцифровки  бібліотечних фондів і формування цифрових ресурсів

РазрядностьРазрядность пикселяпикселя

1 бит/пиксель - только для контрастных чёрно-белых изображений.

ПараметрыПараметры оцифровкиоцифровки текстовыхтекстовых документовдокументов

Page 16: Технології та якість оцифровки  бібліотечних фондів і формування цифрових ресурсів

8 битов/пиксель 8 битов/пиксель - этот режим позволяет передать 256 градаций серого изображения.

16 битов/пиксель 16 битов/пиксель - передаются 65536 градаций серого изображения.

РазрядностьРазрядность пикселяпикселя

ПараметрыПараметры оцифровкиоцифровки текстовыхтекстовых документовдокументов

Page 17: Технології та якість оцифровки  бібліотечних фондів і формування цифрових ресурсів

48 битов/пиксель 48 битов/пиксель - (по 16 битов на каждую базовую цветовую составляющую).

24 бита/пиксель 24 бита/пиксель - (по 8 битов на каждую базовую цветовую составляющую).

РазрядностьРазрядность пикселяпикселя

ПараметрыПараметры оцифровкиоцифровки текстовыхтекстовых документовдокументов

Page 18: Технології та якість оцифровки  бібліотечних фондів і формування цифрових ресурсів

Пример экспериментальной очистки цветного изображения текста в автоматическом режиме.

Того, кто не задумывается о далеких трудностях, непременно поджидают

близкие неприятности.Конфуций

Page 19: Технології та якість оцифровки  бібліотечних фондів і формування цифрових ресурсів

Информационная система T-Libra для создания Информационная система T-Libra для создания многофункциональных электронных библиотекмногофункциональных электронных библиотек с многоаспектным тематическим полнотекстовым поиском, возможностями мультимодального расширения и конвертации

метаданных из электронных каталогов (АИБС). http://demo.tlibra.ru

INFIRMATIO-2010

ООО "Константа"ООО "Константа" (г. Архангельск, Россия):разработка информационных систем в области культуры, науки, образования и здравоохранения.

www.softconst.ru

СЦ БАЛИ - официальный представитель в Украине:СЦ БАЛИ - официальный представитель в Украине:

4-8.10.2011

ЗАО ЗАО ""Альт-СофтАльт-Софт"" (г. Санкт-Петербург, Россия):информационные и коммуникационные технологии в области - информатизации культуры; архивов; городского хозяйства; - объединения информационных ресурсов учреждений культуры в едином поисковом пространстве   www.altsoft.spb.ru

Программно-информационные комплексыПрограммно-информационные комплексы:: КАИСА-Архив КАИСА-Наследие КАИСА-Энциклопедия КАИСА- Краеведение Единая точка поиска - объединяет информационные ресурсы различных типов

Page 20: Технології та якість оцифровки  бібліотечних фондів і формування цифрових ресурсів

Система рассчитана на использование в электронных библиотеках и коллекциях. Может быть использована как инструментарий для полнотекстового просмотра внешних документов в библиографических системах (электронных каталогах, репозиториях, веблиографических ресурсах), а также может быть интегрирована в полнотекстовые информационно-поисковые системы и базы данных.

Используется со всеми актуальными на сегодня браузерами.INFIRMATIO-2010

Состоит из модулеймодулей: • администрирования, администрирования, • веб-представлениявеб-представления коллекций, коллекций, • визуализации цифровых изображений. визуализации цифровых изображений.

Предназначена для формирования электронных коллекций и работы с для формирования электронных коллекций и работы с оцифрованными документами, цифровыми изображениями и текстовыми оцифрованными документами, цифровыми изображениями и текстовыми материалами в сетевом режиме и предоставления пользователю материалами в сетевом режиме и предоставления пользователю разнообразных сервисов по цифровому контентуразнообразных сервисов по цифровому контенту

4-8.10.2011

Система управления электронными Система управления электронными

коллекциями коллекциями DС-DС-VVisuisu

Интегрируется с АБИС на уровне заимствования библиографических данных в действующих стандартах и форматах.

Page 21: Технології та якість оцифровки  бібліотечних фондів і формування цифрових ресурсів

Основные функцииОсновные функции - формирование электронных коллекций, виртуальных книжных экспозиций и выставок всех видов издательской продукции в разных файловых форматах;- интеграция электронных аналогов оцифрованного документа в различных файловых форматах в одном ресурсе и сервисы по контенту в едином интерфейсе; - навигация и поиск в электронном фонде, коллекциях и документах с использованием системы указателей и фильтров;- автоматическое формирование библиографических цитат на документ и его части.

Перспективы новых версий: Перспективы новых версий: - программно-технологическая интеграция с АБИС;- поиск по полному тексту;- маркировка поисковых терминов и навигация в тексте графического изображения документа;- распознавание текстов “на лету”, создание заметок;- аутентификация пользователей и управление доступом;- персонализация работы пользователя (личный кабинет);- развитие сервисов по контенту;- система статистики;- программно-технологическая интеграция с полнотекстовыми информационно-поисковыми системами;- интеграция цифровых коллекций на базе DC-Visu в единой поисковой среде. INFIRMATIO-2010

Система управления электронными Система управления электронными

коллекциями коллекциями DС-DС-VVisuisu

4-8.10.2011

Page 22: Технології та якість оцифровки  бібліотечних фондів і формування цифрових ресурсів

Пилотный проект Интегрированного мультимедийного Интегрированного мультимедийного энциклопедического Интернет-ресурса университета энциклопедического Интернет-ресурса университета

реализуется совместно с ЗАО "Альт-Софт ", Музеем истории и Центром информационных компьютерных технологий Донецкого Национального Технического Университета

Проект создания электронной коллекции Проект создания электронной коллекции оцифрованных редких и ценных изданий оцифрованных редких и ценных изданий из фонда Научной библиотекииз фонда Научной библиотекиНационального педагогического университета имени М.П. Драгоманова

INFIRMATIO-2010

СЦ БАЛИ : проектыСЦ БАЛИ : проекты c c университетами Украины университетами Украины

4-8.10.2011

DС-DС-VVisu isu ((v1.0v1.0))

Page 23: Технології та якість оцифровки  бібліотечних фондів і формування цифрових ресурсів

Электронные информационные ресурсы Электронные информационные ресурсы на веб-сайтах библиотекна веб-сайтах библиотек

• Коллекции полнотекстовых изданий• Коллекции оцифрованных материалов• Краеведческие ресурсы • Календари памятных дат• Летописи истории организаций и событий• Музеи истории организаций• Виртуальные книжные выставки• Онлайновые публикации• Новости, анонсы, афиши, репортажи• Библиографические и веблиографические ресурсы

Page 24: Технології та якість оцифровки  бібліотечних фондів і формування цифрових ресурсів

INFIRMATIO-20104-8.10.2011

Технологический комплекс для создания интегрированных Технологический комплекс для создания интегрированных мультимедийных энциклопедических Интернет-ресурсов мультимедийных энциклопедических Интернет-ресурсов на основе технологии электронного энциклопедического справочника на основе технологии электронного энциклопедического справочника

Обеспечивает формирование универсального, общедоступного научно-популярного электронного энциклопедического справочника, содержащего фактографическую информацию об организации (университете, библиотеки и др.) или региона по разработанной и успешно себя зарекомендовавшей технологии формирования электронных энциклопедий.

В состав Интернет-ресурса могут быть включены материалы в разнообразных текстовых, аудио- и видео- форматах.

Электронный энциклопедический справочник: • снабжен системой указателей, является инструментом интеграции и объединяет в единой информационно-поисковой системе электронные информационные ресурсы, собранные в информационных системах и хранилищах организации; • является также информационной средой и инструментом создания новых тематических электронных ресурсов и полиграфических изданий, в том числе тематических энциклопедий, в печатной форме и на компакт-дисках.

Page 25: Технології та якість оцифровки  бібліотечних фондів і формування цифрових ресурсів

http://all.kaisa.ru/

Page 26: Технології та якість оцифровки  бібліотечних фондів і формування цифрових ресурсів

Пилотный проект Интегрированного мультимедийного Интегрированного мультимедийного энциклопедического Интернет-ресурса университета энциклопедического Интернет-ресурса университета

реализуется совместно с ЗАО "Альт-Софт ", Музеем истории и Центром информационных компьютерных технологий Донецкого Национального Технического Университета

Проект создания электронной коллекции Проект создания электронной коллекции оцифрованных редких и ценных изданий оцифрованных редких и ценных изданий из фонда Научной библиотекииз фонда Научной библиотекиНационального педагогического университета имени М.П. Драгоманова

INFIRMATIO-2010

СЦ БАЛИ : проектыСЦ БАЛИ : проекты c c университетами Украины университетами Украины

4-8.10.2011

DС-DС-VVisu isu ((v1.0v1.0))

Page 27: Технології та якість оцифровки  бібліотечних фондів і формування цифрових ресурсів

Міжнародна науково-практична конференція“ Науково-методичні та організаційні засади інформаційно-аналітичного забезпечення

педагогічної науки, освіти і практики України: стан і перспективи ”

9–11 листопада 2011 р.ДНПБ України ім. В. О. Сухомлинського

Дякуємо за увагу!Дякуємо за увагу!