Upload
others
View
28
Download
0
Embed Size (px)
Citation preview
© Copyright 2015 ABBYY
ПЕРСПЕКТИВЫ ABBYY COMPRENO НА РОССИЙСКОМ РЫНКЕ: БИЗНЕС-СЦЕНАРИИ, ПРЕИМУЩЕСТВА, ЭФФЕКТИВНОСТЬ РЕШЕНИЙ
Максим Михайлов,Cтарший вице-президент компании ABBYY
2
ABBYY — разработчик решений для
интеллектуальной обработки информации
Стратегия ABBYY – разработка лидирующих технологий искусственного интеллекта для задач бизнеса.
Технологии компании используются при разработке решений ABBYY, также их лицензируют ведущие мировые компании ИТ-рынка.
Компетенции и технологии
3
Стратегия ABBYY – разработка лидирующих технологий искусственного интеллекта для задач бизнеса.
Технологии компании используются при разработке решений ABBYY, также их лицензируют ведущие мировые компании ИТ-рынка.
Компетенции и технологии
4
Рост цифровой информации в мире*
5
Неструктурированные данные
Структурированные данные
*По данным исследовательской компании IDC.
Экс
абай
ты
ABBYY COMPRENO
6
уникальная технология понимания и анализа текстов на естественном языке
Технология ABBYY Compreno
7
ABBYY CONFIDENTIAL8
Уникальные возможности Compreno
Определение смысла многозначных слов (разрешение омонимии)
ABBYY CONFIDENTIAL9
Уникальные возможности Compreno
Восстановление пропущенных слов (разрешение эллипсиса)
Выручка X5 во втором квартале выросла до 155,1 млрд руб, а в первом полугодии – до 299,1 млрд руб.
ABBYY CONFIDENTIAL10
Уникальные возможности Compreno
Определение связи между объектом, выраженным существительным, и заменяющим его местоимением (определение анафорических связей)
Ключевые сферы применения технологий ABBYY Compreno
11
Извлечение данных из неструктурированных документов
Интеллектуальный поиск в информационной системе
Классификация потока документов
• Оптимизация ввода документов в СЭД и другие системы
• Поддержка принятия решений за счет сбора и анализа значимых фактов и событий
• Снижение проектных рисков путём анализа документации
• Поиск по смыслу, а не по ключевым словам - для полного сбора данных
• Быстрый доступ к документу за счет поиска по его атрибутам
• Оптимизация процесса обработки входящей документации
• Поиск по категориям
ABBYY InfoExtractor SDK
12
и многие другие факты
Сценарии применения
13
Раcпределение платежей по статьям выплат
Сбор информации для формирования
аналитических отчетов
Обработка проектно-сметной документации
Извлечение необходимых данных из неструктурированных полей платежных документов.
Сверка информацию об объектах строительства из системы САПР и проектной документации и выявление расхождений в документации.
Извлечение значимой информации из отчетов, приказов и других корпоративных документов для создания аналитических отчетов.
Преимущества ABBYY InfoExtractor SDK
Для коммерческих компаний и гос. организаций:
14
Сокращение расходов на ресурсоемкие бизнес-процессы и увеличение их эффективности
Принятие решений быстро и обоснованно
Выявление и снижение рисков
Решение самых актуальных и сложных задач заказчиков
Получение квалифицированной поддержки
на русском языке
Для разработчиков и интеграторов:
Ключевые сферы применения технологий ABBYY Compreno
15
Извлечение данных из неструктурированных документов
Интеллектуальный поиск в информационной системе
Классификация потока документов
• Оптимизация ввода документов в СЭД и другие системы
• Поддержка принятия решений за счет сбора и анализа значимых фактов и событий
• Снижение проектных рисков путём анализа документации
• Поиск по смыслу, а не по ключевым словам - для полного сбора данных
• Быстрый доступ к документу за счет поиска по его атрибутам
• Оптимизация процесса обработки входящей документации
• Поиск по категориям
ABBYY Intelligent Search SDK
16
Сужение поиска по значению слова
Расширение поиска по смыслу Интеллектуальное ранжирование
Программа
Программавещания
План действий
Программное обеспечение
Подкасты
ТВ программа
Радио программа
Выбор конкретных значений для многозначных слов в поисковом запросе.
Поиск не только конкретных слов, но и их смысловых синонимов.
Анализ значений слов, связей между словами и контекста для представления наиболее релевантных результатов.
Сценарии использования
17
Поддержка принятия решений
Получение наиболее полной информации по выбранной области знаний из библиотек и баз знаний.
Научные исследования
Решения для корпоративного поиска компании ABBYYпозволяет сотрудникам быстро находить релевантную информацию и увеличить скорость принятия решений.
Преимущества ABBYY Intelligent Search SDK
Для коммерческих компаний и гос. организаций:
Экономия времени сотрудников, затрачиваемого на поиск информации
Возможность находить максимально полные данные при минимальных затратах сил и времени
Повышение качества информационных систем посредством интеграции с ABBYY Intelligent Search SDK , которое обеспечивает непревзойденное качество поиска.
18
Для разработчиков и интеграторов:
Ключевые сферы применения технологий ABBYY Compreno
19
Извлечение данных из неструктурированных документов
Интеллектуальный поиск в информационной системе
Классификация потока документов
• Оптимизация ввода документов в СЭД и другие системы
• Поддержка принятия решений за счет сбора и анализа значимых фактов и событий
• Снижение проектных рисков путём анализа документации
• Поиск по смыслу, а не по ключевым словам - для полного сбора данных
• Быстрый доступ к документу за счет поиска по его атрибутам
• Оптимизация процесса обработки входящей документации
• Поиск по категориям
ABBYY Smart Classifier SDK
20
Использование семантической технологии позволяет
повысить точность классификации документов вне зависимости от особенностей естественного языка: многозначности слов, замены слов местоимениями, предложений со сложными оборотами и других.
Качественная поддержка 42 языков
ABBYY Smart Classifier SDK качественно работает с информацией на русском языке благодаря точной семантической классификации, а также оснащен мощным морфологическим модулем, доступным для всех основных европейских и азиатских языков, что позволяет анализировать весь информационный поток в организации.
Семантическая классификация
Преимущества ABBYY Smart Classifier SDK
21
Минимизация рисков утечки или потери информации
Сокращение затрат на хранение документов
Быстрая настройка решения
Для коммерческих компаний и гос. организаций:
Расширение возможностей информационной системы
Для разработчиков и интеграторов:
Экономия времени сотрудников, затрачиваемого на поиск информации
ABBYY Compreno — уникальная технология,
которая позволяет получить значимую для бизнеса
информацию из массивов данных, повышаяконкурентоспособность и эффективность организации.
22
Информация — в деле.
23
СПАСИБО!
24
Интеллектуальная обработка данных и новые
возможности СЭД.
Сергей Полтев.
Руководитель направления современных ECM-решений
Объём данных растет. Время поиска – растет.
50% рабочего
времени
4 часа/день
120 дней/год
20 лет
СЭД/ECM-решения предоставляют набор инструментов, но их уже
недостаточно.
Интеллектуальная обработка. Возможности.
• Поиск на естественном языке
• Извлечение фактов из
неструктурированного текста
• Классификация текстов
• Автоматическая обработка
произвольных материалов из
внешних источников (Интернет,
публикации прессе, и т.п.)
Технологии ABBYY
ABBYY Compreno + СЭД/ЕСM
ДЕЛО
EOS for SharePoint
eDocLib
• ABBYY Intelligent Search
• ABBYY InfoExtractor
• ABBYY Smart Classifier
Примеры использования
Пример 1. Автоматическая обработка корреспонденции.
EOS for SharePoint +ABBYY Smart Classifier
Автоматическая обработка корреспонденции
Здесь или на след.
• << Здесь или на след. слайде скриншот
Автоматическая классификация и регистрация документов
Итоги:
• Оценка содержимого – тональность, упоминаемые
факты и персоны
• Исходя из оценки – отправка по одному из
предопределенных маршрутов
• Результат: оперативный и своевременный ответ
Пример 1а. Обработка обращений граждан
CЭД «ДЕЛО» +ABBYY Smart Classifier+ABBYY Similar Documents Search.
Обработка обращений
200 обращений
199 обращений по
одному вопросу
Обращение,
отличное по
содержанию
Пример 2.База знаний по продукции.
eDocLib+ABBYY InfoExtractor
Автоматическая актуализация базы знаний
Производитель
Наименование
Аналоги
Характеристики
• Мониторинг российских и зарубежных производителей
• Автоматическая обработка и рубрикация
• Предоставление полной информации по аналогам изделий, производимых предприятием, нормативным документам, и т.п.
• Результат: поддержание базы знаний в актуальном состоянии
МОНИТОРИНГ Автоматическая
обработка данных
Производитель
Наименование
Аналоги
Характеристики
Производитель
Наименование
Аналоги
Характеристики
РУБРИКАЦИЯ
Поиск по базе знаний
Результаты
• Мониторинг российских и зарубежных производителей
• Автоматическая обработка и рубрикация
• Предоставление полной информации по аналогам изделий,
производимых предприятием, нормативным документам, и т.п.
• Итог: поддержание базы знаний в актуальном состоянии
Новые возможности для СЭД/ECM
• Извлечение данных
• Автоматическое «структурирование»
информации
• Рубрикация, установка связи между
объектами
• Сценарии автоматической обработки вновь
поступающих материалов в зависимости от
содержания
• Поисковые запросы на естественном языке
Выводы
• Растущие объемы и документопотоки требуют все больших
трудозатрат при традиционной обработке
• Технологии обработки текстов ABBYY могут качественно
изменить ( и уже меняют) процессы обработки документов и
работы с информацией
• Начать работу с перспективными технологиями можно УЖЕ
СЕГОДНЯ.
Спасибо за внимание!
https://www.facebook.com/EOSblog www.eos.ru
Комплексный подход к повышению качества
проектной документации при создании сложных технических объектов
Москва, 2015
Сложные технические объекты (например, АЭС) описываются
различными способами, в частности:
информационная модель объекта, спроектированная в инженерной
системе в виде чертежей, схем, 3D объектов, планов и т.д.;
проектная документация, содержащая описание объекта и его частей
на естественном языке;
Инженерная информационная модель формальна – точно и
(чаще) согласованно описывает параметры и связи между
частями объекта;
Документация на естественном языке может содержать
фактические ошибки и несоответствия относительно
информационной модели: неверные взаимосвязи, иерархии,
ошибки в числовых значениях, именах, кодах, единицах
измерения, пропущенные описания частей объекта.
Предпосылки - Факты
272814 файлов в 23982 папках составляют
вместе проектную документацию одного
российского проекта АЭС, 522 Гб (измерено
по файловому хранилищу проекта Курской
АЭС-2)
менее 50 специалистов производят контроль
качества проектных решений, их
согласованности в разных документах – т.е.
СОДЕРЖИМОГО указанных выше файлов
Потребность в автоматизации - Цифры
обеспечение внутренней консистентности
характеристик организационных структур, систем
и компонентов АЭС, зафиксированных в
проектной документации
обеспечение соответствия характеристик
организационных структур, систем и компонентов
АЭС, зафиксированных в проектной
документации и информационной модели;
обеспечение корректности ссылок на
нормативно-техническую документацию внутри
проектной документации.
Предпосылки - Задача
Сформировать онтологию, описывающую понятийный аппарат
предметной области (на основе уже состоявшейся онтологии,
используемой в информационных моделях АЭС и САПР,
применяемых для их разработки)
Провести разбор текстов технической документации с
использованием сформированной онтологии и обеспечить
идентификацию и последующее документирование характеристик
организационных структур, систем и компонентов АЭС
Идентифицировать возможные внутренние противоречия
внутри массива идентифицированных характеристик
Сопоставить характеристики, извлечённые из технической
документации, с соответствующими характеристиками
информационной модели проекта АЭС.
Суть комплексного подхода
Создание онтологии ABBYY Compreno, описывающей
понятийный аппарат требуемой предметной области: иерархию
терминов и понятий, синонимичные конструкции, смысловые
связи, типичные характеристики, диапазоны значений на основе
имеющихся UML описаний и экспертных знаний. Онтология также
включает в себя морфологию и правила естественного языка -
падежи, синтаксис и т.д.;
Применение инструментального средства работы с онтологией
ABBYY InfoExtractor к преобразованной документации на
естественном языке с целью разбора текста и выделения
значений и фактов, описывающих объект и его части;
Выгрузка формализованного описания объекта из инженерной
системы в виде таблиц и отчётов;
Сравнение результата разбора с результатом выгрузки, подготовка
отчётов.
Шаги для реализациикомплексного подхода
Детали реализации ABBYY InfoExtractor
Детали реализации ABBYY InfoExtractor
Пример отчёта
Существенное расширение возможностей контроля качества и
непротиворечивости технической документации;
Сокращение времени и трудозатрат на поиск ошибок и
неточностей в технической документации;
Выявление с помощью статистики системных проблем и ошибок в
подходах к подготовке документации;
Возможность использования характеристик из информационной
модели АЭС в качестве источника информации на последующих
стадиях жизненного цикла АЭС – с гарантией соответствия
описаниям из технической документации
Решение проблемы актуальности ссылок на нормативно-
техническую документацию на всём протяжении хранения
технической документации
Ценность внедрения
НАЗВАНИЕ
ПРЕЗЕНТАЦИИWWW.PRIEMNAYA.PARLIAMENT.GOV.RU
Тема: Электронная Приемная Государственной Думы: новые коммуникационные тренды и интеллектуальные технологии
Очертянова Екатерина Александровна, менеджер проекта «Приемная Государственной Думы»
PARLIAMENT.GOV.RU
ЭЛЕКТРОННЫЙ ПАРЛАМЕНТ: О ПРОЕКТЕ 2
ЦЕЛИ ПРОЕКТА Основная цель проекта «Электронный парламент» — обеспечить открытость законодательного процесса для граждан, создать новые инструменты, позволяющие гражданам комплексно оценивать деятельность законодательной власти, обеспечить тесное взаимодействие депутатов с избирателями.
ЗАДАЧИ ПРОЕКТА В рамках проекта «Электронный парламент» предусмотрено решение следующих задач:
Для депутатов и Аппарата ГД Для граждан
Сделать работу депутатов максимально мобильной; Создать доступ к документам и материалам, необходимым
для законотворческой деятельности, в любом месте, где есть интернет;
Предоставить возможность постоянного оперативного взаимодействия с коллегами и экспертами;
Снизить затраты на содержание органов законодательной власти;
Предоставить возможность оперативной связи с избирателями.
Создать возможность ознакомиться с реальной позицией депутатов;
Дать возможность осуществлять мониторинг рассмотрения законопроектов на всех стадиях обсуждения;
Предоставить инструменты для осуществления контроля за деятельностью депутатов;
Предоставить доступ к трансляциям и видеоархиву заседаний Государственной Думы;
Создать инструменты, позволяющие гражданину направлять в электронном виде обращения в Государственную Думу, а также получать информацию о ходе и результатах их рассмотрения.
WWW.PRIEMNAYA.PARLIAMENT.GOV.RU
ПРИЕМНАЯ ГОСУДАРСТВЕННОЙ ДУМЫ 3
Портал «Приемная Государственной Думы» предоставляет гражданам возможность контролироватьпрохождение и рассмотрение их обращений, позволяет сократить трудозатраты на обработку обращенийграждан и организаций в Приемной Государственной Думы за счет автоматизации приема обращений, атакже обеспечивает упрощение записи гражданина на прием во фракцию, к депутату Государственной Думы,дополнительно предоставляя депутатам Государственной Думы возможность проводить прием в режимевидеоконференцсвязи.
WWW.PRIEMNAYA.PARLIAMENT.GOV.RU
Коммуникационные тренды и интеллектуальные технологии 4
ГРАЖДАНАМАвторизованный гражданин пошагово формирует свое обращение на портале в ОК (открытый контур): шаг 1 – ввод текста обращения; шаг 2 – анализ текста обращения при помощи модуля анализа обращений (ABBYY Compreno), подбор тематики и подсказка адресата;шаг 3 – отправка обращения в СЭД ГД.
СОТРУДНИКАМ ПРИЕМНОЙСотрудник Госдумы регистрирует полученное обращение в ВК (внутренний контур):шаг 1 – открывает карточку обращения – там уже заполнены все поля. Включая тематику и адресата (экономия времени на обдумывание);шаг 2 – сотрудник регистрирует обращение в СЭД Госдумы и пересылает его адресату внутри ГД.
Просмотр всех обращений за период времени для экспресс-анализа ситуации:шаг 1 – сотрудник ГД открывает Личный кабинет в ВК;шаг 2 – на вкладке «Работа с обращениями» выведен поток обращений после разбора модулем анализа обращений, который можно фильтровать по региону, тематике, эмоциональной окраске;шаг 3 - во вкладке «Массовые обращения» сотрудник приемной может посмотреть группы массовых обращений (ABBYY Smart Classifier SDK), дать на них ответ и отправить заявителю по эл. почте и сформировать реестр на почтовую отправку.
ДЕПУТАТАМ ГОСУДАРСТВЕННОЙ ДУМЫПроведение видеоприемовЭлектронная запись на прием
ГРАЖДАНАМ 5
ИНТЕРНЕТ-ПОРТАЛ подача обращений в электронном виде: помощь при формировании и выборе адресата, 3 шага; запись на прием во фракцию Государственной Думы, к депутатам Государственной Думы: новая возможность
WWW.PRIEMNAYA.PARLIAMENT.GOV.RU
Работа модуля анализа текста
ГРАЖДАНАМ 6
ЛИЧНЫЙ КАБИНЕТ отслеживание гражданином статуса рассмотрения обращения; прием гражданина депутатом Государственной Думы с использованием видеоконференцсвязи.
WWW.PRIEMNAYA.PARLIAMENT.GOV.RU
Личный кабинет гражданина
История обращений
Записи на прием
СОТРУДНИКАМ ПРИЕМНОЙ ГОСУДАРСТВЕННОЙ ДУМЫ 7
ВОЗМОЖНОСТИ Автоматизированное рубрицирование и регистрация обращений в САДД ГД, поданных с помощью Системы; ведение базы шаблонов ответов на массовые обращения; просмотр календаря приемов во всех фракциях ГД; автоматизированное размещение статистической информации о работе с обращениями граждан в Государственной Думе и
проведенных приемов граждан в Приемной Государственной Думы.
WWW.PRIEMNAYA.PARLIAMENT.GOV.RU
Эмоциональная окраска обращений
Работа модуля анализа текста
ДЕПУТАТАМ ГОСУДАРСТВЕННОЙ ДУМЫ 8
ВОЗМОЖНОСТИ ведение календаря приема во фракции и в региональной приемной депутата с выбором формы проведения
приема, ведение статистики; размещение информации о результатах приемов граждан РФ в системе документооборота САДД ГД; проведение приема с помощью видеоконференцсвязи с гражданами.
WWW.PRIEMNAYA.PARLIAMENT.GOV.RU
Календарь приема
Депутатский день во фракции: 12 мест всего, 0 записалось предварительно
Запись результатов приема с отправкой в САДД ГД
Список приемов
ПРИЕМНАЯ ГОСУДАРСТВЕННОЙ ДУМЫ 9
РАЗВИТИЕ МОДУЛЯ АНАЛИЗА ОБРАЩЕНИЙ
деперсонализация ответов гражданам и вывод базы ответов, чтобы не писали повторных аналогичных обращений;
аннотирование обращений для ускорения работы сотрудников Приемной при регистрации обращений;
анализ рекламы в обращениях и комментариях граждан.
WWW.PRIEMNAYA.PARLIAMENT.GOV.RU