Upload
start-up-chile
View
516
Download
3
Embed Size (px)
DESCRIPTION
The first in the world visual extension to audio speech recognition programs
Citation preview
РАСШИРЕНИЕ ВОЗМОЖНОСТЕЙ СИСТЕМ АУДИО-РАСПОЗНАВАНИЯ РЕЧИ
Осетров Виктор - CEO
Проблема
Недостатки аудио-распознавателей речи
• Подверженность звуковым помехам;
• Не определяют паузы в речи;• Необходимость постоянного
доступа к сети Интернет;• Макс. точность 90-95%
RealSpeaker повышает точность распознавания за счет*:
• Определения речи реального диктора
• Подавления аудио-шумов
• Выделения микропауз в речи
Решение
Использование визуализации повышает точность распознавание речи от 10 до 60%* - *Данные исследования PLoS ONE, 2009г., США
Что было:
Технология
Специализированная IDS камера
Что стало:
Технология
ОбычнаяVGA камера
Дорожная картаГод 2012
Квартал
ы
1 2 3 4
НИОКР Доработка архитектуры
на основе минимальных
требований мобильных
устройств, планшетников
и ПK
Определения речи реального
диктора, на основе
параллельной раскадровки
видео-потока и аудио-сигнала
Оптимизаци
я
используем
ых
алгоритмов
Реализац
ия
продукта
и выход
Создание прототипа, который способен
захватывать и отслеживать движение
губ пользователя на VGA камерах через
сервер программы
Запуск и
совершенствование
продукта, накопление базы
данных
Организа
ционное
развитие
Получение
финансирования и
статуса резидента
«Сколково». Команда - 6
чел.
Команда - 8
чел.
Команда - 10
чел.
Команда -
15 чел.
Статьи затрат
• Зарплата персоналу: 8 чел.x9 мес.x1 k$
• Оборудование:• Сервер Windows Azure• Microsoft Kinect 2• Automotive Development Kit• Hardware
• Общеадминистративные расходы
70k $
20k $
20k $
Пример предполагаемой работы расширения RealSpeaker
• Интеграция со всеми адресными строками Google
• Dragon Mobile SDK• Kinect SDK• Windows Embedded Automotive
Продукт
Технология может быть интересна для:• Google Voice Search• Dragon Naturally Speaking• Microsoft Speech Recognition, Windows
Automotive• Siri Apple• Kinect2 Microsoft
Прямые конкуренты:• Google Face Recognition• Face/Smile Detection, Face Shutter• Open CV
Конкуренты
Показатели рынка распознавания речи*: • CAGR - 9% в год. • V рынка - 38,6 млн.$ (2010 год)• Прогноз V рынка - 58, 4 млн. $
(2015 год)
Показатели рынка мобильного распознавания голоса**:• V рынка - 32,7 млн$ (2009 год)• Прогноз V рынка - 99,6 млн. $
(2014год)
Объем рынка
_______________*по данным BCC Research
_______________**по данным Datamonitor
Пользователи Google Voice Search, Dragon Mobile, Windows Automotive и т.д.:
…которые имеют:• Смартфоны или компьютеры с VGA
камерой• Высокопроизводительный процессор• 3G/4G, широкополосный доступ к
сети ИнтернетКаждый четвертый поиск на Android производится при помощи голоса* - *Данные Google за 2010 год.
Рыночная ниша
Бизнес-модель
B2B• прямые продажи лицензии или
всего проекта софтверным вендорам, стратегическим партнерам
B2C• продажа SaaS решений
собственныx визуальных приложений, а также запуск расширения на маркетах
Комментарии:В проект вложено 650 тыс. руб.• Грант программы У.М.Н.И.К. • Грант компании LG• Собственные средства
P/L 1 год, k.$
2 год, k.$
3 год,k.$
Затраты 110 305 745
Выручка 125 1565 5780
Разница по периоду
+ 15 + 1260 +5035
Инвестиции
• Осетров Виктор – автор и руководитель проекта/CEO
• Стёпин Алексей – технический руководитель проекта/CTO
• Облопов Андрей – инженер-разработчик/developer
• Сухарева Мария – маркетолог/CMO
Команда
5$
• RealSpeaker – визуальное расширение возможностей аудио-распознавателей речи;
• Продукт – лицензия/SaaS решение (приложение на маркетах или отдельное ПО):• Marketplace• App Store• Android Market• RealSpeaker soft
• Потребность в инвестициях:• 110 тыс. $. – для запуска продукта на
рынок, в обмен на 25% доли в компании
Резюме
Спасибо за внимание!Контакты:ООО «РеалСпикер Лаб»Бизнес-инкубатор IT-Park, Казань Тел. 8 927 87 333 21Skype: osetrov.victorE-mail: [email protected] Twitter: @RealSpeakerwww.realspeaker.net (testing)