Upload
dataart
View
225
Download
5
Tags:
Embed Size (px)
Citation preview
Algorithms and data structures
Yaroslav Vorontsov
Senior Software engineer/Tech lead
M.Sc., PhD
Agenda
´ Немного нудных определений
´ Переход дороги с некоторыми нюансами
´ Разные греческие буквы – омега, тета
´ Ещё нудные определения
´ Базовые структуры данных и их сложность
´ Базовые алгоритмы и их сложность
´ Немного веселья
2
Нудные определения
´ Алгоритм – набор инструкций, описывающих порядок действий исполнителя для достижения результата решения задачи за конечное число действий
´ Вычислительные процессы алгоритмического характера известны человечеству с глубокой древности
´ Явное определение – начало 20 века
3
Попытки формализации понятия алгоритма´ А. Чёрч – лямбда-исчисление, тезис Чёрча
´ A. Тьюринг – машина Тьюринга
´ А. Марков – нормальный алгорифм (алгоритм)
´ Машина Поста (автоматное программирование)
´ Рекурсивная функция
´ Brainfuck
++++++++++[>+++++++>++++++++++>+++>+<<<<-]>++ .>+.+++++++..+++.>++.<<+++++++++++++++.>.+++. ------.--------.>+.>.
Hello World
4
Один из наиболее старых алгоритмов
5
Кто считается первым программистом?
6
Вместо дальнейшего введения
´ Как перейти дорогу?´ Посмотрите налево
´ Посмотрите направо
´ Переходите
7
Но…
«Есть нюансы» (с)
В.И. Чапаев в известном анекдоте
8
Суслики – самые осторожные животные…Они становятся на задние лапки
и смотрят вдаль: не бежит ли лиса? Не летит ли орел? Не ползет ли змея?
И самые наблюдательные из них получают бампером в лоб…
9
Нюанс 110
Он же11
Нюанс 212
Извините, вот правильный нюанс 213
Нюанс 314
Нюанс 4
´ «Эй, гражданина, ты туда не ходи, ты сюда ходи. А то снег башка попадёт, совсем мёртвый будешь!»
´ Серьёзно, как вы вообще здесь оказались?
15
Нюансы 5 и 616
А ещё…
´ Вы идёте с коляской/тележкой?
´ Находятся ли транспортные средства на безопасном расстоянии?
´ Правило «3Д», оно же «ДДД» (особенно касается воронежских дорог)
´ Посмотрели ли вы наверх? (вдруг инопланетяне?)
´ А вдруг крокодилы?
17
К чему всё это было?
´ У алгоритмов есть формальные свойства´ Дискретность
´ Детерминированность
´ Понятность
´ Конечность
´ Массовость/Универсальность
´ Результативность
´ Алгоритм не содержит ошибок, если он даёт правильные результаты для любых допустимых исходных данных
18
Минутка К.О.
´ Среднестатистический случай работы алгоритма никому не интересен!
´ При анализе алгоритмов, в первую очередь обращают внимание на пограничные или предельные ситуации
´ Анализ алгоритмов при малом размере входных данных также не представляет интереса!
19
Альфа, бета, эта, тета…20
Альфа, бета, эта, тета…21
Часто встречающиеся оценки22
Часто встречающиеся оценки23
Хорошо, а где же структуры данных?Название-то A&DS…
24
Снова нудная теория
´ Структура данных – программная единица, позволяющая хранить и обрабатывать множество однотипных и/или логически связанных данных в вычислительной технике. Для добавления, поиска, изменения и удаления данных структура данных предоставляет некоторый набор функций, составляющих её интерфейс
´ В большинстве современных языков программирования «строительными блоками» для сложных структур данных являются´ Массивы (array)
´ Записи (struct/record)
´ Объединения (union)
´ Ссылки (reference/pointer)
25
Какие бывают структуры данных?
´ Список (List)
´ Ассоциативный массив (Map)
´ Хэш-таблица (Hash table)
´ Дек (Deque)
´ Граф (Graph)
´ Дерево (Tree)
´ Пирамида/Куча (Heap)
´ Таблица (Table)
´ Система непересекающихся множеств (Union-Find)
26
Основные структуры данных27
Основные структуры данных28
Основные структуры данных29
А вот и основные алгоритмы30
А вот и основные алгоритмы31
Алгоритм умножения: русский крестьянский метод´ Не требует знания таблицы
умножения
´ Надо уметь умножать и делить на 2
´ Умножение и деление на 2 –сдвиг на 1 разряд налево-направо
´ Аппаратная или низкоуровневая реализация
32
Рандом не такой уж и рандом
´ rand()
´ srand()
´ arc4random()
´ arc4random_uniform()
´ …
´ X[N+1] = (A*X[N]+C) mod M
33
Divide et impera
´ Метод «разделяй и властвуй» заключается в рекурсивном разбиении задачи на две или более подзадачи того же типа, но меньшего размера, и комбинации их решений для получения ответа к исходной задаче
´ Разбиения выполняются до тех пор, пока все подзадачи не окажутся элементарными
34
Алгоритм Штрассена для матриц
´ Эффективен при размере матриц от 32 до 128
´ Работает за субкубическоевремя
´ Оптимизируется для малых матриц за счёт обычного «кубического» перемножения
´ Необходимо, чтобы размер матриц был степенью двойки. Если это не так – матрица дополняется нулями
35
Quicksort
´ Выбор опорного элемента
´ Разделение массива
´ Шаг рекурсии – запуск вышеописанных действий для подмассивов
´ Устойчивость метода´ Хороший случай
´ Плохой случай
´ Оптимизации
36
Жадные алгоритмы
´ Жадный алгоритм принимает локально оптимальные решения на каждом этапе выполнения, допуская, что и конечное решение окажется оптимальным
´ Наиболее известные алгоритмы´ Алгоритм Хаффмана
´ Алгоритм Прима-Ярника
´ Алгоритм Краскала
´ Алгоритм Дейкстры
37
Алгоритм Дейкстры38
Дейкстра и Интернет (OSPF)
´ LSA – Link State Advertisement
´ При использовании протокола OSPF маршрутизаторы обмениваются информацией о топологии сети.
´ Потом, на основании этой информации с помощью алгоритмаДейкстры рассчитывают таблицу маршрутизации
39
Вероятностные алгоритмы
´ Подразумевают обращение к ГСЧ на определённом этапе своей работы
´ Позволяют пожертвовать абсолютной достоверностью ради ускорения/экономии во времени
´ Таких алгоритмов не так-то и мало:´ Фильтр Блума
´ Поиск минимального разреза в графе
´ Лас-Вегас (выполнить А с результатом r до тех пор, пока K(r) не истина)
´ Вероятностная раскраска графа
´ С натяжкой –марковские цепи, метод Монте-Карло, алгоритмы сжатия
40
Фильтр Блума41
Нет, не этого Блума
´ Можно получить ложноположительное срабатывание, но никогда –ложноотрицательное
´ Основан на битовом массиве и хэш-функции
42
Алгоритм Каргера
´ Минимальный разрез графа –разбиение множества вершин на две непустые части, при котором рассекается минимальное число рёбер
´ Repeat until just two nodes remain: ´ – Pick an edge of G at random
and collapse its two endpoints into a single node
´ For the two remaining nodes u1 and u2, set V1 = {nodes that went into u1} and V2 = {nodes in u2}
´ Вероятность: 2/(n*(n-1))
43
Как выйти из лабиринта?
´ Одним из самых простых правил для прохождения лабиринта является правило "одной руки": двигаясь по лабиринту, надо все время касаться правой или левой рукой его стены.
´ Этот алгоритм, вероятно, был известен еще древним грекам. Придется пройти долгий путь, заходя во все тупики, но в итоге цель будет достигнута
44
FAIL
´ Алгоритм «правой руки» не работает для т.н. многосвязных лабиринтов
´ Односвязными называются лабиринты, не содержащие замкнутых маршрутов и не имеющие отдельно стоящих стенок.
´ Лабиринты с отдельно стоящими стенками и с замкнутыми маршрутами называются многосвязными
45
Тесей-продуман46
Алгоритм Люка-Тремо
´ 1882 – Э. Люка, указал на первенство Тремо
´ Выйдя из любой точки лабиринта, надо сделать отметку на его стене (крест) и двигаться в произвольном направлении до тупика или перекрестка
´ В первом случае вернуться назад, поставить второй крест, свидетельствующий, что путь пройден дважды - туда и назад, и идти в направлении, не пройденном ни разу, или пройденном один раз;
´ Во втором - идти по произвольному направлению, отмечая каждый перекресток на входе и на выходе одним крестом
´ Если на перекресте один крест уже имеется, то следует идти новым путем, если нет - то пройденным путем, отметив его вторым крестом.
47
Что дальше?
´ Классика Computer Science´ Т. Кормен, Ч. Лейзерсон, Р. Ривест, К. Штайн «Алгоритмы: построение и анализ»
´ Р. Седжвик, К. Уэйн «Алгоритмы на Java»
´ Д. Кнут «Искусство программирования»
´ Веб-ресурсы´ http://algolist.ru
´ http://e-maxx.ru
´ http://habr.ru
´ http://rsdn.ru
48
Что дальше?
´ Онлайн-курсы (на английском)´ Coursera: Algorithms: Design and Analysis, part 1 & 2 by Tim Roughgarden
´ Coursera: Algorithms, part 1 & 2 by Kevin Wayne and Robert Sedgewick
´ Stanford: CS103 – Mathematical foundations of computing
´ Stanford: CS161 – Design and Analysis of Algorithms
´ Онлайн-курсы (на русском)´ Lektorium.tv
´ ШАД
49