13
Автоматическая генерация плейлистов Наталья Старикова Руководитель: Василий Ершов 22 декабря 2016 Наталья Старикова Автогенерация плейлистов 22 декабря 2016 1 / 13

Автоматическая генерация плейлистов. Презентация участников

Embed Size (px)

Citation preview

Page 1: Автоматическая генерация плейлистов. Презентация участников

Автоматическая генерация плейлистов

Наталья Старикова

Руководитель: Василий Ершов

22 декабря 2016

Наталья Старикова Автогенерация плейлистов 22 декабря 2016 1 / 13

Page 2: Автоматическая генерация плейлистов. Презентация участников

О проекте, github

Стартоваякомпозиция

Коллекция

Пользователь

Признаки Кластеризация

Похожиекомпозиции

Плейлист

Наталья Старикова Автогенерация плейлистов 22 декабря 2016 2 / 13

Page 3: Автоматическая генерация плейлистов. Презентация участников

Аналоги

АналогиРекомендательные системы: Last.fm, Spotify

Эксперты: Pandora, AllMusic

Нейронные сети, обученные на плейлистах поисполнителям: word2vec on Spotify playlists

Анализ аудио-характеристик:SOM-enhanced JukeBox

Объединение идейНейронные сети, обученные на плейлистах попризнакам композиций

Наталья Старикова Автогенерация плейлистов 22 декабря 2016 3 / 13

Page 4: Автоматическая генерация плейлистов. Презентация участников

Результаты прошлого этапа

Сбор данных для небольшого числа песен

теги Last.fm и Echonest

тексты песен

Предварительный анализ данныхпересечение тегов

похожесть текстов (word2vec)

Генерация плейлистаСкрипт для составления плейлиста на основепредварительного анализа

Наталья Старикова Автогенерация плейлистов 22 декабря 2016 4 / 13

Page 5: Автоматическая генерация плейлистов. Презентация участников

Задача на данном этапе

Сбор большого количества данных:плейлистов и признаков композиций

Отбор признаков: анализ тегов Last.fm

Обучение алгоритма

Генерация плейлиста

Оценка качества

Наталья Старикова Автогенерация плейлистов 22 декабря 2016 5 / 13

Page 6: Автоматическая генерация плейлистов. Презентация участников

Разнообразие API, musicmachinery

Наталья Старикова Автогенерация плейлистов 22 декабря 2016 6 / 13

Page 7: Автоматическая генерация плейлистов. Презентация участников

Сбор данных

ПлейлистыDeezer: доступны, но требуют коррекции

Spotify: лучше качество, хуже доступность

Признаки

Last.fm : теги исполнителя и композиции, похожиекомпозиции и исполнители

Spotify : аудио-характеристики: key, mode, valence,

acousticness, danceability, liveness, instrumentalness,

speechiness, tempo, loudness, energy, time signature

Наталья Старикова Автогенерация плейлистов 22 декабря 2016 7 / 13

Page 8: Автоматическая генерация плейлистов. Презентация участников

Теги Last.fm

ПроблемыНа 160К композиций 360К тегов, при этом:73 тега у хотя бы 5% композиций,351 тег у хотя бы 1% композиций

Различные варианты написания

Незначимые теги

Анализ теговпопулярность

совместнаявстречаемость

здравый смысл

Тегидекада: 20s, 30s, ...90s, 00s, 10s

пол вокалиста

жанрНаталья Старикова Автогенерация плейлистов 22 декабря 2016 8 / 13

Page 9: Автоматическая генерация плейлистов. Презентация участников

Отобранные теги Last.fm (Wordclouds)

Наталья Старикова Автогенерация плейлистов 22 декабря 2016 9 / 13

Page 10: Автоматическая генерация плейлистов. Презентация участников

Модели

word2vec для исполнителейПлейлисты Deezer: 72K плейлистов, 208K песенПлейлисты Spotify: 9K плейлистов, 106K песенОколо 30K исполнителей в каждом множестве

Кластеризация k-means

Композиции, выданные по методу tag.getTopTracksдля отобранных в тегах жанров

Оценка качестваСходство на основе близости жанров

Наталья Старикова Автогенерация плейлистов 22 декабря 2016 10 / 13

Page 11: Автоматическая генерация плейлистов. Презентация участников

Результаты

word2vec на плейлистах deezerКачество плохое и хуже с увеличением окна.

word2vec на плейлистах spotifyКачество выше и становится лучше с увеличениемокна. Максимум 7 из 8 исполнителей в том же жанре.

k-means для аудиохарактеристик Spotify1-2 композиции в одном жанре

k-means для тегов Last.fm2-4 композиции в одном жанре

Наталья Старикова Автогенерация плейлистов 22 декабря 2016 11 / 13

Page 12: Автоматическая генерация плейлистов. Презентация участников

Трудности, новые технологии

ТрудностиОграничения API

Отсутствие тегов

Названия композиций

Скорость Python

Библиотекиfileinput

spotipy

tensorflow

Наталья Старикова Автогенерация плейлистов 22 декабря 2016 12 / 13

Page 13: Автоматическая генерация плейлистов. Презентация участников

Перспективы

Построение вероятностной модели связикомпозиций с предыдущими в плейлисте

Изучение связи направленности плейлиста ипризнаков композиций

Анализ характеристик аудио

Проверка плейлистов для обучения на качество

Использование большего количества плейлистов

Гибкая конфигурация составления плейлистов

Автоматическая аннотация

Использование текстов

Наталья Старикова Автогенерация плейлистов 22 декабря 2016 13 / 13