Upload
others
View
21
Download
0
Embed Size (px)
Citation preview
Data2Stats: Lesson 6 Dissemination
Anton Örn Karlsson
June 4th 2019
Фаза распространения
• Выпуск статистической продукции для пользователей
• Сборочные и готовые продукты– Статика и динамика
• Диаграммы и графики
• Выпуски новостей
– Диапазон каналов• Пример Статистика Исландии (Statistics Iceland)
• Домашняя страница
Подпроцессы
• Обновление систем вывода - Обновление систем, в которых хранятся данные и метаданные
• Создание продуктов распространения
• Управление выпуском продуктов распространения
• Продвижение продуктов распространения
• Управление службой поддержки
Как можно использовать R?
• R можно эффективно использовать в создании продуктов распространения– Создание продуктов распространения– Печатные издания– Пресс-релизы– Интернет-сайты
• Различные виды продукции– Интерактивная графика– Таблицы– Карты– Наборы микроданных общего пользования– Связанные открытые данные– Загружаемые файлы
Простой процесс распространения
• Используйте выходной набор данных
• Создавайте простые веб-таблицы
• Пишите пресс-релиз
– С добавлением рисунка/фигуры
• Создавайте интерактивную диаграмму
• (Можно также создать файл общего пользования с использованием уже описанных методов SDC)
Данные
• Мы будем использовать данные, предоставленные с помощью R из общего социологического анкетирования
data("gss_cat")
str(gss_cat)
## Classes 'tbl_df', 'tbl' and 'data.frame': 21483 obs. of 9 variables:
## $ year : int 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 ...
## $ marital: Factor w/ 6 levels "No answer","Nevermarried",..: 2 4 5 2 4 6 2 4 6 6 ...
## $ age : int 26 48 67 39 25 25 36 44 44 47 ...
## $ race : Factor w/ 4 levels "Other","Black",..: 3 3 3 3 3 3 3 3 3 3 ...
## $ rincome: Factor w/ 16 levels "No answer","Don't know",..: 8 8 16 16 16 5 4 9 4 4 ...
## $ partyid: Factor w/ 10 levels "No answer","Don't know",..: 6 5 7 6 9 10 5 8 9 4 ...
## $ relig : Factor w/ 16 levels "No answer","Don't know",..: 15 15 15 6 12 15 5 15 15 15 ...
## $ denom : Factor w/ 30 levels "No answer","Don't know",..: 25 23 3 30 30 25 30 15 4 25 ...
## $ tvhours: int 12 NA 2 4 1 NA 3 NA 0 3 ...
Размещение данных в таблицах (1)
• Для начала мы используем Tidyverse, чтобы создать две таблицы
tbl1 <- gss_cat %>% filter(marital!="No answer")
%>%
count("Marital Status"=marital)
tbl2 <- gss_cat %>% filter(marital!="No answer")
%>%
group_by("Marital Status"=marital) %>%
summarise("Average hours watching
TV"=mean(tvhours, na.rm=T))
Размещение данных в таблицах (2)
• Таблицы могут быть легко записаны в таблицы Excel с помощью библиотеки xlsx
• Далее их можно редактировать с помощью Excel, а затем опубликовать в Интернете
library(xlsx)
write.xlsx(as.data.frame(tbl1), "tbl1.xlsx",
row.names=F)
write.xlsx(as.data.frame(tbl2), "tbl2.xlsx",
row.names=F)
R markdown для публикации (1)
• Мы также можем использовать R и Rstudio для создания пресс-релизов, статистических бюллетеней или других публикаций
• Затем мы можем написать текст напрямую, позвонить по соответствующим номерам и вставить графики или таблицы по мере необходимости
• Мы будем работать с нашим примером и напишем краткий пресс-релиз для статистики в формате html– Он может быть легко опубликован в Интернете или
быть изменен на формат PDF или даже Word
Rmarkdown for publication(2)
R markdown для публикации(3)
• Вы можете добавлять большие объемы кода в блоках
– Не видно для читателя, если не сделано обратное с помощью echo = TRUE
• Цифры в тексте указываются в тексте markdown
Rmarkdown for publication(4): The rmarkdown code
Rmarkdown for publication(5): The html version
Rmarkdown for publication(6): Adding a figure
Rmarkdown for publication(7): The html version with a figure
Shiny(1)
• Что такое shiny?
– “Shiny это пакет R, который облегчает создание интерактивных веб-приложений прямо из R. Вы можете размещать автономные приложения на веб-странице или встраивать их в документы R Markdown, создавать информационные панели. Вы также можете расширить свои приложения Shiny темами CSS, виджетами htmlи действиями в JavaScript.»
• https://shiny.rstudio.com/
• Проведем небольшую демонстрацию
Shiny(2)
Shiny(3)
• Есть возможность работы в двух форматах
– Пользовательский интерфейс
– Сервер
• Последняя версия позволяет работать в одном скрипте R
• Скрипт разделен на две части
Shiny(4)
Shiny(5)
Shiny(6)
• Наглядная демонстрация
• Запуск скрипта app.R
Ваше задание
• Используя те же данные, которые мы использовали для нашей демонстрации– gss_cat
• Посмотрите на переменные и найдите что-то интересное для себя– Напишите короткий пресс-релиз в формате html,
используя Rmarkdown• Напишите текст с вложенными числами
• Добавьте простую фигуру, используя ggplot
• Также было бы здорово добавить таблицу– Google knitr::kable