39
5th International Conference onBig Data for Official Statistics, Kigali, Rwanda, 2019-04-30 UN Big Data Global Working Group Dominik Rozkrut Task Team on Training, Competencies and Capacity Development

Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

  • Upload
    others

  • View
    6

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

5th International Conference onBig Data for Official Statistics, Kigali, Rwanda, 2019-04-30

UN Big Data Global Working Group

Dominik Rozkrut

Task Team on Training, Competencies and Capacity Development

Page 2: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

Introduction

2

Page 3: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

Official statistics needs to figure out how it should function in the modern world

• A need for better technical infrastructure

• Better skills

• Better public awareness of risks of misinformation

• The broader approach to cybersecurity, i.e. information security

• Better public awareness of the value of official statistics

• Involvement in cooperation at the international, supranational and global levels is becoming more and more important

3

Page 4: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

Official statistics is about measurement

4

Page 5: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

The only things that changes …

5

Page 6: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

… is the toolset

6

szczecin.stat.gov.pl 10

Przykłady implementacji metod i narzędzi Big Data w celu usprawnienia procesu produkcji statystyk – statystyka morska

Statystyka Morska

Technologia

AIS

Uczestnictwo w projekcie ESSnet Big Data - AIS data WP4• ocena danych z systemu AIS jako źródło danych dla badań

statystyki morskiej:• sprawdzono jakość danych (porównanie danych AIS

komercyjnych z AIS-PL)• sprawdzono możliwości integracji z badaniami

statystycznymi z zakresu statystki morskiej• opracowanie nowych statystyk ważnych dla ESS (European

Statistical System):• natężenie ruchu statków na danym obszarze (port)• średnia prędkości statków na danym

• opracowanie scenariuszu dla produkcji statystyk opartych o dane AIS

https://webgate.ec.europa.eu/fpfis/mwikis/essnetbigdata/index.php/WP4_Reports,_milestones_and_deliverables

szczecin.stat.gov.pl 10

Przykłady implementacji metod i narzędzi Big Data w celu usprawnienia procesu produkcji statystyk – statystyka morska

Statystyka Morska

Technologia

AIS

Uczestnictwo w projekcie ESSnet Big Data - AIS data WP4• ocena danych z systemu AIS jako źródło danych dla badań

statystyki morskiej:• sprawdzono jakość danych (porównanie danych AIS

komercyjnych z AIS-PL)• sprawdzono możliwości integracji z badaniami

statystycznymi z zakresu statystki morskiej• opracowanie nowych statystyk ważnych dla ESS (European

Statistical System):• natężenie ruchu statków na danym obszarze (port)• średnia prędkości statków na danym

• opracowanie scenariuszu dla produkcji statystyk opartych o dane AIS

https://webgate.ec.europa.eu/fpfis/mwikis/essnetbigdata/index.php/WP4_Reports,_milestones_and_deliverables

szczecin.stat.gov.pl 10

Przykłady implementacji metod i narzędzi Big Data w celu usprawnienia procesu produkcji statystyk – statystyka morska

Statystyka Morska

Technologia

AIS

Uczestnictwo w projekcie ESSnet Big Data - AIS data WP4• ocena danych z systemu AIS jako źródło danych dla badań

statystyki morskiej:• sprawdzono jakość danych (porównanie danych AIS

komercyjnych z AIS-PL)• sprawdzono możliwości integracji z badaniami

statystycznymi z zakresu statystki morskiej• opracowanie nowych statystyk ważnych dla ESS (European

Statistical System):• natężenie ruchu statków na danym obszarze (port)• średnia prędkości statków na danym

• opracowanie scenariuszu dla produkcji statystyk opartych o dane AIS

https://webgate.ec.europa.eu/fpfis/mwikis/essnetbigdata/index.php/WP4_Reports,_milestones_and_deliverablesszczecin.stat.gov.pl 10

Przykłady implementacji metod i narzędzi Big Data w celu usprawnienia procesu produkcji statystyk – statystyka morska

Statystyka Morska

Technologia

AIS

Uczestnictwo w projekcie ESSnet Big Data - AIS data WP4• ocena danych z systemu AIS jako źródło danych dla badań

statystyki morskiej:• sprawdzono jakość danych (porównanie danych AIS

komercyjnych z AIS-PL)• sprawdzono możliwości integracji z badaniami

statystycznymi z zakresu statystki morskiej• opracowanie nowych statystyk ważnych dla ESS (European

Statistical System):• natężenie ruchu statków na danym obszarze (port)• średnia prędkości statków na danym

• opracowanie scenariuszu dla produkcji statystyk opartych o dane AIS

https://webgate.ec.europa.eu/fpfis/mwikis/essnetbigdata/index.php/WP4_Reports,_milestones_and_deliverables

szczecin.stat.gov.pl 10

Przykłady implementacji metod i narzędzi Big Data w celu usprawnienia procesu produkcji statystyk – statystyka morska

Statystyka Morska

Technologia

AIS

Uczestnictwo w projekcie ESSnet Big Data - AIS data WP4• ocena danych z systemu AIS jako źródło danych dla badań

statystyki morskiej:• sprawdzono jakość danych (porównanie danych AIS

komercyjnych z AIS-PL)• sprawdzono możliwości integracji z badaniami

statystycznymi z zakresu statystki morskiej• opracowanie nowych statystyk ważnych dla ESS (European

Statistical System):• natężenie ruchu statków na danym obszarze (port)• średnia prędkości statków na danym

• opracowanie scenariuszu dla produkcji statystyk opartych o dane AIS

https://webgate.ec.europa.eu/fpfis/mwikis/essnetbigdata/index.php/WP4_Reports,_milestones_and_deliverables

szczecin.stat.gov.pl 10

Przykłady implementacji metod i narzędzi Big Data w celu usprawnienia procesu produkcji statystyk – statystyka morska

Statystyka Morska

Technologia

AIS

Uczestnictwo w projekcie ESSnet Big Data - AIS data WP4• ocena danych z systemu AIS jako źródło danych dla badań

statystyki morskiej:• sprawdzono jakość danych (porównanie danych AIS

komercyjnych z AIS-PL)• sprawdzono możliwości integracji z badaniami

statystycznymi z zakresu statystki morskiej• opracowanie nowych statystyk ważnych dla ESS (European

Statistical System):• natężenie ruchu statków na danym obszarze (port)• średnia prędkości statków na danym

• opracowanie scenariuszu dla produkcji statystyk opartych o dane AIS

https://webgate.ec.europa.eu/fpfis/mwikis/essnetbigdata/index.php/WP4_Reports,_milestones_and_deliverables

szczecin.stat.gov.pl 14

Przykłady implementacji metod i narzędzi Big Data w celu usprawnienia procesu produkcji statystyk – statystyka morska

Statystyka Morska

Technologia

NSW

Polska statystyka publiczna została dodana jako oficjalny

odbiorca danych z NSW, co skutkowało utworzeniem

środowiska testowego po stronie statystyki.

Dane składowane są w bazie PostgreSQL w czasie rzeczywistym (usługa API - SOAP Serwer – środowisko testowe)

Aktualnie, po stronie statystyki trwają prace projektowo-programistyczne nad opracowaniem nowej wersji usługi

klienta web services - API i wdrożenia modelu docelowego

(środowisko produkcyjne).

szczecin.stat.gov.pl 14

Przykłady implementacji metod i narzędzi Big Data w celu usprawnienia procesu produkcji statystyk – statystyka morska

Statystyka Morska

Technologia

NSW

Polska statystyka publiczna została dodana jako oficjalny

odbiorca danych z NSW, co skutkowało utworzeniem

środowiska testowego po stronie statystyki.

Dane składowane są w bazie PostgreSQL w czasie rzeczywistym (usługa API - SOAP Serwer – środowisko testowe)

Aktualnie, po stronie statystyki trwają prace projektowo-programistyczne nad opracowaniem nowej wersji usługi

klienta web services - API i wdrożenia modelu docelowego

(środowisko produkcyjne).

szczecin.stat.gov.pl 14

Przykłady implementacji metod i narzędzi Big Data w celu usprawnienia procesu produkcji statystyk – statystyka morska

Statystyka Morska

Technologia

NSW

Polska statystyka publiczna została dodana jako oficjalny

odbiorca danych z NSW, co skutkowało utworzeniem

środowiska testowego po stronie statystyki.

Dane składowane są w bazie PostgreSQL w czasie rzeczywistym (usługa API - SOAP Serwer – środowisko testowe)

Aktualnie, po stronie statystyki trwają prace projektowo-programistyczne nad opracowaniem nowej wersji usługi

klienta web services - API i wdrożenia modelu docelowego

(środowisko produkcyjne).

szczecin.stat.gov.pl 14

Przykłady implementacji metod i narzędzi Big Data w celu usprawnienia procesu produkcji statystyk – statystyka morska

Statystyka Morska

Technologia

NSW

Polska statystyka publiczna została dodana jako oficjalny

odbiorca danych z NSW, co skutkowało utworzeniem

środowiska testowego po stronie statystyki.

Dane składowane są w bazie PostgreSQL w czasie rzeczywistym (usługa API - SOAP Serwer – środowisko testowe)

Aktualnie, po stronie statystyki trwają prace projektowo-programistyczne nad opracowaniem nowej wersji usługi

klienta web services - API i wdrożenia modelu docelowego

(środowisko produkcyjne).

szczecin.stat.gov.pl 15

Przykłady implementacji metod i narzędzi Big Data w celu usprawnienia procesu produkcji statystyk – statystyka nauki

Statystyka Nauki, Techniki i

Społeczeństwa Informacyjnego

Technologia

Badanie pilotażowe w zakresie wykorzystania Internetu jako źródła danych w badaniu

• Regon• Nazwa firmy• URL

Plik Robots.txt

User-agent: *Disallow: /

TAK

NIE

STOP

Składowanie

JSONBulk API

Elastic Search

Implementacja

AplikacjaPNT-jednostki

Web scraping

Pobieranie zawartości

stron internetowych

Page 7: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

Statistics Poland the winner of the EU Big Data Hackathon organised by Eurostat

7

Page 8: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

Open data… inside and outside

8

Page 9: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

Strategy forward

• We must be (even) more goal-oriented

• We must look for employees not for a specified range of activities, but based on specific hard and soft skills

• We need to rethink how

• to attract data science talent

• to train our own data science specialists

• to educate our stakeholders

9

Page 10: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

Task Team on Training, Competencies and Capacity Development

10

Page 11: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

Objectives

• A. Develop methods and tools (including coordination and facilitation) for

• a baseline need identification of “Big Data” competencies in NSSs, and

• an assessment of institutional readiness of NSSs in using Big Data

• B. Build a competency framework for the Big data acquisition and processing in the current data landscape of NSSs

11

Page 12: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

Objectives

• C. Identify and analyze the existing supply of training of data scientists

• in academic and other centers

• D. Facilitate establishing a global network of institutions for training and capacity building on Big Data in official statistics,

• under the umbrella of GWG

• E. Review of experiences and lessons learned from different organizational structures and data science governance

• across national statistical systems

12

Page 13: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

Objectives

• F. Provide guidance on the development of a training program

• that addresses the gaps and mismatches

• identified in the competencies analysis

• G. Coordinate training plans in line with

• the Global Survey on Big Data for Official Statistics and

• other outcomes from tasks teams formulated within the GWG

• or other relevant stakeholders

13

Page 14: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

Deliverables and Time Schedule

• 1. Assessment of institutional readiness (2019).

• Output: Report of the skills assessment survey and data science governance across NSSs.

• Method for needs identification and analysis of Big Data skills.

• Assessment framework for national institutional ‘readiness’ in terms of governance and infrastructure (as part of Global Survey on Big Data for Official Statistics).

14

Page 15: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

Deliverables and Time Schedule

• 2. Competency framework for new data sources in official statistics (2019).

• Output: Report with the proposition of the competency framework.

• Identification and definition of knowledge, skills and attitudes for work with new data sources.

15

Page 16: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

Deliverables and Time Schedule

• 3. Analysis of the supply and profiles of specialists in areas related to the analysis of new data sources, such as Big Data (2019).

• Output: Report on the training market for data scientists.

• Identification and analysis of data scientists training programs in academic institutions and other relevant centers.

16

Page 17: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

Deliverables and Time Schedule

• 4. Development of training courses (2019-2020).

• Output: Guidelines on training program; technical seminar conducted.

• Providing guidelines on the development of a program on training (including ‘curriculum’ development) based on skills needs analysis.

• One technical seminar on Big Data in … to discuss the results of the skills analysis, develop the concept for the guidelines and validate and finalize draft guidelines on program of training (if possible, the first seminar as a side-event of GWG Big Data conference).

17

Page 18: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

Deliverables and Time Schedule

• 5. Capacity building and sharing experiences through innovation centers and global network (2019 onwards).

• Output: TOR on global network of institutions; Support for establishment and operation of innovation centers.

• Formulate TOR and operating mechanisms for a global network of institutions for training and capacity building on big data.

• Study on organizational change through innovation centers.

18

Page 19: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

Deliverables and Time Schedule

• 5. Capacity building and sharing experiences through innovation centers and global network (2019 onwards).

• Output: TOR on global network of institutions; Support for establishment and operation of innovation centers.

• Providing technical advices and guidelines in collaboration with relevant stakeholders for replicating/adapting ‘experiments’ as well as moving towards their implementation.

• Developing a repository for good practices and experiences (including training materials and references) and encouraging country to perform study visits and knowledge sharing.

19

Page 20: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

Key Performance Indicators

• Deliverables are produced on time

• Methods and tools are accepted by the GWG oversight group

• Guidelines on training programs receive positive feedback from stakeholders

20

Page 21: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

Competencies

21

Page 22: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

Big data team (leaders) competencies

• Technical knowledge and expertise

• Analytical competencies

• Judgement and decision-making

• Management and delivery of results

• Building relationships and communication

• …

• (Credibility and influence)

• (Leadership)

22

Page 23: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

Big data team knowledge

• Statistical (econometric) theory

• Data analysis and classification

• Computer science

• Cybersecurity

• …

23

Page 24: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

Big data team skills

• Storing large datasets

• Processing live streams of data

• Properly formulating hypotheses

• …

24

Page 25: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

Big data team attitudes

• Creativity

• Curiosity

• Persistance

• Passion

• Goal-orientation

• …

25

Page 26: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

Big data roles

• IT infrastructure specialists

• Data engineers

• Researchers

• Team leaders

• …

26

Page 27: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

Related materials …(on wiki)

• UNECE High-Level Group for the Modernization of Official Statistics (2016)

• Eurostat, The updated ESS Vision 2020 skills framework* (2017)

• UK Office for National Statistics

• …

27

Page 28: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

Issues to tackle

• Differences

• regions, countries, states of affairs

• governance, institutions, organizations

• needs, challenges

• infrastructure, resources

28

Page 29: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

Human resources

29

Page 30: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

Curriculum related problems

• Graduate and postgraduate programs tend to be biased towards either statistics or computer science

• Many vital areas important for official statistics not covered

• integration of different sources, linkage techniques, advanced sampling and estimation methods, national accounts, time series analysis and seasonal adjustment, …

• The contents of the courses sometimes outdated or led in an old-fashioned way

30

Page 31: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

Major challenges

• Where to get the right specialists

• Are universities preparing students to work at NSIs?

• How to attract them to work for public statistics

• Strong competition on a labor market

• How to develop your own human resources

• Specialized training programs

• How to retain your staff

• Attractiveness of the job

31

Page 32: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

How to attract and retain the workforce we need for the future?

• Opportunity to do challenging work

• Availability of data

• Opportunities for professional development

• Impact of the work

• Effective recruiting and hiring process

• Flexibility of work arrangements

• Leadership and mentoring

32

Page 33: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

Implementation cases

33

Page 34: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

New specialized units within NSIs (internal)

• UK

• ONS’s Data Science Campus

• NL

• CBS’s Center for Big Data Statistics

• FR

• INSEE’s SSP Lab (Official Statistics Service Lab)

• It might be useful to review experiences and lessons learned from different organizational structures and data science governance across NSIs

34

Page 35: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

New specialized units within NSIs (internal)• PL

• Change of the organizational structure of the Central Office

• Reorientation of responsibilities

• ICT Systems, Geostatistics and Census Department

• Statistics Computing Center

• Data Engineering Centers in Regional Offices

• Priorities

• satellite imagery, traffic sensors, scanner data, web scrapping…

35

Page 36: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

The way forward

36

Page 37: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

Organization readiness for big data innovations

• (Goal oriented) organization culture

• Focus on opportunities

• Organization-wide understanding

• Education, trainings

• Team leaders

• Infrastructure and technical talent

• Start small, make quick progress, achieve quick wins

37

Page 38: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

Implementation measures

• Specialized internal units

• Internal programs of advanced training

• Strategic partnerships

• Involvement of external partners (including universities)

• Research grants

• Strategic methodological advances

• Hackathones

38

Page 39: Task Team on Training, Competencies and Capacity Development · Development of training courses (2019-2020). • Output: Guidelines on training program; technical seminar conducted

stat.gov.pl

for your attention!Thank you