19

Machine Learning Chapter 13. Reinforcement Learning Tom M. Mitchell

Machine Learning Chapter 13. Reinforcement Learning Tom M. Mitchell

Download PPT Report

Upload
kelley-boone
View
239
Download
3

Tags:

Embed Size (px)

Citation preview

Page 1: Machine Learning Chapter 13. Reinforcement Learning Tom M. Mitchell

Machine Learning

Chapter 13. Reinforcement

Learning

Tom M. Mitchell

Page 2: Machine Learning Chapter 13. Reinforcement Learning Tom M. Mitchell

2

Control Learning

Consider learning to choose actions, e.g., Robot learning to dock on battery charger Learning to choose actions to optimize factory output Learning to play Backgammon

Note several problem characteristics: Delayed reward Opportunity for active exploration Possibility that state only partially observable Possible need to learn multiple tasks with same

sensors/effectors

Page 3: Machine Learning Chapter 13. Reinforcement Learning Tom M. Mitchell

3

One Example: TD-Gammon

Learn to play Backgammon

Immediate reward +100 if win -100 if lose 0 for all other states

Trained by playing 1.5 million games against itself

Now approximately equal to best human player

Page 4: Machine Learning Chapter 13. Reinforcement Learning Tom M. Mitchell

4

Reinforcement Learning Problem

Page 5: Machine Learning Chapter 13. Reinforcement Learning Tom M. Mitchell

5

Markov Decision Processes

Assume finite set of states S set of actions A at each discrete time agent observes state st S and chooses ac

tion at A then receives immediate reward rt and state changes to st+1

Markov assumption : st+1 = (st, at ) and rt = r(st, at )– i.e., rt and st+1 depend only on current state and action– functions and r may be nondeterministic– functions and r not necessarily known to agent

Page 6: Machine Learning Chapter 13. Reinforcement Learning Tom M. Mitchell

6

Agent's Learning Task

Page 7: Machine Learning Chapter 13. Reinforcement Learning Tom M. Mitchell

7

Value Function

Page 8: Machine Learning Chapter 13. Reinforcement Learning Tom M. Mitchell

8

Page 9: Machine Learning Chapter 13. Reinforcement Learning Tom M. Mitchell

9

What to Learn

Page 10: Machine Learning Chapter 13. Reinforcement Learning Tom M. Mitchell

10

Q Function

Page 11: Machine Learning Chapter 13. Reinforcement Learning Tom M. Mitchell

11

Training Rule to Learn Q

Page 12: Machine Learning Chapter 13. Reinforcement Learning Tom M. Mitchell

12

Q Learning for Deterministic Worlds

Page 13: Machine Learning Chapter 13. Reinforcement Learning Tom M. Mitchell

13

Page 14: Machine Learning Chapter 13. Reinforcement Learning Tom M. Mitchell

14

Page 15: Machine Learning Chapter 13. Reinforcement Learning Tom M. Mitchell

15

Nondeterministic Case

Page 16: Machine Learning Chapter 13. Reinforcement Learning Tom M. Mitchell

16

Nondeterministic Case(Cont’)

Page 17: Machine Learning Chapter 13. Reinforcement Learning Tom M. Mitchell

17

Temporal Difference Learning

Page 18: Machine Learning Chapter 13. Reinforcement Learning Tom M. Mitchell

18

Temporal Difference Learning(Cont’)

Page 19: Machine Learning Chapter 13. Reinforcement Learning Tom M. Mitchell

19

Subtleties and Ongoing Research

Reinforcement Learning - uni-freiburg.degki.informatik.uni-freiburg.de/.../recordings/reinforcement.pdf · Reinforcement Learning 3 What is Reinforcement Learning? Learning from interaction

Reinforcement Learning - uni-freiburg.degki.informatik.uni-freiburg.de/.../recordings/reinforcement.pdf · Reinforcement Learning 3 What is Reinforcement Learning? Learning from interaction

Documents

10703 Deep Reinforcement Learning€¦ · 10/09/2018 · 10703 Deep Reinforcement Learning! Tom Mitchell September 10, 2018 Solving known MDPs Many slides borrowed from ! Katerina

10703 Deep Reinforcement Learning€¦ · 10/09/2018 · 10703 Deep Reinforcement Learning! Tom Mitchell September 10, 2018 Solving known MDPs Many slides borrowed from ! Katerina

Documents

Reinforcement Learning Lecture Inverse Reinforcement Learningipvs.informatik.uni-stuttgart.de/mlr/wp-content/uploads/2017/07/09... · Reinforcement Learning Inverse Reinforcement

Reinforcement Learning Lecture Inverse Reinforcement Learningipvs.informatik.uni-stuttgart.de/mlr/wp-content/uploads/2017/07/09... · Reinforcement Learning Inverse Reinforcement

Documents

Eick: Reinforcement Learning. Reinforcement Learning Introduction Passive Reinforcement Learning Temporal Difference Learning Active Reinforcement Learning

Eick: Reinforcement Learning. Reinforcement Learning Introduction Passive Reinforcement Learning Temporal Difference Learning Active Reinforcement Learning

Documents

Reinforcement Learning Mitchell, Ch. 13 (see also Barto & Sutton book on-line)

Reinforcement Learning Mitchell, Ch. 13 (see also Barto & Sutton book on-line)

Documents

Reinforcement Learning in Real- Time Strategy Games Nick Imrei Supervisors: Matthew Mitchell & Martin Dick

Reinforcement Learning in Real- Time Strategy Games Nick Imrei Supervisors: Matthew Mitchell & Martin Dick

Documents

Machine Learning Introduction. 2 교재 Machine Learning, Tom T. Mitchell, McGraw- Hill 일부 Reinforcement Learning: An Introduction, R. S. Sutton and

Machine Learning Introduction. 2 교재 Machine Learning, Tom T. Mitchell, McGraw- Hill 일부 Reinforcement Learning: An Introduction, R. S. Sutton and

Documents

Reinforcement Learning Introduction Passive Reinforcement Learning Temporal Difference Learning Active Reinforcement Learning Applications Summary

Reinforcement Learning Introduction Passive Reinforcement Learning Temporal Difference Learning Active Reinforcement Learning Applications Summary

Documents

Multi-Objective Reinforcement Learning using Sets of Pareto … · 2020. 10. 19. · learning and multi-objective reinforcement learning. 2.1 Reinforcement Learning A reinforcement

Multi-Objective Reinforcement Learning using Sets of Pareto … · 2020. 10. 19. · learning and multi-objective reinforcement learning. 2.1 Reinforcement Learning A reinforcement

Documents

Generalization in Reinforcement Learning: Successful ...papers.nips.cc/paper/1109-generalization-in-reinforcement-learning... · Generalization in Reinforcement Learning: Successful

Generalization in Reinforcement Learning: Successful ...papers.nips.cc/paper/1109-generalization-in-reinforcement-learning... · Generalization in Reinforcement Learning: Successful

Documents

Cooperative Inverse Reinforcement Learning...Cooperative Inverse Reinforcement Learning Dylan Hadfield-Menell CS237: Reinforcement Learning May 31, 2017

Cooperative Inverse Reinforcement Learning...Cooperative Inverse Reinforcement Learning Dylan Hadfield-Menell CS237: Reinforcement Learning May 31, 2017

Documents

Inverse Reinforcement Learning CS885 Reinforcement

Inverse Reinforcement Learning CS885 Reinforcement

Documents

Reinforcement Learning or Active Inference?karl/Reinforcement Learning or Active... · Reinforcement Learning or Active Inference? ... From the point of view of reinforcement learning

Reinforcement Learning or Active Inference?karl/Reinforcement Learning or Active... · Reinforcement Learning or Active Inference? ... From the point of view of reinforcement learning

Documents

Reinforcement Learning Chapter 13 What is Reinforcement Learning? Q-Learning Examples 1

Reinforcement Learning Chapter 13 What is Reinforcement Learning? Q-Learning Examples 1

Documents

Reinforcement Learning and Deep Reinforcement Learningcse.ucdenver.edu/.../Class-22-Reinforcement-learning-DL.pdf · 2018. 11. 28. · Outlines 1 Principles of Reinforcement Learning

Reinforcement Learning and Deep Reinforcement Learningcse.ucdenver.edu/.../Class-22-Reinforcement-learning-DL.pdf · 2018. 11. 28. · Outlines 1 Principles of Reinforcement Learning

Documents

Multi-Vehicle Mixed Reality Reinforcement Learning for ... · Multi-Vehicle Mixed Reality Reinforcement Learning for Autonomous Multi-Lane Driving Rupert Mitchell, Jenny Fletcher,

Multi-Vehicle Mixed Reality Reinforcement Learning for ... · Multi-Vehicle Mixed Reality Reinforcement Learning for Autonomous Multi-Lane Driving Rupert Mitchell, Jenny Fletcher,

Documents

Reinforcement Learning - Multi-Agent Reinforcement

Reinforcement Learning - Multi-Agent Reinforcement

Documents

Reinforcement Learning Das Reinforcement Learning-Problem Alexander Schmid

Reinforcement Learning Das Reinforcement Learning-Problem Alexander Schmid

Documents

Deep Learning for Reinforcement Learning in · PDF fileDeep Learning for Reinforcement Learning in ... Deep Learning for Reinforcement Learning in Pacman Deep Learning für ... Während

Deep Learning for Reinforcement Learning in · PDF fileDeep Learning for Reinforcement Learning in ... Deep Learning for Reinforcement Learning in Pacman Deep Learning für ... Während

Documents

Bayesian Reinforcement Learning - mlg.eng.cam.ac.ukmlg.eng.cam.ac.uk/rowan/files/BayesianReinforcementLearning.pdf · Introduction Bayesian Reinforcement Learning Bayesian Reinforcement

Bayesian Reinforcement Learning - mlg.eng.cam.ac.ukmlg.eng.cam.ac.uk/rowan/files/BayesianReinforcementLearning.pdf · Introduction Bayesian Reinforcement Learning Bayesian Reinforcement

Documents

Tutorial: Deep Reinforcement Learning - Machine Learning ...hunch.net/~beygel/deep_rl_tutorial.pdfTutorial: Deep Reinforcement Learning - Machine Learning

Tutorial: Deep Reinforcement Learning - Machine Learning ...hunch.net/~beygel/deep_rl_tutorial.pdfTutorial: Deep Reinforcement Learning - Machine Learning

Documents

New 10703 Deep Reinforcement Learning · 2018. 9. 12. · 10703 Deep Reinforcement Learning Tom Mitchell Machine Learning Department September 12, 2018 Monte Carlo Methods

New 10703 Deep Reinforcement Learning · 2018. 9. 12. · 10703 Deep Reinforcement Learning Tom Mitchell Machine Learning Department September 12, 2018 Monte Carlo Methods

Documents

10703 Deep Reinforcement Learning€¦ · 12/9/2018 · 10703 Deep Reinforcement Learning Tom Mitchell Machine Learning Department September 12, 2018 Monte Carlo Methods

10703 Deep Reinforcement Learning€¦ · 12/9/2018 · 10703 Deep Reinforcement Learning Tom Mitchell Machine Learning Department September 12, 2018 Monte Carlo Methods

Documents

Reinforcement Learning - 4. Model-free reinforcement Learning

Reinforcement Learning - 4. Model-free reinforcement Learning

Documents

Reinforcement Learning

Reinforcement Learning

Technology

From Reinforcement Learning to Deep Reinforcement …fagostin/assets/files/...Keywords: Machine learning · Reinforcement learning Deep learning · Deep reinforcement learning 1 Introduction

From Reinforcement Learning to Deep Reinforcement …fagostin/assets/files/...Keywords: Machine learning · Reinforcement learning Deep learning · Deep reinforcement learning 1 Introduction

Documents

Deep Learning for Reinforcement Learning in Pacman · Deep Learning for Reinforcement Learning in Pacman Deep Learning für Reinforcement Learning in Pacman Vorgelegte Bachelor-Thesis

Deep Learning for Reinforcement Learning in Pacman · Deep Learning for Reinforcement Learning in Pacman Deep Learning für Reinforcement Learning in Pacman Vorgelegte Bachelor-Thesis

Documents

Reinforcement Learning & Apprenticeship Learning

Reinforcement Learning & Apprenticeship Learning

Documents

Reinforcement Learning Instructor: Max Welling Source: T. Mitchell, Machine Learning, Chapter 13

Reinforcement Learning Instructor: Max Welling Source: T. Mitchell, Machine Learning, Chapter 13

Documents

Inverse Reinforcement Learning - Peoplecbfinn/_files/bootcamp_inverserl.pdf · Apprenticeship Learning via Inverse Reinforcement Learning. Good introduction to inverse reinforcement

Inverse Reinforcement Learning - Peoplecbfinn/_files/bootcamp_inverserl.pdf · Apprenticeship Learning via Inverse Reinforcement Learning. Good introduction to inverse reinforcement

Documents