MAKALAH PROGRAM DINAMIK.docx

MAKALAH PROGRAM DINAMIK

NAMA ANGGOTA :

1. EMMA KUSUMAWATI 240101101200362. MONICA SANDI AFA 2401011013003. NINDYA FADIAH KHAIRINA 240101101410194. UZER TARMIZI 2401011113005. FUADI ANWAR WIRAWAN 2401011113006. TITI INDAH LESTARI 240101111300

JURUSAN MATEMATIKAFAKULTAS SAINS DAN MATEMATIKA

UNIVERSITAS DIPONEGORO2012

BAB I

PENDAHULUAN

A DASAR TEORI

Teknik manajemen sain yang diaplikasikan kepada persoalan dengan melibatkan

keputusan berurutan yang saling berkaitan. Program ini dikembangkan oleh Richard Bellman dan

G. B Dantzig pada tahun 1940 – 1950. Sebagai sebuah konsep, DP lebih luwes dibanding

program-program optimasi lainnya. Aplikasi DP telah terbukti baik pada pengelolaan persediaan,

jaringan, penjadwalan kerja untuk karyawan, pengendalian produksi, perencanaan penjualan dan

bidang lain-lain. Berbeda dengan linear programming, metode Simplex tidak dapat diterapkan di

sini. Formulasi model dilakukan dengan unik sesuai dengan persoalannya. Ada beberapa konsep

dasar dalam Program Dinamik diantaranya :

a) Dekomposisi

Persoalan DP dapat dipecah-pecah menjadi sub-persoalan atau tahapan (stage) yang lebih

kecil dan berurutan. Setiap tahap disebut juga sebagai titik keputusan. Setiap keputusan yang

dibuat pada suatu tahap akan mempengaruhi keputusan-keputusan pada tahap berikutnya.

b) Status

Status adalah kondisi awal (Sn) dan kondisi akhir (Sn-1) pada setiap tahap, dimana pada

tahap tersebut keputusan dibuat (Dn). Status akhir pada sebuah tahap tergantung kepada

status awal dan keputusan yang dibuat pada tahap yang bersangkutan. Status akhir pada

suatu tahap merupakan input bagi tahap berikutnya.

c) Variabel Keputusan dan Hasil

Keputusan yang dibuat pada setiap tahap (Dn) merupakan keputusan yang berorientasi

kepada return yang diakibatkannya (Rn|Dn), yaitu tingkat maksimal atau minimal.

d) Fungsi Transisi

Fungsi transisi menjelaskan secara pasti bagaimana tahap-tahap saling berhubungan. Fungsi

ini berbentuk fungsi hubungan antar status pada setiap tahap yang beurutan. Fungsi transisi

secara umum berbentuk :

Sn-1 = Sn - Dn

Dimana Sn-1 = status pada tahap n-1, atau status akhir pada tahap-n. Sn adalah status awal

pada tahap-n. Komponen pada setiap tahap dapat digambarkan sebagai berikut :

e) Optimasi Tahap

Optimasi tahap dalam DP adalah menentukan keputusan optimal pada setiap tahap dari

berbagai kemungkinan nilai status inputnya. Fungsi umum dari keputusan optimal adalah :

fn(Sn,Dn)= return pada tahap-n dari nilai status input. Sn, dan keputusan, Dn.

fn*(Sn) = return optimal pada tahap-n dari nilai input status, Sn.

f) Fungsi Rekursif

Fungsi rekursif biasanya digunakan pada berbagai program komputer, di mana nilai sebuah

variabel pada fungsi itu merupakan nilai kumulatif dari nilai variable tersebut pada tahap

sebelumnya. Pada DP, fungsi umum dituliskan sebagai :

fn(Sn,Dn) = Rn + fn-1*(Sn-1,Dn-1)

Prosedur optimasi dawali dari tahap akhir menuju tahap awal (backward). Karakteristik

programa dinamis adalah :

1. Persoalan dapat dipisahkan menjadi beberapa tahap (stages), di mana setiap tahap

membutuhkan keputusan kebijakan yang standard dan saling berhubungan.

2. Setiap tahap memiliki sejumlah status (state). Secara umum, sekumpulan status ini

merupakan berbagai kemungkinan kondisi yang timbul dari sistim persoalannya.

Status ini memberikan informasi yang dibutuhkan setiap keputusan dan dampaknya

pada tahap berikutnya. Jumlah status pada setiap tahap bisa definit atau infinit.

3. Setiap keputusan kebijakan yang dibuat pada suatu tahap, status pada tahap tersebut

ditransformasi ke dalam status yang berkaitan pada tahap berikutnya. Hubungan

antar status pada tahap yang berurutan bisa bersifat deterministik atau probabilistik.

Pada sebuah persoalan dengan n-tahap, ada dua input, yaitu : (1) state pada tahap-n

(Sn) dan decision variable (Xn). Sedang outputnya adalah : (1) return atau akibat

dari setiap Xn yang dipilih, fn(s,Xn); dan (2) status baru yang menjadi input pada

tahap berikutnya (Sn-1). Hubungan antara Xn dan fn(s,Xn) ditentukan oleh return

function. Sedang hubungan antar status pada tahap tertentu ditentukan oleh transition

function.

4. Solusi pada programa dinamis berprinsip kepada optimalitas yang

dikembangkan oleh Bellman1 : An optimal policy must have the property

that, regardless of the decision to enter a particular state, the remaining

decisions must consitute an optimal policy for leaving that state.

5. Keputusan pada tahap berikutnya bersifat independen terhadap

keputusan sebelumnya. Untuk menyelesaikan persoalan programa

dinamis, dimulai dari solusi awal pada suatu tahap, dan secara berurutan

menuju tahap berikutnya dengan proses yang terbalik (backward

induction process).

6. Solusi optimal yang dihasilkan pada setiap tahap berprinsip kepada

hubungan dalam bentuk fungsi rekursif (recursion relationship). Secara

umum bentuk fungsi rekursif adalah :

fn*(Sn) = max/min {fn(Sn, Xn)}.

Di mana fn*(Sn) = adalah hasil optimal dari keputusan pada tahap-n.

B PERMASAHALAN

Seorang ahli statistika muda percaya bahwa ia telah mengembangkan suatu sistem agar

dapat memenangkan salah satu permainan terkenal di Las Vegas. Rekan – rekannya tidak

percaya bahwa sistem tersebut dapat berhasil sehingga mereka bertaruh dengannya jika ia mulai

dengan 3 keping taruhan, ia tidak akan mendapatkan sekurang-kurangnya 5 keping setelah 3

kali permainan. Setiap kali permainan memerlukan taruhan sejumlah keeping yang diambil dari

keping yang tersedia dan menang atau kalah setara dengan mendapatkan atau kehilangan

sejumlah keping tersebut. Ahli statistika itu yakin bahwa sistem yang dibuatnya akan memberi

kemungkinan 35

kemenangan dalam satu kali permainan tersebut

Asumsikan bahwa keyakinan ahli statistika tersebut benar, dan sekarang kita

menggunakan pemrograman dinamik untuk menentukan kebijakan yang optimal mengenai

jumlah keping yang dipertaruhkan pada masing-masing permainan (ada tiga permainan).

Keputusan pada masing-masing permainan harus memperhatikan hasil permainan sebelumnya.

Tujuannya ialah memeaksimalkan probabilitas kemenangan taruhan ahli statistika tersebut

dengan rekannya.

BAB II

PEMBAHASAN

Perumusan

Perumusan pemrograman dinamik untuk masalah ini adalah

Tahap n = permainan ke-n (n=1,2,3)

xn = jumlah keping yang dipertaruhkan pada tahap n

State xn = jumlah keping yang tersedia untuk memeulai tahap n

Definisi state ini dipilih karena dapat menyediakan informasi mengenai situasi sekarang yang

diperlukan untuk membuat keputusan optimal tentang banyaknya keping yang harus

dipertaruhkan kemudian.

Oleh karena tujuannya ialah memaksimalkan probabilitas ahli statistika tersebut akan

menang dalam taruhannya, fungsi tujuan yang harus dimaksimalkan pada setiap tahap adalah

probabilitas penyelesaian ketiga permainan tersebut dengan sekurang – kurangnya 5 keping.

(Catat bahwa nilai akhir lebih dari 5 keping berarti sama dengan tepat 5 keping, karena taruhan

sama-sama dimenangkan) dengan demikian:

f n(sn , xn) = probabilitas menyelesaikan ketiga permainan dengan sekurang-kurangnya 5

chip, jika ahli statistic berada pada state sn di tahap n membuat keputusan xn

dan membuat keputusan optimal pada tahap-tahap selanjutnya.

f n(sn) = f n(sn , xn)xn=0,1 , … ,sn

max

Ekspresi untuk fungsi f n(sn , xn) haruslah mencerminkan kenyataan masih terdapat

kemungkinan untuk mengakumulasikan 5 keping meskipun ahli statistik tersebut kalah pada satu

tahap permainan. Jika ia kalah pada suatu tahap maka state pada tahap selanjutnya menjadi sn−xn

dan probabilitas ia dapat mengakhiri permainan dengan sekurang-kurangnya 5 keping adalah f n+1

= ¿¿). Jika ia menang pada suatu tahap maka state berikutnya akan menjadi sn+xn , dan

probabilitas yang bersangkutan adalah f n+1(sn+xn). Oleh karena probabilitas kemenangan

permainan diasumsikan3/5 maka

f n ( sn , xn )=25

f n+1 ( sn−xn )+ 35

f n+1(sn+xn)

[dengan f 4(s4) di definisikan sama dengan 0 untuk s4<5 dan sama dengan 1 untuk s4 ≥ 5¿.

Jadi ,tidak terdapat kontribusi yang langsung mempengaruhi fungsi tujuan dari tahap n selain

pengaruh menjadi apa state selanjutnya.

Hubungan dasar ini terdapat dalam gambar

Lantas hubungan reskursif untuk masalah ini adalah :

f n¿ ( sn )= max

xn =0,1 ,… Sn

{25

f n+1¿ (sn−xn )+ 3

5f n+1¿ (sn+ xn)}

untuk n = 1,2,3, dengan f 4(s4) yang sudah di definisikan di atas.

Prosedur Penyelesaian

Hubungan rekursif tersebut akan membawa pada hasil perhitungan berikut

n=3

s3 f 3(s3) x3¿

0 0 -

1 0 -

2 0 -

3 35

2(atau lebih)

4 35

1(atau lebih)

≥5 1 0(atau ≤s3−5)

n=2

x2 f 2 ( s2 , x2)=25

f 3¿ ( s2−x2 )+ 3

5f 3

¿ (s2+x2)

s2 0 1 2 3 4 f 2(s2) x2¿

0 0 0 -

1 0 0 0 -

2 0 925

925

925

1,2

3 35

925

35

35

35

0,2,3

4 35

2125

35

35

35

2125

1

≥5 1 1 0

n=1

x1 f 1 ( s1 , x1 )=25

f 2¿ ( s1−x1 )+ 3

5f 2¿ (s1+x1)

s1 0 1 2 3 f 1(s1) x1¿

3 35

81125

35

35

81125

1

Kebijakan ini akan memberikan ahli statistika tersebut probabilitas kemenangan sebesar 81

125

saat taruhan dengan rekanya

BAB III

KESIMPULAN

Kebijakan optimalnya adalah

Jika menang x3¿ =0

Jika menang , x2¿ =1

x1¿=1 Jika kalah x3

¿= 2 atau 3

Jika kalah,x2¿= a atau 2 Jika Menang, x3

¿ = 2 atau 3(x2

¿ =1)

1,2,3,atau 4(x2¿ =2)

Jika kalah , taruhan kalah

Documents

MAKALAH PROGRAM DINAMIK.docx