Click here to load reader
Upload
buatdownloadaja
View
519
Download
0
Embed Size (px)
Citation preview
MAKALAH PROGRAM DINAMIK
NAMA ANGGOTA :
1. EMMA KUSUMAWATI 240101101200362. MONICA SANDI AFA 2401011013003. NINDYA FADIAH KHAIRINA 240101101410194. UZER TARMIZI 2401011113005. FUADI ANWAR WIRAWAN 2401011113006. TITI INDAH LESTARI 240101111300
JURUSAN MATEMATIKAFAKULTAS SAINS DAN MATEMATIKA
UNIVERSITAS DIPONEGORO2012
BAB I
PENDAHULUAN
A DASAR TEORI
Teknik manajemen sain yang diaplikasikan kepada persoalan dengan melibatkan
keputusan berurutan yang saling berkaitan. Program ini dikembangkan oleh Richard Bellman dan
G. B Dantzig pada tahun 1940 – 1950. Sebagai sebuah konsep, DP lebih luwes dibanding
program-program optimasi lainnya. Aplikasi DP telah terbukti baik pada pengelolaan persediaan,
jaringan, penjadwalan kerja untuk karyawan, pengendalian produksi, perencanaan penjualan dan
bidang lain-lain. Berbeda dengan linear programming, metode Simplex tidak dapat diterapkan di
sini. Formulasi model dilakukan dengan unik sesuai dengan persoalannya. Ada beberapa konsep
dasar dalam Program Dinamik diantaranya :
a) Dekomposisi
Persoalan DP dapat dipecah-pecah menjadi sub-persoalan atau tahapan (stage) yang lebih
kecil dan berurutan. Setiap tahap disebut juga sebagai titik keputusan. Setiap keputusan yang
dibuat pada suatu tahap akan mempengaruhi keputusan-keputusan pada tahap berikutnya.
b) Status
Status adalah kondisi awal (Sn) dan kondisi akhir (Sn-1) pada setiap tahap, dimana pada
tahap tersebut keputusan dibuat (Dn). Status akhir pada sebuah tahap tergantung kepada
status awal dan keputusan yang dibuat pada tahap yang bersangkutan. Status akhir pada
suatu tahap merupakan input bagi tahap berikutnya.
c) Variabel Keputusan dan Hasil
Keputusan yang dibuat pada setiap tahap (Dn) merupakan keputusan yang berorientasi
kepada return yang diakibatkannya (Rn|Dn), yaitu tingkat maksimal atau minimal.
d) Fungsi Transisi
Fungsi transisi menjelaskan secara pasti bagaimana tahap-tahap saling berhubungan. Fungsi
ini berbentuk fungsi hubungan antar status pada setiap tahap yang beurutan. Fungsi transisi
secara umum berbentuk :
Sn-1 = Sn - Dn
Dimana Sn-1 = status pada tahap n-1, atau status akhir pada tahap-n. Sn adalah status awal
pada tahap-n. Komponen pada setiap tahap dapat digambarkan sebagai berikut :
e) Optimasi Tahap
Optimasi tahap dalam DP adalah menentukan keputusan optimal pada setiap tahap dari
berbagai kemungkinan nilai status inputnya. Fungsi umum dari keputusan optimal adalah :
fn(Sn,Dn)= return pada tahap-n dari nilai status input. Sn, dan keputusan, Dn.
fn*(Sn) = return optimal pada tahap-n dari nilai input status, Sn.
f) Fungsi Rekursif
Fungsi rekursif biasanya digunakan pada berbagai program komputer, di mana nilai sebuah
variabel pada fungsi itu merupakan nilai kumulatif dari nilai variable tersebut pada tahap
sebelumnya. Pada DP, fungsi umum dituliskan sebagai :
fn(Sn,Dn) = Rn + fn-1*(Sn-1,Dn-1)
Prosedur optimasi dawali dari tahap akhir menuju tahap awal (backward). Karakteristik
programa dinamis adalah :
1. Persoalan dapat dipisahkan menjadi beberapa tahap (stages), di mana setiap tahap
membutuhkan keputusan kebijakan yang standard dan saling berhubungan.
2. Setiap tahap memiliki sejumlah status (state). Secara umum, sekumpulan status ini
merupakan berbagai kemungkinan kondisi yang timbul dari sistim persoalannya.
Status ini memberikan informasi yang dibutuhkan setiap keputusan dan dampaknya
pada tahap berikutnya. Jumlah status pada setiap tahap bisa definit atau infinit.
3. Setiap keputusan kebijakan yang dibuat pada suatu tahap, status pada tahap tersebut
ditransformasi ke dalam status yang berkaitan pada tahap berikutnya. Hubungan
antar status pada tahap yang berurutan bisa bersifat deterministik atau probabilistik.
Pada sebuah persoalan dengan n-tahap, ada dua input, yaitu : (1) state pada tahap-n
(Sn) dan decision variable (Xn). Sedang outputnya adalah : (1) return atau akibat
dari setiap Xn yang dipilih, fn(s,Xn); dan (2) status baru yang menjadi input pada
tahap berikutnya (Sn-1). Hubungan antara Xn dan fn(s,Xn) ditentukan oleh return
function. Sedang hubungan antar status pada tahap tertentu ditentukan oleh transition
function.
4. Solusi pada programa dinamis berprinsip kepada optimalitas yang
dikembangkan oleh Bellman1 : An optimal policy must have the property
that, regardless of the decision to enter a particular state, the remaining
decisions must consitute an optimal policy for leaving that state.
5. Keputusan pada tahap berikutnya bersifat independen terhadap
keputusan sebelumnya. Untuk menyelesaikan persoalan programa
dinamis, dimulai dari solusi awal pada suatu tahap, dan secara berurutan
menuju tahap berikutnya dengan proses yang terbalik (backward
induction process).
6. Solusi optimal yang dihasilkan pada setiap tahap berprinsip kepada
hubungan dalam bentuk fungsi rekursif (recursion relationship). Secara
umum bentuk fungsi rekursif adalah :
fn*(Sn) = max/min {fn(Sn, Xn)}.
Di mana fn*(Sn) = adalah hasil optimal dari keputusan pada tahap-n.
B PERMASAHALAN
Seorang ahli statistika muda percaya bahwa ia telah mengembangkan suatu sistem agar
dapat memenangkan salah satu permainan terkenal di Las Vegas. Rekan – rekannya tidak
percaya bahwa sistem tersebut dapat berhasil sehingga mereka bertaruh dengannya jika ia mulai
dengan 3 keping taruhan, ia tidak akan mendapatkan sekurang-kurangnya 5 keping setelah 3
kali permainan. Setiap kali permainan memerlukan taruhan sejumlah keeping yang diambil dari
keping yang tersedia dan menang atau kalah setara dengan mendapatkan atau kehilangan
sejumlah keping tersebut. Ahli statistika itu yakin bahwa sistem yang dibuatnya akan memberi
kemungkinan 35
kemenangan dalam satu kali permainan tersebut
Asumsikan bahwa keyakinan ahli statistika tersebut benar, dan sekarang kita
menggunakan pemrograman dinamik untuk menentukan kebijakan yang optimal mengenai
jumlah keping yang dipertaruhkan pada masing-masing permainan (ada tiga permainan).
Keputusan pada masing-masing permainan harus memperhatikan hasil permainan sebelumnya.
Tujuannya ialah memeaksimalkan probabilitas kemenangan taruhan ahli statistika tersebut
dengan rekannya.
BAB II
PEMBAHASAN
Perumusan
Perumusan pemrograman dinamik untuk masalah ini adalah
Tahap n = permainan ke-n (n=1,2,3)
xn = jumlah keping yang dipertaruhkan pada tahap n
State xn = jumlah keping yang tersedia untuk memeulai tahap n
Definisi state ini dipilih karena dapat menyediakan informasi mengenai situasi sekarang yang
diperlukan untuk membuat keputusan optimal tentang banyaknya keping yang harus
dipertaruhkan kemudian.
Oleh karena tujuannya ialah memaksimalkan probabilitas ahli statistika tersebut akan
menang dalam taruhannya, fungsi tujuan yang harus dimaksimalkan pada setiap tahap adalah
probabilitas penyelesaian ketiga permainan tersebut dengan sekurang – kurangnya 5 keping.
(Catat bahwa nilai akhir lebih dari 5 keping berarti sama dengan tepat 5 keping, karena taruhan
sama-sama dimenangkan) dengan demikian:
f n(sn , xn) = probabilitas menyelesaikan ketiga permainan dengan sekurang-kurangnya 5
chip, jika ahli statistic berada pada state sn di tahap n membuat keputusan xn
dan membuat keputusan optimal pada tahap-tahap selanjutnya.
f n(sn) = f n(sn , xn)xn=0,1 , … ,sn
max
Ekspresi untuk fungsi f n(sn , xn) haruslah mencerminkan kenyataan masih terdapat
kemungkinan untuk mengakumulasikan 5 keping meskipun ahli statistik tersebut kalah pada satu
tahap permainan. Jika ia kalah pada suatu tahap maka state pada tahap selanjutnya menjadi sn−xn
dan probabilitas ia dapat mengakhiri permainan dengan sekurang-kurangnya 5 keping adalah f n+1
= ¿¿). Jika ia menang pada suatu tahap maka state berikutnya akan menjadi sn+xn , dan
probabilitas yang bersangkutan adalah f n+1(sn+xn). Oleh karena probabilitas kemenangan
permainan diasumsikan3/5 maka
f n ( sn , xn )=25
f n+1 ( sn−xn )+ 35
f n+1(sn+xn)
[dengan f 4(s4) di definisikan sama dengan 0 untuk s4<5 dan sama dengan 1 untuk s4 ≥ 5¿.
Jadi ,tidak terdapat kontribusi yang langsung mempengaruhi fungsi tujuan dari tahap n selain
pengaruh menjadi apa state selanjutnya.
Hubungan dasar ini terdapat dalam gambar
Lantas hubungan reskursif untuk masalah ini adalah :
f n¿ ( sn )= max
xn =0,1 ,… Sn
{25
f n+1¿ (sn−xn )+ 3
5f n+1¿ (sn+ xn)}
untuk n = 1,2,3, dengan f 4(s4) yang sudah di definisikan di atas.
Prosedur Penyelesaian
Hubungan rekursif tersebut akan membawa pada hasil perhitungan berikut
n=3
s3 f 3(s3) x3¿
0 0 -
1 0 -
2 0 -
3 35
2(atau lebih)
4 35
1(atau lebih)
≥5 1 0(atau ≤s3−5)
n=2
x2 f 2 ( s2 , x2)=25
f 3¿ ( s2−x2 )+ 3
5f 3
¿ (s2+x2)
s2 0 1 2 3 4 f 2(s2) x2¿
0 0 0 -
1 0 0 0 -
2 0 925
925
925
1,2
3 35
925
35
35
35
0,2,3
4 35
2125
35
35
35
2125
1
≥5 1 1 0
n=1
x1 f 1 ( s1 , x1 )=25
f 2¿ ( s1−x1 )+ 3
5f 2¿ (s1+x1)
s1 0 1 2 3 f 1(s1) x1¿
3 35
81125
35
35
81125
1
Kebijakan ini akan memberikan ahli statistika tersebut probabilitas kemenangan sebesar 81
125
saat taruhan dengan rekanya
BAB III
KESIMPULAN
Kebijakan optimalnya adalah
Jika menang x3¿ =0
Jika menang , x2¿ =1
x1¿=1 Jika kalah x3
¿= 2 atau 3
Jika kalah,x2¿= a atau 2 Jika Menang, x3
¿ = 2 atau 3(x2
¿ =1)
1,2,3,atau 4(x2¿ =2)
Jika kalah , taruhan kalah