Geri Dön

A sample-path approach to time-average Markov decision processes

Başlık çevirisi mevcut değil.

  1. Tez No: 400894
  2. Yazar: MELİKE BAYKAL GÜRSOY
  3. Danışmanlar: DR. KEITH W. ROSS
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 1988
  8. Dil: İngilizce
  9. Üniversite: University of Pennsylvania
  10. Enstitü: Yurtdışı Enstitü
  11. Ana Bilim Dalı: Belirtilmemiş.
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 111

Özet

Özet yok.

Özet (Çeviri)

Time-average Markov decision problems are considered for the finite state and action spaces. Several definitions of variability are introduced and compared. For multichain case, it is shown that a stationary policy maximizes one of the criteria, namely, the expected long-run average variability. An algorithm which uses a decomposition approach to locate such an optimal policy is given. The algorithm produces an optimal pure policy under convexity conditions for the variability function. The unichain semi-Markov decision processes are examined. It is shown that a stationary policy maximizes the expected average reward subject to the condition that the longrun average cost is below certain level with probability 1. A fractional program is presented which produces such an optimal stationary policy. Two-person zero-sum stochastic games are also considered. In the case that only one player controls the transition probabilities, stationary policies are shown to exist which give the saddlepoint solution for multichained expected long-run average reward. An algorithm using the decomposition theory is developed to find optimal stationary policies for both players. In the case that both players control the transition probabilities a generalized game is obtained. The solution of this game gives optimal stationary policies for the players if the game is irreducible.

Benzer Tezler

  1. Türkiye'de kentsel sit alanı sorunları ve çözüm yolları için bir deneme/Galata örneği

    A Survey on the solution of the problems in the urban şite areas in Turkey/ Galata case

    YASEMİN AKSOY

    Yüksek Lisans

    Türkçe

    Türkçe

    1997

    Şehircilik ve Bölge Planlamaİstanbul Teknik Üniversitesi

    Kentsel Tasarım Ana Bilim Dalı

    PROF. DR. GÜNDÜZ ATALIK

  2. Türkülerin dinamik yapısını oluşturan olguların öğretiminde izlenecek bir yaklaşım önerisi: Orta Anadolu ağzı örneği

    A recommendation for an approach to teaching the phenomenons which form that the dynamic structure of turkus: Central Anatolia example

    ERHAN USLU

    Doktora

    Türkçe

    Türkçe

    2022

    Eğitim ve Öğretimİstanbul Teknik Üniversitesi

    Müzikoloji ve Müzik Teorisi Ana Bilim Dalı

    PROF. DR. NİLGÜN DOĞRUSÖZ DİŞİAÇIK

  3. Bulanık çok modlu kaynak kısıtlı proje çizelgeleme problemlerinin çözümü için matematiksel bir model

    A mathematical model for the solution of the fuzzy multi mode resource-constrained project scheduling problems

    ÖMER ATLI

    Doktora

    Türkçe

    Türkçe

    2012

    Endüstri ve Endüstri MühendisliğiHava Harp Okulu Komutanlığı

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. CENGİZ KAHRAMAN

  4. PC ler arasında veri iletişimini sağlayan bir yazılım

    A Software about data communication between PCs

    OSMAN NURİ ÖZPINAR

  5. Uydu verileri ile İstanbul Boğazı ve Haliç'de su kirliliğinin makro düzeyde belirlenmesi

    Intrepretation at macro level as pollution of water resources of remotely sensed data of Bosphorus and golden horn estuary by an unsupervised and supervised classification method

    H.GONCA COŞKUN

    Doktora

    Türkçe

    Türkçe

    1992

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    PROF. DR. CANKUT ÖRMECİ