İhtimal ağırlıklı momentler yöntemi noktalamapozisyonu formülleri ve maksimum olabilirlik yöntemi üzerine bir çalışma
Başlık çevirisi mevcut değil.
- Tez No: 38749
- Danışmanlar: PROF. DR. TEFARUK HAKTANIR
- Tez Türü: Yüksek Lisans
- Konular: İnşaat Mühendisliği, Civil Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 1994
- Dil: Türkçe
- Üniversite: Çukurova Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İnşaat Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 112
Özet
ÖZET Maksimum olabilirlik (MO) yönteminden sonra etkin bir parametre tahmin metodu olarak 1979'da ortaya atılan ihtimal-ağırlıklı momentler (lAM) yöntemi, hidrolojide yıllık taşkın pikleri serilerine uygulanan ihtimal dağılımlarında artan bir oranda kullanılmaya başlanmıştır. Hesap yükü oldukça az iken, istatistiki olarak MO yöntemine yakın anlamlılığa sahip olduğu bilinen lAM yönteminin verdiği değerler ise ara hesaplarda kullanılan noktalama pozisyonu formülü (NPF) türüne bağlı kalmaktadır. Hidrolojik tekerrür analizlerinde uygulanan 10 kadar farklı NPF mevcuttur. Bugüne kadar ilgili literatürde, NPFnün lAM yöntemince hesaplanan ihtimal-değişken ilişkisine yaptığı etki üzerinde önemli bir çalışmaya rastlanmamıştır. Yıllık taşkın pikleri frekans analizinde genelde en çok sözü edilen 3-parametreli log-normal (LN3), log-Pearson-3 (LP3), genel ekstrem değerler (GED), ve son yıllarda kullanılmaya başlanan Wakeby dağılımlarına ÎAM yöntemi uygulamasında başvurulan NPF'nün etkisi bu çalışmada detaylı istatistiksel analizler ışığında incelenmiştir. lAM yönteminin kullanılan NPF'ne duyarlılığını incelemek amacıyla bu çalışmada, bilgisayar hesap zamanı ve hafızasını optimum miktarda kullanmak gereği de göz önünde bulundurularak, dünyada son zamanlarda daha popüler olduğu anlaşılan Landwehr, (i-0.35)/n, Cunnane, ve Weibull NPF'leri ele alınmıştır. Hesaplanan ihtimal dağılımlarından dördüne de bu dört NPF uygulanmıştır, ihtimal yoğunluk fonksiyonu için açık bir ifadesi bulunmayan Wakeby dağılımına MO yönteminin tatbik edilmesi mümkün değildir. Dolayısıyla, MO yöntemi diğer üç dağılıma uygulanabilmiştir. Böylece, toplam 19 adet farklı dağılım modeli ele alınmıştır. Klasik taşkın frekans analizinde bu 19 modelden hangisi en iyi olabilir sorusuna cevap arama işlemleri iki farklı biçimde yapılmıştır. Bunlardan ilki uygulamacı mühendisler tarafından da kolayca hesaplanabilecek olan klasik uygunluk testleri analizleridir. Bu çalışmada, dünyada en popüler olan Chi2, Kolmogorov-Smirnov, ve Cramer-von-Mises uygunluk testleri tatbik edilmiştir, öncelikle, 50 ve daha fazla elemanlı, Türkiye'den 8 dünyadan 3 olmak üzere toplam 11 adet doğal akarsuların gözlenmiş yıllık taşkın pikleri serilerine bu üç uygunluk testi tatbik edilmiştir. Bunlardan Chi2 testi alışılmışın dışında daha detaylı bir biçimde uygulanmaktadır. Gözlenmiş seriler üzerinde yapılan bu klasik uygunluk testlerinin kendi aralarında bile her zaman tam bir uyuşma olmamasına rağmen, genelde Wakeby-ÎAM-Landwehr, Wakeby-tAM-(i-0.35)/n,ve LP3-lAM-Landwehr modelleri bu analizler sonucunda en başarılı olmuşlardır. Büyük ve önemli su yapılarında riskin çok küçük tutulması gereği, savak yapılarının şiddetli taşkınlardaki davranışının belirlenmesinde 100, 1000, 10000, hatta daha fazla süreli tekerrürlü pik debilerin sağlıklı tahminini daha önemli kılmaktadır. Bu bakımdan, ilgili literatürde de bahsedildiği gibi, dağılımın gözlenmiş aralığının tamamının uygunluğu hakkında fikir veren fakat ekstrem değerleri içeren sağ kuyruk kısmında yetersiz kalan klasik uygunluk testleri sonuçlan bu çalışmada en iyi dağılımı seçme kriteri olmamıştır. Burada daha ziyade 100-, 1000-, ve 10000- yıl tekerrürlü piklerin güvenilir tahminini yapabilen modeller aranmıştır. Ekstrem değerleri sağlıklı tahmin eden modellerin belirlenebilmesi amacıyla, ilgili literatürde sıkça başvurulan ve Monte carlo tekniği olarak ta bilinen yöntem ile çok uzun sentetik seriler türetilip bunlar üzerinde ilgili istatiksel analizler yapılmıştır. Bilgisayar imkanları göz önünde bulundurularak 1 1 adet istasyonun her biri için 100000 (yüzbin) elemanlı sentetik seriler türetilmiş ve bu uzun serinin kitleyi temsil ettiği kabulü yapılmıştır. Sentetik serinin nüvesi olan 0 ile 1 arasında uniform dağılımlı rastgele sayı türetme işlemi ise literatürde kabul görmüş bir bilgisayar paket programı kullanılarak gerçekleştirilmiştir. Tarihi gözlenmiş gerçek serilerden hesaplanan dağılım parametreleri kitlenin parametreleridir varsayımı yapılarak, çalışmanın genel ve anlamlı olabilmesi amacıyla, ele alınan dört adet dağılımın her birinin ayrı ayrı kitlenin esas dağılımı olduğu kabul edilmiş ve böylece her istasyon için dört farklı 100000 elemanlı sentetik seri türetilmiştir. Her bir 100000'lik sentetik seri, uzunlukları 30, 50, ve 100 olan toplam 1000 adet çakışmayan örnek serilere parçalanmıştır. Böylece toplam 1 1 istasyon için, her biri 1000 örnek seriden oluşan, 11x4x3 = 132 adet takım elde edilmiştir. Herhangi bir 1000 adet örnek seri takımında 19 farklı modelin 100-, 1000-, ve 10000-yıl tekerrürlü pikleri 1000 kere hesaplamış ve bunların baştan bilinen kitlenin 100-, 1000-, ve 10000-yıl tekerrürlü piklerinden olan bağıl sapmaları bulunmuştur. Bu 1000 adet bağıl sapmanın kendi arasındaki dağılımını pratik bir biçimde temsil eden ve literatürde kutu diyagramları olarak bilinen şekiller 19 model için ayrı ayrı çizdirilip ortalaması sıfıra en yakın ve dağılımı en dar olan modeller belirlenmeye çalışılmıştır. Kutu diyagramları analizleri olarak adlandırılan bu karşılaştırmalar bu çalışmada en iyi model seçimindeki asıl kriter olmuştur. Sözü edilen üç klasik uygunluk testleri 1000 adetlik sentetik örnek seri takımlarına datatbik edilmiş ve bunların sonuçlarının tek adet gözlenmiş serilere yapılan uygunluk testleri sonuçlarıyla uyum olduğu anlaşılmıştır. Yukarıda da söylendiği gibi, bu çalışmada ise bir modelin iyi olarak seçimindeki asıl kriter kutu diyagramları analizlerindeki başarısı olup, klasik uygunluk testlerindeki başarısı değildir. Klasik uygunluk testlerinin yapılmasındaki amaç şudur: Kutu diyagramları analizleri özel programlar gerektiren, zahmetli, ve çok bilgisayar zamanı alan analizlerdir ve normal uygulamacıların vakit ayıramıyacağı kadar külfetlidir. Klasik uygunluk testleri ise genelde yaygınlıkla hesaplanmaktadır. Dolayısıyla, bu çalışmada kutu diyagramı analizleriyle klasik uygunluk testleri sonuçlarının uyum içinde olup olmadığı da araştırılmıştır. Eğer bu uyum var olsaydı, çalışmada önemli bir sonuç olarak, klasik uygunluk testleri bulgularının ekstrem değerlerin sağlıklı tahmininde de başarılı olarak kullanılabileceği sonucuna varılacak idi. Malesef böyle bir sonuç bulunamamış, ve klasik uygunluk testleri bulguları, kutu diyagramları analizleri bulguları ile uyuşmamıştır. Böylece, bu çalışmada literatürde de bahsedilen, uygunluk testlerinin ekstrem değerlerin tahminindeki yetersizliği teyid edilmiş olmaktadır. 11 adet istasyonun çok sayıda yapılan kutu diyagramları analizleri neticesi bu çalışmada ulaşılan sonuçlar şunlardır: 1) Tek bir model aranıyorsa MO yöntemiyle hesaplanan 3-parametreli log-normal dağılımı, veya Landwehr NPF kullanılarak lAM yöntemi ile hesaplanmış log-Pearson-3 dağılımı en iyi iki dağılım olarak bulunmuştur. (i-0.35)/n NPF formülü kullanılarak İAM yöntemiyle hesaplanan GED dağılımı da bu ikisi kadar iyi denilebilir. 2) incelenen 4 farklı NPFden İAM yöntemindeki performansları açısından Landwehr en başarılı, Weibull ise en başarısız bulunmuştur. 3) Hesap yükü ÎAM yöntemininkinden çok fazla olan ve nadiren çözümü dahi olmayan MO yöntemi, GED ve LP3 dağılımları için Landwehr NPF ile hesaplanan ÎAM yönteminden üstün bulunamamıştır. MO yöntemi sadece LN3 dağılımında ÎAM-Landwehr yöntemine biraz üstün olmuştur. 4) İlgili literatürde çok methedilen beş-parametreli Wakeby dağılımının burada incelenen üç-parametreli dağılımlara belirgin bir üstünlüğü bulunamamıştır. ' Bilakis, LN3-MO ve LP3-lAM-Landwehr modelleri kutu diyagramı analizlerinde Wakebymodellerinden daha iyi performans göstermişlerdir. ÎAM yöntemi dahi çok kapsamlı olan Wakeby dağılımı bu çalışmada en iyi olarak bulunamamıştır. LN3 ve LP3 dağılımları Wakeby dağılımına tercih edilmelidir. (Uygunluk testleri ve kutu diyagramları analizlerinin tamamında kullanılan bütün data ve programlan içeren bilgisayar dosyalan tezde ilişikte sunulan diskette bulunmaktadır.)
Özet (Çeviri)
SUMMARY Aside from the method of maximum likelihood (ML), the probability-weighted moments (PWM) method, which was proposed in 1979 for the first time as an alternative approach for computing the parameters of the probability distributions used in frequency analysis of annual flood peaks series in hydrology, has been being used at an increasing rate in the recent years. However, the magnitudes of flood peaks computed by the PWM method, which is praised in the relevant literature to be almost as statistically significant as the method of ML, depend to a considerable extent on the choice of the plotting position formula (PPF) necessary for intermediate computations. There are about 10 different PPFs used in hydrologic frequency analyses. So far, a noteworthy study regarding the effect of the chosen PPF on the relationship of quantile versus probability by the method of PWM has not been found in the relevant literature. In this study, the influence of the PPF's on the outcome of the method of PWM applied to the probability distributions of 3-parameter log-normal (LN3), log-Pearson-3 (LP3), general extreme values (GEV), and to the recently popular Wakeby distribution, which are the mostly used ones in flood frequency analyses all over the world, has been investigated in a detailed way by pertinent statistical analyses. With the objective of determining the sensitivity of the method of PWM on the choice of the PPF, keeping in mind also of the necessity to use optimally the execution time and memory of the computers available, the four PPF's of Landwehr, (i-0.35)/n, cunnane, and Weibull, which apparently are among the most popular ones recently in the world, have been selected in this study. To all the four probability distributions taken into account, all four of these PPF's were individually applied for the method of PWM. The method of ML was also employed for the three 3-parameter distributions. Because the analytical expression of the probability density function of the Wakeby distribution is not possible in closed form however, the method of ML could not be applied to this distribution. Therefore, altogether 19 different probability models resulted. The procedures of searching for a tangible answer to the question of which ones of these 19 models would be the best were performed in two different ways. The first one was the straightforward execution of classical goodness-of-fit (GOF) tests, which can be applied by practicing engineers also without much difficulty. The GOF tests performed in this study were chi“, Kolmogorov-Smimov, and cramer-von-Mises. Initially, 8 streamgauging stations in Turkey, and 3 in various parts of the world having observed annual flood peaks series of 50 or greater elements were selected; and, these three GOFtests were applied to these 1 1 observed sample series. The chi”GOF test was applied in a much more detailed manner than the conventionally used way, whose details are given in the thesis. Although a consistent agreement did not exist among the three GOF tests, in general the models which scored in the uppest ranks according to these conventional GOF analyses were Wakeby-PWM-Landwehr, Wakeby-PWM-(i-0.35)/n, and LP3-ÎAM-Landwehr. Because of the fact that the risk of great hydraulic structures must be kept at considerably low values, the more accurate prediction of rare floods of 100-, 1000-, and 10000-year, and even greater return periods turns out to be a more serious problem in hydrologic studies. Therefore, results of classical GOF tests, which indicate the goodness of fit of the observed series to the analytical probabilistic model over the entire observed range of the random variable, but cannot really provide information about the right-tail extreme values computed by the models, a known fact stated in the pertinent literature also, were not considered as the criterion of chosing the better models in this study. The emphasis herein was to search for those models which would predict the extreme events such as 100-, 1000-, and 10000-year return period peaks more accurately. For the purpose of determining those models which would compute the extreme peaks more accurately, long annual flood peaks data were synthetically generated by the method known in the pertinent literature as the Monte carlo technique, and relevant statistical analyses were performed on these data. Taking into account the storage capacity of the computers available for this study, a synthetic series of 100000 (one-hundred-thousand) elements was computed for each one of the 1 1 stations, and each such 100000-element synthetic series was assumed to represent the population. The subprogram computing random numbers uniformly distributed between 0 and 1, which is an essential part of the synthetic data generation, was taken from a renowned source and used in its original form. The parameters computed for the observed series were assumed to be the parameters of the population distributions, and each one of the four probability distributions was accepted as the parent distribution. Thus, the long synthetic series were repeatedly computed four times for each one of the 1 1 stations in order to make the ensuing analyses more meaningful and comprehensive. Each 100000-element synthetic series was split into 1000 non-overlapping short sample series of 30-, 50-, and 100-elements apiece. Thus, for all the 1 1 stations, a total of 1 1x4x3 = 132 number of different sets comprising 1000 short series each were obtained. In any one of these 132 sets of 1000 shortsamples, the 100-, 1000-, and 10000-year return period peaks were computed 1000 times by each one of the 19 probability models considered, and the relative errors of these peaks from the initially known the same return period peaks of the population were computed. The distribution of these 1000 relative errors was drawn in a practical way in the form of the so-called box plot diagrams, and those models whose average relative errors were closest to zero with narrowest box plots were searched. These comparisons, which were called briefly the box plot analyses in this study, were the criterion of chosing the most suitable models. The previously mentioned three classical GOF tests were also applied to all the 1000 short synthetic series, and the outcome of these tests was found to be in close harmony with that of the GOF tests performed ononly the 1 1 observed sample series. However, its success in the box plot analyses has been the real criterion of designating a particular model as the best in this study, and not its good performance in the classical GOF tests, as mentioned before. The purpose of employing these conventional GOF tests was simply to search for any possible agreement between the results of the GOF tests and those of the box plot analyses. Because the latter always necessitates long hours of computer execution followed by long hours of visual investigation of the resultant box plot diagrams, it cannot ordinarily be carried out by a practicing engineer. Therefore, if a meaningful agreement had been found between the results of these two analyses, here a conclusion and recommendation would have been drawn stating that the best models according to conventional GOF tests were also the best ones in the sense of predicting the extreme peaks, which would have been a useful conclusion of great practical value. However, a congruence between the results of the two analyses did not exist, and the insufficiency of the conventional GOF tests in indicating the strength of a model to predict the extreme quantiles, already mentioned in the relevant literature, has thus been verified in this study also. Therefore, the models which performed better in the box plot analyses are advocated as the better ones of the 19 investigated here. The results reached in this study based on so many box plot analyses of the 11 streamgauging stations can be summarized as follows: 1) If a single best model is to be advocated, then this will be either the 3-parameter log-normal distribution whose parameters are computed by the method of ML or the log-Pearson-3 distribution computed by the PWM method using the Landwehr PPF. The GEV distribution computed by the method of PWM using the (i-0.35)/n PPF is almost as good as those two, also.2) Among the four PPFs investigated, the Landwehr PPF was found to be the best and the Weibull PPF the worst from the standpoint of their performances in the method of PWM. 3) Hie method of ML, whose total load of computations is much greater than that of the PWM method, and which does not yield any solution at all for some series, although rarely, was not found to be superiour to the PWM method using the Landwehr PPF for the distributions of LP3 and GEV. The ML method was slightly better than the PWM-Landwehr method only for the LN3 distribution. 4) A noteworthy superiority of the 5-parameter Wakeby distribution.which has received widespread positive comments in some recent literature, over the 3-parameter distributions considered herein was not found in this study. On the contrary, both the LN3-ML and the LP3-PWM-Landwehr models performed better than the Wakeby models. Moreover, the total load of computations for the Wakeby distribution even with the PWM method is considerably great Therefore, either the LN3 or the LP3 distribution should be preferred over a Wakeby model. (All the data and the computer programs used for the GOF tests and for the box plot analyses are contained within computer files in the diskette enclosed with this thesis.)
Benzer Tezler
- Ceyhan Havzasında mevcut baraj sisteminin katastrofal ve 10000 yıllık taşkınlara karşı davranışı üzerine bir araştırma
Başlık çevirisi yok
NEŞE AÇANAL
Yüksek Lisans
Türkçe
1993
İnşaat MühendisliğiÇukurova Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
PROF. DR. TEFARUK HAKTANIR
- Hidroelektrik üretimi ve taşkın zararlarının birlikte değerlendirilmesiyle Aşağı Seyhan Havzasındaki Seyhan, Çatalan, Yedigöze Barajlarının taşkınlarda optimum işletilmesi için safhalı işletim modeli
Başlık çevirisi yok
NEŞE AÇANAL
Doktora
Türkçe
1998
İnşaat MühendisliğiÇukurova Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
PROF. DR. TEFARUK HAKTANIR
- Spatio-temporal cohesive networks for evaluating team behavior in soccer
Futboldaki oyuncuların mekansal-geçici kohesiv ağlarını kullanarak takım davranışlarını değerlendirme
EMRE KÜLAH
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ HANDE ALEMDAR
- Multi-view subcellular localization prediction of human proteins
İnsan proteinlerinin çoklu görünüm yoluyla hücre içi yerleşimlerinin tahmini
GÖKHAN ÖZSARI
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET VOLKAN ATALAY