Sign predictability of intraday price returns to formulate appropriate trading strategies with optimum set of equities
Optimum hisse senedi kümesi ile uygun işlem stratejileri oluşturmak için gün içi fiyat getirilerinin işaret tahmin edilebilirliği
- Tez No: 855982
- Danışmanlar: PROF. DR. BÜLENT GÜLOĞLU
- Tez Türü: Doktora
- Konular: Ekonometri, Econometrics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: İktisat (İngilizce) Ana Bilim Dalı
- Bilim Dalı: İktisat (İngilizce) Bilim Dalı
- Sayfa Sayısı: 93
Özet
Pay piyasası getirilerinin tahmin edilmesi sayısal finans, zaman serisi ekonometrisi ve bilgisayar bilimi alanındaki araştırmacıları yoğunlaştığı bir araştırma alanı olmuştur. Ayrıca profesyonel olarak işlem yapan piyasa katılımcıları genel olarak teknik ve temel analiz yöntemleri ile tahminler yaparak kendi alım-satım stratejilerini oluşturmaya çalışmaktadır. Öte yandan finans ve ekonomi alanındaki birçok akademisyen etkin piyasalarda hisse senedi getirilerinin tahmin edilebilirliği konusunda şüpheci bir tutum benimsemektedirler. Hisse senedi fiyat getirilerinin tahminlerinin yanı sıra fiyat yönü tahmini alanında ayrıca bir literatür gelişmiştir. Bu yön tahmini çalışmalarına makina öğrenmesi, derin öğrenme ve yapay sinir ağları tekniklerinin de eklemlenmesi ile bilgisayar bilimi alanında birçok yeni çalışma ortaya çıkmıştır. Uygulamalı ekonomi alanındaki ampirik çalışmalar etkin piyasa hipotezinin geçerli olup olmadığını anlamaya çalışmak üzerine yoğunlaşırken, bilgisayar bilimi alanındaki çalışmalar daha çok farklı metotlar arasındaki tahmin başarılarını kıyaslamak amacıyla yürütülmüştür. Bu alanlardaki çalışmalar daha çok günlük ya da saatlik fiyat hareketlerini analiz ederken, Yüksek Frekanslı İşlem (High Frequencey Trading) alanındaki çalışmalar ise emir defterine ilişkin verilere bakarak anlık fiyat hareketlerine odaklanmaktadır. Borsa İstanbul hisse senedi piyasasına yönelik çalışmalarda da hem bilgisayar bilimi hem de ekonomi ve finans alanında geniş bir literatür olmakla birlikte çalışmaların çoğu piyasanın tahmin edilebildiğini ortaya koyarak piyasa etkinliğinin olmadığına işaret etmektedir. Bu tartışmalar ışığında, bu tezde Borsa İstanbul'daki 26 adet pay için pay fiyatı yönleri 5 dakikalık zaman dilimleri bazında tahmin edilmeye çalışılmıştır. 26 pay, 2018 yılında BIST 30 endeksinde yer alan paylar olup likiditesi yüksek olan paylar çalışmaya konu edilmiştir. Esas olarak 5'er dakikalık dilimlerdeki kapanış fiyatlarının yönü tahmin edilmeye çalışılmıştır. Veri seti 2018 yılını kapsayacak şekilde oluşturulmuş olup, 251 işlem günün her biri için toplamda 7 saatlik işlem seansları ve kapanış seansı dikkate alındığında her bir gün için 84 adet veri noktası tahmin edilmeye çalışılmıştır. Komisyon masrafları ve fiyat adımları dikkate alındığında bir alım ya da satım işleminin maliyetinin 2.5 bps olacağı hesaplanarak, bunun 6 katı olan 15 bps artı ya da eksi yön eşiği olarak belirlenmiştir. Eğer 5 dakikalık pay kapanış fiyatı bir önceki kapanış fiyatının %0.15 ya da daha fazla üzerindeyse hisse“pozitif”yönde, %0.15 ya da daha fazla altında ise hisse“negatif”yönde, bu ikisi arasında kalmışsa“durağan”olarak etiketlenmiştir. Böylece pozitif ya da negatif sinyallerin ekonomik olarak da anlamlı bir sonuç doğuracak şekilde belirlenmesi amaçlanmıştır. Tahminci olarak Borsa İstanbul'un, veri sağlayıcılar üzerinden piyasa katılımcılarına sunulan“veri analitikleri”kullanılmıştır. Veri analitikleri o anki emir defterine ilişkin anlık, son bir dakikalık ve son beş dakikalık 39 adet farklı istatistiği saniyelik olarak güncelleyecek şekilde kullanıcılara sunmaktadır. Özellikle son 5 dakikaya ilişkin istatistiklerin sağlanıyor olması bu çalışmada 5 dakikalık fiyat hareketlerinin analiz edilmesine karar verilmesinde etken olmuştur. Her bir hisse için ilgili veri, ilgili saniye için güncellenecekse, veri girişi yapılmakta, eğer veride bir güncelleme yoksa yeni bir veri sağlanmamaktadır. Ham verinin bu kompleks yapısından dolayı öncelikle Python kodları kullanılarak verilerin kullanışlı bir şekilde işlenmesi sağlanmıştır. Örneğin geçmiş beş dakikaya ilişkin bir istatistiği sunan bir analitik için herhangi bir beşinci dakikanın son saniyesinde veri oluşmuyorsa, bu istatistikle ilgili sunulan saniyelik veri geriye doğru taranmış ve geçmiş 150 saniyeye kadar bir veri girişine rastlanmışsa bu veri kullanılmış, yoksa ilgili beş dakika için bu verinin olmadığı varsayılmıştır. Aynı şekilde bir dakikalık istatistikler için geçmiş 30 saniye taranmış, günlük kümülatif veriler içinse günün ilk saniyesine kadar tarama yapılıp ilgili analitiğin son güncellenen hali veri tablosuna eklenmiştir. Sonrasında tüm makine öğrenmesi algoritmalarının düzgün şeklide çalışabilmesi için standart ölçeklendirme yapılmış ve verimliliği artırmak için verinin boyutları düşürmek amacıyla Principal Component Analysis (PCA) metodu kullanılmıştır. PCA kullanılırken 39 veri analitiğinin volatilitesinin en az %60'ını karşılayacak şekilde her bir hisse için açıklayıcı değişken sayısı 4, 5 ya da 6 olarak belirlenmiştir. PCA uygulandığı ya da uygulanmadığı durumlarda elde edilecek ölçüm sonuçlarının anlamlı bir şekilde değişmediği ayrıca istatistiksel olarak ortaya konulmuştur. 2018 yılı bütünü için 26 adet hissede , Python kodları kullanılarak 7 farklı makine öğrenmesi algoritması ile yön tahminlemesi yapılmıştır. Kullanılan metotlar, Lojistik Regresyon, K-en Yakın Komşu, Destek Vektör Makinaları-rbf ve Destek Vektör Makinaları-sigmoid, Naive Bayes, Karar Ağacı ve Rastgele Orman'dır. Bunun için veri randomize edilmeden kronolojik olarak ilk %95 oranındaki kısmı eğitim verisi, son %5'lik kısmı ise test verisi olarak kullanılmıştır. 26 hisse için MA F-Measure sonuçları raporlanmıştır. Eğitim verisindeki veriler baz alındığında, rastgele bir tahminleme yapılarak elde edilecek beklenen tahmin başarısı MA F-Measure olarak hesaplanmış ile makina öğrenmesi metotlarının MA F-Measure performansı hesaplanan MA F-Measure ile kıyaslanmıştır. Bu noktada makina öğrenmesi algoritmalarının karışıklık matrisleri üzerinden hesaplanan MA F-Measure güven aralıkları kullanılarak yapılan tahmin performanslarının istatistiki anlamda anlamlı olup olmadıkları ortaya konulmuştur. Bu istatistiki yöntem ekonomi ve finans alanında oldukça yeni bir yöntemdir. Ayrıca iki yerine 3 sınıf etiketleme yapılarak akademik literatürde daha az görülen ancak algoritmik işlem geliştiren veri analizcilerinin uygulamalarına daha yakın bir metodoloji seçilmiştir. 5 dakika öncesindeki tahmin sonuçlarına bakıldığında 26 hisseden 9'unun istatiksel olarak anlamlı bir şekilde tahmin edilebildiği gözlemlenmiştir. K-en Yakın Komşu, Karar Ağacı ve Rastgele Orman en çok anlamlı tahmin sağlayan metotlar olarak öne çıkmıştır. Naïve Bayes ve Destek Vektör Makinaları-sigmoid ile de bazı hisseler için anlamlı sonuçlar elde edilmiştir. Lojistic Regresyon ve Destek Vektör Makinaları-rbf ise hiçbir hisse senedi için istatistiksel olarak anlamlı tahmin sağlayamamıştır. Tahmin verisi 5 dakika öncesinden 10 dakika öncesine alındığında sadece 4 adet hissenin anlamlı şekilde tahmin edilebildiği, süre daha yukarısına alındıkça tahmin edilebilen hisse adedinin azaldığı tespit edilmiştir. Bu da makina öğrenmesi algoritmalarının tahmin gücünün daha uzun süreler için zayıfladığını, diğer bir ifade ile Borsa İstanbul veri analitiklerinin bu hisseler için piyasa tarafından 5 dakikada olmasa da daha uzun sürelerde fiyatlara yansıtıldığını göstermektedir. İstatistiksel sonuçlara ek olarak tezin bir sonraki bölümünde, istatistiksel olarak anlamlı şekilde iyi performans gösteren tahmin sonuçlarının ekonomik olarak da fayda sağlayıp sağlamadığı irdelenmiştir. Bu kapsamda öncelikle açığa satışa izin veren ve izin vermeyen iki farklı alım-satım stratejisi belirlenmiştir. Açığa satış olmadığı durumda Makine öğrenmesi metotları ile elde edilen 5 dakika sonrasına ilişkin“yukarı, aşağı ve durağan”etiketi tahminleri, test verisi üzerinde“al, sat ve pozisyonunu koru”sinyali olarak değerlendirilmiş ve bu şekilde yapılacak bir alım-satım stratejisinin hissenin kendi performansı (al ve tut) ile kıyaslaması yapılmıştır. KOZAA, KOZAL ve KRDMD hisselerinde makina öğrenmesi algoritmalarına dayanılarak yapılan alım-satımda hissenin kendi performansına göre daha fazla getiri ya da daha az zarar elde edildiği tespit edilmiştir. Açığa satış olan durumda ise, Makine öğrenmesi metotları ile elde edilen 5 dakika sonrasına ilişkin“yukarı, aşağı ve durağan”etiketi tahminleri, test verisi üzerinde“al, açığa sat ve pozisyonunu koru”sinyali olarak değerlendirilmiş ve bu şekilde yapılacak bir alım-satım stratejisinin hissenin kendi performansı (al ve tut) ile kıyaslaması yapılmıştır. KOZAA, KOZAL, KRDMD ve TKFEN hisselerinde Machine Learning algoritmalarına dayanılarak yapılan alım-satımda hissenin kendi performansına daha iyi bir performans elde edildiği tespit edilmiştir. Açığa satışın olduğu ve olmadığı makina öğrenmesi temelli alım-satım stratejilerinin, test dönemi boyunca gösterdikleri getiri performansları ve hisselerin kendi fiyat performansları ayrıca grafiksel olarak gösterilmiştir. Sonuçlar Borsa İstanbul tarafından sağlanan ve emir defterine ilişkin günlük, son bir dakikalık ve son beş dakikalık istatistiklerden oluşan“veri analitiklerinin”henüz piyasa katılımcıları tarafından 2018 yılında verimli bir şekilde kullanılmadığını, bu nedenle bu veri kullanılarak yapılan çalışmanın sadece istatistiksel değil, ekonomik olarak da anlamlı bir fayda sağlayacak tahminler için kullanılabildiğini göstermiştir. Yarı Güçlü Form Etkin Piyasa Hipotezine göre ulaşılabilir verinin piyasa tarafından fiyatlara yansıtıldığı varsayılmaktadır. Bu bakımdan bu araştırma tezinde yukarıda sayılan 4 hisse piyasası için Yarı Güçlü Form Etkin Piyasa'nın geçerli olmadığı sonucuna erişilmiştir. Bu araştırmada kullanılan metot ve teknikler özellikle profesyonel piyasa analistlerinin pratiklerine uygun olarak seçilmekle beraber- analizler bilimsel literatürdeki çalışmalara uygun olarak sunulmuştur. Bu bakımdan“yukarı, aşağı ve durağan”şeklinde üç boyutlu karışıklık matrislerinin oluşturulması, bu matrisler üzerinden MA F-Measure verilerinin standart sapma ve güven aralıklarının belirlenmesi, bu güven aralıklarının teorik bir MA F-Measure ile kıyaslanması ve üç çeşit sinyal oluşturularak alım-satım stratejilerinin geliştirilmesi diğer araştırmacılar için budan sonraki çalışmalarda yol gösterici olacaktır.
Özet (Çeviri)
The prediction of stock market returns has been a focused research area for computational finance, time-series econometrics, and computer science researchers. Typically, market participants rely on technical and fundamental analyses to make predictions, determining their buy or sell strategies based on these assessments. However, scholars in finance and economics have remained skeptical about the predictability of stock returns, particularly in efficient markets. Besides the stock market earnings, a literature on capital martket's direciton predcition has been emerged. Studies in the field of computer science also supported this research area with the help of machine lerning, deep lerning and artifical neural network techniques. Empirical studies in applied economics focuses on efficient market hypotesis whereas computer science studies mostly compares prediction performances of diffirent techniques. In this thesis, closing price direction of 26 stocks in 5 miutes intervals predictited. Only the higly liquid stocks existed in the BIST 30 index for the entire year of 2018 are examined. The data includes 251 trading days and 84 data nodes for each day. Transaction costs are considered to be 2.5 bps and 15 bps is determined as the treshold for a direction signal. If 5 minute closing price of an equity went up by 0.15 percent, it is tagged as“positive”and the opposite as“negative”and the inbetween in considered“steady”to achieve economically significant results. A significant data source—Borsa Istanbul's 'data analytics' information distributed through data vendors—is utilized. There are 39 analytics providing order book statistics regarding for last 1 minute, 5 minute and intraday periods. Initially, a specific method for extracting valuable insights from the complex raw data of Borsa Istanbul is described and implemented. Subsequently, standard scaling and dimension reduction methods, such as Principal Component Analysis, are employed to enhance efficiency. Seven different machine learning algorithms, Logistic Regression, K-Nearest Neighborhood, Support Vector Machines with radial and sigmoid kernels, Naïve Bayes, Decision Tree, Random Forest, are compared. All the methods trained with former 95 percent and tested using the last 5 percent of the complete dataset of the year 2018. The performance levels of each method for twenty-six highly liquid stocks are assessed in terms of Macro Averaged F-Measures. Furthermore, in this thesis, the effectiveness and significance of machine learning algorithms are compared using confidence intervals calculated from the confusion matrices for Macro Averaged F-Measures—an innovative approach within the economics and finance literature. Additionally, the use of three classes for stock price directions 'positive ,' 'negative“ and 'steady' rather than just two is a rare aspect in academic studies, aligning more closely with data analytics practitioners' methodologies. Concerning the 5-minute lagged data, a statistically significant predictability is found in nine of the equities. K-Nearest Neighbors, Decision Tree and Random Forest yielded significant predictions. Naïve Bayes and SVM-sigmoid achieved better for a few equites while Logistic Regression and SVM-rbf not for any. However, for the 10 and 60-minute lagged data, predictability remains only in four and none of the equities, respectively. Essentially, markets assimilated Borsa Istanbul's data over time for those equities. Moreover, economic gains for the nine equities are analyzed with algorithms not allowing short selling and allowing short selling, based on these predictions. 'Positive”, 'negative' and 'steady' signs treated as 'buy', 'sell' and 'keep the position' signals in the first scenerio while 'steady' allowed as the 'short-sell' signal in the second scenerio. Those scnerios are compared with passive buy and hold strategy and it has been revealed that determined trading strategies depending on the machine lerning algorithms performs higher earnings or less losses for KOZAA, KOZAL and KRDMD stocks when short selling is not allowed. If short selling is allowed TKFEN is also added to this list. Test period performances of the determined trading strategies and the stocks' own price performances are graphically illustrated in the thesis. Since four equities are observed to generate higher economic gains through machine learning-supported trading strategies compared to their own price performances, these findings for those wquities indicate, within the framework of the 'Efficient Market Hypothesis,' a lack of 'Semi-strong-form efficiency.' The methods and techniques used in this study such as creating tree dimensional confusion matrices, determining standard deviation and confidence intervals for MA F-Measures, and benchmarking them with a theorical MA F-Measure and developing trading strategies with three signals will support further research.
Benzer Tezler
- Finansal krizlerin öncü göstergeler ışığında öngörülebilirliği ve Türkiye örneği
Predictability of financial crises in the light of leading indicators and Turkey example
NURDAN CAN
- Androgenetik alopesilerde trikoskopik bulguların şiddet ile ilişkisi
Association of trichoscopic findings in androgenetic alopecias with severity
MUSTAFA BARIŞ GÜNAYDIN
Tıpta Uzmanlık
Türkçe
2022
DermatolojiÇukurova ÜniversitesiDeri ve Zührevi Hast. Ana Bilim Dalı
PROF. DR. MEHMET KARAKAŞ
- Β-hCG değeri 5000 mıu/ml' den yüksek ektopik gebeliklerde modifiye multidoz metotreksat tedavisinin etkinliğinin araştırılması
Investigation of the effectiveness of modified multidose metotrexate treatment in ectopic pregnancies with β-hCG values higher than 5000 miu/ml
UMUR GÖKTUĞ ÜNLÜ
Tıpta Uzmanlık
Türkçe
2023
Kadın Hastalıkları ve DoğumSağlık Bilimleri ÜniversitesiKadın Hastalıkları ve Doğum Ana Bilim Dalı
PROF. DR. NİYAZİ TUĞ
- Adaptif piyasalar hipotezinin Borsa İstanbul 100 endeksinde test edilmesi
Testing adaptive market hypothesis in Borsa İstanbul 100
FATMA KÖSE İÇİGEN
- Short term predictable patterns following price shocks conditional on characteristics of information signals, foreign investment and investor confidence: Evidence from Istanbul Stock Exchange
Bilgi işaretleri özellikleri, yabancı yatırım ve yatırımcı güvenine bağlı fiyat şokları sonrası kısa vadeli tahmin edilebilir eğilimler: İMKB üzerine bir uygulama
ÖZGEHAN ULUSAVAŞ
Doktora
İngilizce
2010
İşletmeYeditepe ÜniversitesiMuhasebe ve Finansman Ana Bilim Dalı
YRD. DOÇ. DR. HATİCE GAYE GENCER