Geri Dön

Modeling brokerage firm behavior in borsa istanbul using inverse reinforcement learning

Ters pekiştirmeli öğrenme yöntemiyle aracı kurum davranışlarının modellenmesi

  1. Tez No: 947990
  2. Yazar: KUBİLAY KARAÇAM
  3. Danışmanlar: DR. ÖĞR. ÜYESİ MEHMET YASİN ULUKUŞ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Endüstri ve Endüstri Mühendisliği, Computer Engineering and Computer Science and Control, Industrial and Industrial Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: İngilizce
  9. Üniversite: İstanbul Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Veri Mühendisliği ve İş Analitiği Ana Bilim Dalı
  12. Bilim Dalı: Büyük Veri ve İş Analitiği Bilim Dalı
  13. Sayfa Sayısı: 139

Özet

Bu tez finansal piyasalarda hisse senedi işlemlerinin ardındaki dinamikleri ve özellikle aracı kurumların bu piyasalardaki rolünü derinlemesine incelemeyi hedeflemektedir. Finansal piyasalarda alım-satım işlemlerinin ve fiyat oluşumunun altında yatan etkenler piyasa likiditesi, fiyat keşfi ve genel piyasa istikrarı açısından kritik öneme sahiptir. Aracı kurumlar büyük işlem hacimleri ve piyasa içindeki aktif rolleri nedeniyle hem yatırımcıların karar mekanizmalarında hem de düzenleyici kurumların politikalarında etkili olmaktadır. Bu nedenle aracı kurumların işlem stratejilerinin, tercih ettikleri yöntemlerin ve algoritmaların incelenmesi piyasaların daha iyi anlaşılması ve verimliliğin arttırılabilmesi için önemli bilgiler sunmaktadır. Tezde veri seti olarak piyasa dinamiklerine göre seçilen on farklı hisse senedi özelinde yaklaşık 2,5 yıl boyunca (587 gün) kaydedilmiş işlem verileri kullanılmaktadır. Veri setinde aracı kurumlara ait işlem hacmi, işlem maliyeti, net işlem büyüklüğü gibi niceliksel bilgiler yer alırken aracı, aracı kimliği, miktar, maliyet, yüzde, net miktar gibi ayrıntılı değişkenler de bulunmaktadır. Ayrıca, bu verilerle birlikte alım ve satım sinyallerini üreten yedi farklı teknik gösterge de hesaplanmış olup bu göstergeler aracı kurumların alım-satım kararlarının temelinde yer alan sinyal ve uyarı mekanizmalarını ortaya çıkarmak için kullanılmaktadır. Araştırmada aracı kurumların karar mekanizmalarını ve işlem stratejilerini ortaya çıkarmak amacıyla iki farklı yöntem uygulanmıştır. Bunlar lineer tersine pekiştirmeli öğrenme (LIRL) ve maksimum entropi tersine pekiştirmeli öğrenme (MaxEnt IRL) yöntemleridir. LIRL yöntemi, gözlemlenen işlem davranışları üzerinden basit ve doğrusallaştırılmış bir ödül fonksiyonunun tahmin edilmesine olanak tanımakta iken MaxEnt IRL yöntemi ise gözlemlenen davranışların daha genelleyici ve belirsizlik içeren ödül yapılarının modellenmesinde avantaj sağlamaktadır. Her iki yöntem de aracı kurumların tercihlerini ne şekilde belirlediklerine dair önemli ipuçları sunarak işlem stratejilerinin altında yatan motivasyon ve hedeflerin anlaşılmasını sağlamaktadır. Veri setine ilişkin ilk analiz aşamalarında birleştirme, ön işleme ve veri temizleme adımları dikkatlice gerçekleştirilmiştir. İşlemlerin karmaşıklığını azaltmak ve modellemeye uygun hale getirmek için teknik göstergeler hesaplanarak işlem verilerine entegre edilmiştir. Fiyat hareketleri ve işlem hacmi gibi değişkenler kullanılarak hesaplanan teknik göstergeler sayesinde alım-satım sinyalleri oluşturulmuştur. Bu stratejik sinyaller sayesinde piyasanın dinamikleri hakkında derinlemesine bilgi elde edilmekte ve aracı kurumların hangi noktalarda risk veya fırsat algısı geliştirdikleri ayrıntılı bir şekilde analiz edilebilmektedir. Tezin metodolojik yapısı iki farklı tersine pekiştirmeli öğrenme yönteminin (LIRL ve MaxEnt IRL) uygulanmasına dayanmaktadır. Bu yöntemler, aracı kurumların gözlemlenen işlem davranışlarından yola çıkarak işlem sonrası elde ettikleri ödüllerin altında yatan yapıyı ortaya çıkarmayı hedeflemektedir. Yöntemsel süreçte, önce aracı kurumların işlem eylemleri ve bu eylemlerin piyasa üzerindeki etkileri detaylı olarak modellenmiştir. Sonrasında ise elde edilen gözlemler doğrultusunda ödül fonksiyonları tahmin edilmiştir. Bu analiz sürecinde verinin, teknik göstergelerden elde edilen sinyallerle birlikte değerlendirilmesi hem modelin doğruluğunu hem de piyasa içindeki dinamiklerin daha iyi kavranmasını sağlamıştır. Benzer şekilde gözetimli öğrenme yöntemleri de paralel olarak uygulanmış ve bu yöntem ile gözlemlenen işlem davranışlarının sınıflandırılması ve modelleme sürecinin desteklenmesi amaçlanmıştır. Bu sayede farklı modelleme tekniklerinin etkinliği karşılaştırılmış ve hangi yöntemin aracı kurum davranışları üzerinde daha başarılı sonuçlar verdiği tartışılmıştır. Araştırmada kullanılan tersine pekiştirmeli öğrenme yaklaşımlarının geleneksel yöntemlere kıyasla davranışların altında yatan motivasyonları daha net ortaya koyabilme özelliğine sahip olduğu düşünülmektedir. Bu sayede aracı kurumların sadece kısa vadeli işlem tercihlerine odaklanılması yerine uzun vadeli stratejileri de incelenebilmektedir. Özellikle LIRL yöntemi aracılığıyla elde edilen sonuçlar sayesinde aracı kurumların belirli fiyat ve hacim aralıklarında nasıl davrandıklarına dair net ipuçları ortaya çıkartılmaktadır. Benzer şekilde MaxEnt IRL yöntemi sayesinde ise belirsizlik durumunda hangi stratejilerin önem arz ettiğinin incelenmesi mümkün olmaktadır. Bu iki yöntemin birlikte kullanılmasıyla piyasanın karmaşıklığının ve aracı kurum davranışlarının esnek yapısının daha kapsamlı bir şekilde modellenebilmesi mümkün olmaktadır. Araştırma bulguları aracı kurumların işlem kararlarında teknik göstergelerin belirleyici rol oynadığını ortaya koymaktadır. Teknik göstergeler kullanılarak yaratılan alım-satım sinyalleri sayesinde aracı kurumların piyasa işlemleri çözümlenebilmiştir. Bu durum ile piyasa dinamiklerinin sadece sayısal verilerle açıklanamayan yönlerinin de ortaya çıkartılması mümkün olmuştur. Ayrıca tez kapsamında yapılan analizler tersine pekiştirmeli öğrenme yöntemlerinin finansal piyasalarda aracı kurum davranışlarının modellenmesinde etkili bir yöntem olduğunu da göstermektedir. Elde edilen sonuçlar sayesinde aracı kurumların işlem stratejilerinde sadece piyasa verilerine dayanan kararlar almadıkları aynı zamanda geçmiş deneyimler ve teknik sinyaller ışığında daha karmaşık ve dinamik stratejiler geliştirdikleri ortaya çıkartılmıştır. Ayrıca, geliştirilen modellerin gelecekte benzer veri setleri kullanılarak daha derinlemesine analizler yapılmasına olanak tanıyacak yapıda tasarlanması hedeflenmiştir. Tezin sonuçları aracı kurum davranışlarının daha iyi anlaşılmasının finansal piyasalarda verimliliğin arttırılması ve düzenleyici politikaların oluşturulması açısından büyük önem taşıdığını ortaya koymaktadır. Araştırmanın bulguları yatırımcıların ve piyasa analistlerinin piyasa hareketlerini daha doğru tahmin etmelerine ve düzenleyici kurumların piyasa istikrarını sağlama konusunda yeni stratejiler geliştirmesine olanak tanımaktadır. Bu bağlamda tersine pekiştirmeli öğrenme yöntemleri sadece akademik literatürde yenilikçi bir yaklaşım sunmakla kalmayıp aynı zamanda uygulamalı alanda da geniş çaplı kullanım potansiyeline sahip olduğu düşünülmektedir. Yapılan analizler sırasında veri ön işleme, teknik göstergelerin hesaplanması ve modelleme adımları büyük bir titizlikle gerçekleştirilmiştir. İşlem verilerinin yanı sıra teknik göstergelerden elde edilen alım-satım sinyallerinin entegre edilmesi modellemeye büyük katkı sağlamıştır. Aracı kurumların piyasa dinamikleri içinde nasıl bir rol oynadıkları, işlem stratejilerinin hangi değişkenlere bağlı olduğu ve bu stratejilerin zaman içindeki değişimi yapılan kapsamlı veri analizi sayesinde ayrıntılı olarak ortaya konulmuştur. Bu süreçte verinin kalitesi ve işlenebilirliği model tahminlerinin doğruluğu üzerinde önemli bir etkiye sahip olmaktadır. Bu nedenle, veri temizleme ve ön işleme adımları tüm metodolojik sürecin temel taşlarından biri olarak ele alınmıştır. Tezde kullanılan denetimli öğrenme teknikleri sayesinde tersine pekiştirmeli öğrenme yöntemleri ile elde edilen sonuçların doğrulanması ve model performansının karşılaştırılması hedeflenmektedir. Gözlemlenen işlem davranışlarının sınıflandırılması ve modellerin karşılaştırmalı analizinin yapılması farklı yöntemlerin hangi noktalarda birbirini tamamladığını ve hangi durumlarda daha başarılı sonuçlar verdiğini göstermiştir. Özellikle, denetimli öğrenmenin sağladığı sınıflandırma sonuçları sayesinde tersine pekiştirmeli öğrenme ile ortaya çıkarılan ödül fonksiyonlarının doğrulanması mümkün olmaktadır. Araştırmanın genel sonuçları aracı kurumların finansal piyasalardaki rolünün ve işlem stratejilerinin karmaşıklığını gözler önüne sermekte ve bu alanda yeni modelleme yaklaşımlarının geliştirilmesi için önemli bir temel oluşturmaktadır. Elde edilen veriler sayesinde aracı kurumların sadece basit veya öngörülebilir davranışlar sergilemediği aksine piyasanın dalgalı doğasıyla uyumlu, dinamik ve sürekli evrilen stratejiler benimsediğini ortaya çıkartılmıştır. Sonuç olarak, finansal piyasalarda aracı kurumların işlem stratejilerinin, kullandıkları teknik sinyallerin ve tercihlerinin derinlemesine analizi bu tezde işlenerek önemli bulgulara ulaşılmıştır. Uygulanan tersine pekiştirmeli öğrenme yöntemleri sayesinde piyasa riskleri, trend analizi, fiyat keşfi ve piyasa likiditesi gibi kavramların daha iyi anlaşılması mümkün olmaktadır. Ek olarak farklı modelleme tekniklerinin karşılaştırmalı analizi ileriye dönük çalışmalarda kullanılabilecek metodolojik yaklaşımların geliştirilmesinde yol gösterici nitelik taşımaktadır. Bu bağlamda tezin sunduğu veriler ve analizler hem yatırımcılar hem de düzenleyici kurumlar açısından piyasa yapısının daha doğru yorumlanabilmesi için değerli bilgiler sunmaktadır. Bütün bu analizler ışığında aracı kurumların finansal piyasalar üzerindeki etkileri daha iyi kavranmıştır ve modelleme tekniklerindeki yenilikçi yaklaşımlar sayesinde işlem stratejilerinin altında yatan motivasyonların ve ödül fonksiyonlarının yapıları ayrıntılı bir şekilde ortaya konmuştur. Tezden elde edilen veriler ile piyasaların işleyiş mekanizmalarının daha sağlıklı yorumlanması, risk ve fırsatların doğru tespit edilmesi ve düzenleyici politikaların geliştirilmesi mümkün olabilmektedir. Araştırma bulgularının gelecekte benzer modelleme yaklaşımlarının genişletilmesi ve farklı piyasa koşullarına uyarlanması bakımından yol gösterici olması beklenmektedir. Bu kapsamlı çalışma finansal piyasalarda aracı kurum davranışlarının modellenmesinde yeni ve etkili yöntemlerin kullanılabileceğini göstermekte ve bu alanda yapılacak ileri çalışmalar için sağlam bir metodolojik temel sunmaktadır. Elde edilen sonuçlar, aracı kurumların karar verme süreçlerinde teknik göstergelerin önemini gözler önüne sererken piyasa verimliliğini artırmaya yönelik stratejilerin geliştirilmesinde de önemli ipuçları sunmaktadır. Bu tez çalışması sayesinde finansal piyasaların dinamiklerine ilişkin bilgiler derinleştirilmiş ve aracı kurumların rolü daha iyi tanımlanarak hem akademik literatüre hem de uygulamaya yönelik katkılar sağlanmıştır. Ek olarak araştırmanın sonuçları ileriye dönük piyasa analizleri ve stratejik karar süreçlerinde kullanılabilecek zengin veriler halinde sunulmuştur. Özetle, bu tez sayesinde veri madenciliği, teknik gösterge analizi ve tersine pekiştirmeli öğrenme gibi modern yöntemlerin entegrasyonu ile aracı kurumların piyasaların işleyişindeki rolü kapsamlı bir şekilde ortaya konulmaktadır. Böylelikle finansal piyasalarda risk yönetimi, fiyat oluşum mekanizmaları ve likiditenin sağlanması konularında önemli tartışmalara zemin hazırlanmaktadır. Elde edilen bulgular aracı kurumların yalnızca işlem hacmi ve fiyat hareketleri üzerinden değil aynı zamanda karmaşık ödül fonksiyonları ve sinyal analizleri temelinde stratejik kararlar aldığını göstermektedir. Bu sayede piyasanın karmaşıklığı ve algoritmik ticaretin gelecekteki potansiyeli hakkında değerli bir içgörü sunulmaktadır. Sonuç itibarıyla tezin sunduğu kapsamlı analiz ve modelleme çalışması sayesinde finansal piyasalarda aracı kurum davranışlarının anlaşılması, stratejilerin geliştirilmesi ve düzenleyici politikaların oluşturulması konularında gelecek çalışmalara önemli bir katkı sağlanılması hedeflenmektedir. Bu sayede hem akademik çevrelerde hem de uygulamalı finans dünyasında verimliliğin ve piyasa istikrarının artırılmasına yönelik çalışmaların desteklenmesi amaçlanmaktadır.

Özet (Çeviri)

Stock transactions in financial markets and the dynamics behind these transactions is an important topic that attracts the attention of investors in both academic and applied fields. In this thesis, the effects of brokerage firms on market price formation, liquidity and overall market stability are analyzed using a detailed data analysis and advanced machine learning methods. The study is based on a large data set covering a period of approximately 2.5 years (587 days) for ten different stocks selected according to market dynamics. This data set includes detailed variables on the trading history of brokerage firms as well as seven different technical indicators that generate buy and sell signals. In this study, two main methods are used to reveal the trading strategies and decision processes of brokerage firms. First, the linear inverse reinforcement learning (LIRL) method is used to estimate the reward functions behind brokerage firms' preferred actions. Second, the maximum entropy inverse reinforcement learning (MaxEnt IRL) method aims to model the observed trading behavior with a more generalized reward structure. During the implementation of these two methods, preprocessing such as data cleaning, merging and calculation of technical indicators were carefully performed. Moreover, the results obtained with the supervised learning methods are evaluated comparatively and the effectiveness of different modeling techniques is demonstrated. The results of the analysis show that the intrinsic motivations and strategies that play a decisive role in the trading preferences of brokerage firms can be successfully uncovered through inverse reinforcement learning methods. The findings reveal that signals derived from technical indicators are an effective preference criterion for brokerage firms' trading decisions and contribute to a better understanding of market dynamics. This study aims to provide an innovative approach to the modeling of brokerage firm behavior in financial markets and paves the way for the development of strategic recommendations to improve market efficiency for both investors and regulators.

Benzer Tezler

  1. Bankacılıkta değişim yönetimi

    Change management in banking

    AYDIN ARGIN

    Doktora

    Türkçe

    Türkçe

    2000

    BankacılıkMarmara Üniversitesi

    Bankacılık Ana Bilim Dalı

    PROF. DR. NAZIM EKREN

  2. Tedarik zinciri yönetiminde yapay zeka uygulamaları ve çözüm modelleri üzerine bir araştırma

    A research about artificial intelligence applications in supply chain management

    KEREM ŞAHİNBOY

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    UlaşımNişantaşı Üniversitesi

    İşletme Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SERKAN AKGÜN

  3. Kripto para birimi: Bitcoin' in getiri oynaklığının otoregresif koşullu değişen varyans modelleri ile tahmini

    Crypto currency: Estimation of the return volatility of Bitcoin by autoregressive conditional variable models

    SALİH HOŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    EkonomiHitit Üniversitesi

    İktisat Ana Bilim Dalı

    DOÇ. DR. SERDAR VARLIK

  4. Profesyonel bürokrasilerde güç dengeleme çabaları: Uzmanlık, özerklik ve sosyal ağ ilişkisi

    Power balancing efforts in professional bureaucracies: Relationships among expertise, autonomy, and social network

    MERAL KIZRAK

    Doktora

    Türkçe

    Türkçe

    2019

    SosyolojiBaşkent Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. MEHMET ABDÜLKADİR VAROĞLU

  5. Eğitimde kanıt temelli uygulama ve politika geliştirme

    Evidence based practice and policy development in education

    YUSUF CANBOLAT

    Yüksek Lisans

    Türkçe

    Türkçe

    2016

    Eğitim ve ÖğretimGazi Üniversitesi

    Eğitim Bilimleri Ana Bilim Dalı

    PROF. DR. MEHMET ÇAĞATAY ÖZDEMİR