Geri Dön

Kriptoparalarda kümeleme analizi uygulamaları

Cluster analysis applications of cryptocurrencies

  1. Tez No: 782328
  2. Yazar: EZGİ DOĞAN
  3. Danışmanlar: PROF. DR. NİZAMETTİN BAYYURT
  4. Tez Türü: Yüksek Lisans
  5. Konular: Endüstri ve Endüstri Mühendisliği, İstatistik, Industrial and Industrial Engineering, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: İstanbul Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Endüstri Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 159

Özet

İnsanlar tasarruflarını her zaman en fazla getiri sağlayacak yatırım araçlarını gözeterek değerlendirmek ister. Bu amaca istinaden her zaman yeni ürünler geliştirilir ve farklı kısıtlar altında bu ürünler kullanılır. Blokzincir (Blockchain) teknolojisinin Bitcoin'i hayata geçirmesiyle yatırımcılar için artık yeni bir alan ortaya çıkmış oldu. İş yapış şekillerinde radikal birçok değişikliğe yol açtığı ve daha birçok sektör için de gelecek vadettiği literatürde de bahsedilmektedir. Özellikle para politikalarına ve finans sektörüne çoktan tesir ettiği ve bu durumun devamının da geleceği söylenebilir. Dağıtık mimariyle merkezi otoriteyi ortadan kaldırması, kriptografi sayesinde şeffaf ve yüksek güvenlikli olması, daha hızlı ve daha az maliyetli işlem yapılmasına olanak vermesi kriptoparaları cazip hale getiren faktörlerdir. Son on yıllık süreçte boyunca, ilginin global ölçekte giderek artması yeni yeni kriptoparaların ve kripto borsaların ortaya çıkmasına yol açmıştır. Aralık 2022 tarihi itibariyle yaklaşık 856 milyar Amerikan doları bazında piyasa değerine ve 24 milyar Amerikan doları kadar günlük işlem hacmine sahip olan kripto piyasası ile pazar büyüklüğü ortadadır. 530'u geçen çeşitli kripto borsalarında işlem görebilen 22.000'i aşan kriptopara çeşidinin olması, yatırımcıların veya kullanıcıların hangi kriptolara yönelip tercih yapacakları hususunda zorlaştırıcı bir etmen olduğunu söylenebilir. Zira yüksek fiyat oynaklığına sahip kripto piyasası, yüksek getiri sağlayabileceği gibi yatırımcıları hüsrana uğratabilecek çok büyük zararlara da yol açabilir. Bu çalışmada kriptoparaların birkaç kullanım amaçlarından bir tanesi olan yatırım amacına ağırlık verilmiştir. Çalışmanın motivasyonunu sağlayan ise yatırımcılar için kritik hale gelen kriptopara tercih etme sürecini kolaylaştırma gayesiyle seçili kriptolar özelinde özetleyici ve fikir verici bilgiler sunmaktır. Bu sayede bazı bilinmezliklerin çözülmesi ve tercih sahasının daralması sağlanır. Ayrıca literatürdeki kripto birimlerine yönelik yer alan çoğu istatistiksel çalışmanın, fiyat tahminleme ve kriptoların birbirleriyle veya diğer para piyasalarıyla olan nedensellik ilişkilerine dayandığı görülmüştür. Bu tezde ortaya konulan çalışma, kriptoparalara yönelik tanımlayıcı/betimleyici/özetleyici istatistiksel bir veri analitiği sürecini kapsadığı için literatüre kripto ekosistemi temelinde katkı sağlayacağı düşünülmüştür. Bu çalışmada 28.11.2021 ile 28.11.2022 tarih aralığını kapsayan, 1 yıllık periyotta piyasa hakimiyeti açısından %99'luk dilimde yer aldığı tespit edilen 216 kriptopara arasından verisine sağlıklı erişim sağlanabilen 1'i Bitcoin olmak üzere toplam 56 adet kriptopara, analiz edilmek üzere veri matrisi için derlenmiştir. Kategorik değişkenler hariç bütün metrik değişkenlere Z-skoru yöntemi ile standardize etme işlemi uygulanarak dönüşümleri gerçekleştirilen veriler kullanılmıştır. Analizler için hazırlanan veri setindeki 56 kriptopara analiz sürecinde 54'e, belirlenen 10 adet değişkenin bazılarının ise elenip 9'a düşürüldüğü gösterilecektir. Hiyerarşik kümeleme yöntemlerinden Tek Bağlantı yöntemi, Tam Bağlantı yöntemi, Ward yöntemi ve Merkezi yöntem kare Öklid uzaklık ölçütüyle analize tabi tutulacaktır. Dendogramlara yansıyan bulgular ile hiyerarşik olmayan kümeleme yöntemleri altında karşılaştırılacaktır. Buradaki kümelere ilişkin edinilen fikirlerin ardından küme yapılarını istatistiksel bağlamda değerlendirebilmek için hiyerarşik olmayan kümeleme yöntemlerinden K-Ortalamalar yöntemine geçiş yapılacaktır. Ancak öncesinde küme sayısını netleştirmek için k=(n/2)1/2 formülü ve Wilk's Lamda ölçütü kullanılmıştır. Oluşan kümelerin geçerliliği diskriminant analizi ile sınanacak ve meydana gelen 6 küme kritik edilecektir. Buraya kadar uygulanan tüm kümeleme analizleri ve diskriminant analizi IBM SPSS (Statistical Package for Social Sciences) 28.00 sürümlü paket programı kullanılarak gerçekleştirilmiştir. Bulgular sonucunda elde edilen kümelere; çok belirgin bir Bitcoin-Altcoin ayrımı görülmeyen küme yapılarına yönelik yatırımcı için özellikle yatırım getirisi bazında ve diğer bazı açılardan çıkarımlarda bulunulacaktır. Ayrıca çalışmamızda 9 girdi değişkeni dışında kalan, veri matrisinde yer verilmemiş piyasa hakimiyeti ve derecelendirme skorları baz alınarak birtakım çıkarımlar yapılmıştır.

Özet (Çeviri)

People always want to evaluate their savings by considering the investment tools that will provide the most return. For this purpose, new products are always developed and these products are used under different constraints. With the blockchain technology bringing Bitcoin into life, a new area has now emerged for investors. It is also mentioned in the literature that it has led to many radical changes in the way of doing business and it is promising a future for many other sectors. It can be said that it has already affected monetary policies and the financial sector, and its effect on this areas will continue. The fact that it eliminates central authority with its distributed architecture, it is also transparent and highly secure thanks to cryptography, and allows faster and less costly transactions are the factors that make cryptocurrencies even more attractive. Over the last decade, the growing interest on a global scale has led to the emergence of new cryptocurrencies and crypto exchanges. As of December 2022, the market size is evident with the crypto market, which has a market value of approximately 856 billion USD and a daily trading volume of 24 billion USD. It can be said that more than 22.000 types of cryptocurrencies, which can be traded on various kipto exchanges exceeding 530, are a complicating factor for investors or users to choose which cryptos they prefer. The crypto market with high price volatility can provide high returns, as well as cause huge losses that can frustrate investors. In this research, the investment purpose is emphasized among several uses of cryptocurrencies. The motivation of the study is to provide summative and informative information about cryptocurrencies, whose data can be accessed, in order to facilitate the process of choosing cryptocurrencies, which has become critical for investors. In this way, some ambiguities are resolved and the field of choice is narrowed. In addition, it has been seen that most statistical studies on crypto units in the literature are based on price prediction and causality relationships of cryptos with each other or with other money markets. Since the study presented in this thesis covers a descriptive summative statistical data analytics process for cryptocurrencies, it is thought to contribute to the literature on the basis of the crypto ecosystem. In the research, which is the subject of the thesis, 216 crypto assets, covering the date range of 28.11.2021 and 28.11.2022, in the first 99% of market dominance in a 1-year period, were identified. Among these 216 crypto assets, a total of 56 cryptocurrencies, one of which is Bitcoin, were compiled for the data matrix to be analyzed. During the Cluster Analysis processes, 56 crypto units in the prepared data matrix, 54; It will be shown that some of the 10 variables determined were eliminated and reduced to 9 variables. Except for the categorical variables, the data whose transformations were performed by applying the Z-score method to all metric variables, were standardized and used. One of the 2 cryptocurrencies to be removed from the dataset is MANA and the other is ALPHA cryptos. These two observations were determined as deviating values according to Mahalanobis distance values. It was deemed appropriate to exclude these 2 cryptos from the data set on the grounds that they may prevent the data from complying with the normal distribution assumption. According to the VIF statistic, the first variable extracted from the data matrix is determined to be in multicollinearity with other variables and there is a linear relationship between them. In order to eliminate the multicollinearity problem, the variable expressed as“Rate of Change in Price Since New Year's Eve (Year To Date)”(YTDPriceVar) is the first variable that will not be included in the data matrix. In the first stage for analysis; Single-Linkage clustering, Complete-Linkage clustering, Ward's method and Centroid-Linkage clustering, which are hierarchical clustering methods of cluster analysis, will be analyzed with squared Euclidean distance criterion. Cluster formations at different levels will be compared according to the findings reflected in the dendograms for each method. According to the results, the Single-Linkage clustering was not found to be remarkable. In addition, it can be said that the Centroid-Linkage clustering is overshadowed by the Ward method and the Complete-Linkage method. In general, there are 2 main clusters at the upper level. When it comes to subsets, it is understood that options with 5 or 8 cluster numbers are suitable for evaluation. Although they have different distances in all of the Agglomeration schedules for each method, the cryptos 3 (USDC) and 23 (GUSD) have been identified as the two closest observations. Although at different distances in each method, it has been observed that the two most distant cryptos are the cryptos 1 (BTC) and 3 (USDC). Some inferences, especially the number of clusters (k), regarding the cluster structures formed through hierarchical clustering methods, were made. From this point of view, in order to evaluate the cluster structures in statistical context in more detail, a transition will be made from non-hierarchical clustering methods to the K-Means method. However, beforehand, k=(n/2)1/2 formula and Wilk's Lamda criterion were used to clarify the number of clusters. According to the k value found as 5.2 by the formula, 5 or 6 k numbers are possible suitable cluster numbers. For Wilk's Lambda measure, observed separately; For k=2,3,4,5,6,7,8 cluster numbers, 7 different Wilk's Lambda values were obtained. Accordingly, it gave the most optimal value as k=6. According to all these studies, the number of clusters will be clarified as k=6 and the cluster structures will be criticized accordingly in the rest of the study. The number of observations of the clusters, which are formed according to the similarities of the cryptos to each other on the basis of the determined variables, are observed as follows; Cluster 1 had 20 observations, Cluster 2 had 9, Cluster 3 had 5, Cluster 4 had 6, Cluster 5 had 9, and Cluster 6 had 5 observation numbers. Before moving on to the analysis of cluster structures, the validity of the clusters will be tested by discriminant analysis and the resulting 6 clusters will be criticised. As a result of the comparisons, it was concluded that 3 of the 6 clusters formed by the Complete-Linkage and Ward methods, which are hierarchical methods, and the K-Mean method, which are non-hierarchical methods, are exactly the same, while the other 3 clusters are quite similar to each other. It is determined that both according to the ANOVA Table obtained from the K-Means method and according to the Tests of Equality of Group Means obtained from the discriminant analysis, they have a significant effect in separating the groups for all variables. According to the dicriminat analysis, the performance output was obtained that the clusters obtained in the clustering analysis were grouped successfully at a rate of 100%. In addition, according to the statistical results, the BTC and Price Correlation (CorrlBTC) variable, which is the most capable in terms of explaining the group formation or the difference between the clusters, is determined as the variable with the most impact. The variables that play the least effective role are the Limitation of Supply and Cryptocurrencies Type variables, which are all categorical variables. All clustering analyzes and discriminant analysis applied so far have been performed using the IBM SPSS (Statistical Package for Social Sciences) 28.00 version package program. Some of the differentiating and prominent clusters and the factors of the variables were evaluated in detail. There are also evaluations that can give an idea to the investor in cluster structures that do not have a very clear Bitcoin and other coins (Altcoins) distinction. The clusters obtained as a result of the findings; For the investor for cluster structures that do not have a very clear Bitcoin and altcoin distinction, inferences will be made especially on the basis of return on investment and some other aspects. In addition, some inferences were made based on market dominance and rating scores, which were not included in the data matrix, except for 9 input variables in our study.

Benzer Tezler

  1. Kripto para piyasasında etkinlik analizi ve getiri tahmini

    Efficiency analysis in the cryptocurrency market and return prediction

    AHMET FURKAN SAK

    Doktora

    Türkçe

    Türkçe

    2022

    İşletmeBurdur Mehmet Akif Ersoy Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. HÜSEYİN DALGAR

  2. Kripto para ve blokzincir teknolojilerinde kullanılan imzalama algoritmalarının analizi

    Analysis of digital signatures used blockchain and cryptocurrencies

    YASEMİN AKYÜZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara Üniversitesi

    Siber Güvenlik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ HÜSEYİN YÜCE

    DR. İSA SERTKAYA

  3. Blok zincir sistemlerinin finans piyasalarındaki yeri ve kripto paralarda fiyat balonlarının incelenmesi

    The place of blockchain systems in financial markets and investigation of price balloons in crypto money

    SEFA METE

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Maliyeİstanbul Ticaret Üniversitesi

    Sermaye Piyasası Ana Bilim Dalı

    DOÇ. DR. AYBEN KOY

  4. Kripto paralarda risk ölçümü ve portföy optimizasyonu

    Risk measurement and portfolio optimization in cryptocurrencies

    BAYKAR SİLAHLI

    Doktora

    Türkçe

    Türkçe

    2020

    Endüstri ve Endüstri MühendisliğiYıldız Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. NEZİR AYDIN

  5. Deep Q-Network based cryptocurrency investment strategies using transformer function approximator

    Transformer fonksiyon yaklaşımcısını kullanarak derin Q-Ağı tabanlı kripto para yatırım stratejileri

    TUNA ALAYGUT

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÖzyeğin Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ EMRE SEFER