Geri Dön

Ağ trafiği tahmininde makine öğrenmesi algoritmalarının karşılaştırmalı analizi

A comparative analysis of machine learning algorithms on network traffic forecasting

  1. Tez No: 953724
  2. Yazar: BUSE DİLAN USLAN
  3. Danışmanlar: PROF. DR. FERHAN ÇEBİ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Mühendislik Bilimleri, İşletme, Engineering Sciences, Business Administration
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: İstanbul Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: İşletme Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: İşletme Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 69

Özet

Günümüzde dijitalleşmenin hız kazanması ve teknoloji kullanımının yaygınlaşması, veri trafiğinde önemli bir artışa neden olmuştur. Akıllı telefonların, nesnelerin interneti (IoT) cihazlarının ve 5G teknolojisinin yaygınlaşması gibi faktörler, telekomünikasyon ağlarındaki yükü önemli ölçüde artırmıştır. Bu nedenle, ağ yönetiminin verimli hale getirilmesi ve kapasite planlamasının doğru bir şekilde yapılması, artan veri trafiğiyle başa çıkmak için hayati bir öneme sahiptir. Telekomünikasyon şirketleri, gelecekteki ağ ihtiyaçlarını öngörerek kapasite yatırımlarını optimize etmek ve rekabet avantajı elde etmek için ileri tahmin yöntemlerine başvurmaktadır. Tahmin hataları, gereğinden fazla yatırım maliyetine neden olabileceği gibi karşılanmayan taleplere ve dolayısıyla müşteri memnuniyetinin azalmasına da neden olabilir. Telekomünikasyon sektöründe en geniş müşteri tabanı mobil teknolojilere (2G, 3G, 4G) dayanmaktadır. Bu nedenle, mobil kapasite ihtiyaçlarının doğru tahmin edilmesi, kesintisiz ve kaliteli hizmet sunmak açısından büyük önem taşımaktadır. Her şebeke kendine özgü olduğu için şebekenin sezonsal trafik değişikliklerini en iyi tahminleyecek modelin kurulması gerekmektedir. Bu bağlamda, bu çalışmanın amacı, farklı makine öğrenmesi algoritmalarını karşılaştırmalı bir şekilde değerlendirerek ağ trafiği tahmini için en uygun yaklaşımları belirlemektir. Araştırma kapsamında SARIMA, Prophet, LSTM ve hibrit bir model (Prophet+LSTM) detaylı olarak incelenmiştir. Çalışma için gerçek veri kullanma konusunda bazı kısıtlamalarla karşılaşılmıştır. Bundan dolayı sektör uzmanlarının yardımı ile 2023-2024 yıllarının ortalama trafik değeri üzerine günlük ve aylık sezonsallık eklenerek iki yıllık bir veri seti elde edilmiştir. 24 aylık verinin 18 ayı eğitim, 6 ayı ise test için kullanılmıştır. Çalışmada kullanılan modellerin her biri farklı yaklaşımlara dayanmaktadır. SARIMA, istatistiksel yöntemlerin klasik bir temsilcisi olarak, lineer trendleri ve sezonsal bileşenleri tahmin etmekte etkilidir. Prophet modeli, özellikle sezonsallık, trend ve tatil etkilerini modelleyebilme kapasitesiyle kullanıcı dostu bir araç olarak öne çıkmaktadır. LSTM modeli ise derin öğrenme tabanlı bir yöntem olarak, karmaşık zaman serisi desenlerini öğrenme kapasitesine sahiptir ve uzun vadeli tahminlerde yüksek doğruluk sağlayabilmektedir. Hibrit model ise Prophet'in trend analizi gücü ile LSTM'in yüksek doğruluk sağlayan tahmin yeteneklerini birleştirerek daha güçlü bir tahmin aracı oluşturmuştur. Modellerin her biri için hiperparametre optimizasyonu yapılmıştır. SARIMA için AIC (Akaike ölçütü), Prophet için Grid Search, LSTM için Keras Tuner kullanılmıştır. Hibrit modelde de Prophet ve LSTM için belirlenen en iyi parametreler kullanılmıştır. Bu algoritmaların detayları uygulama bölümünde verilmiştir. Modellerin performansı, ortalama mutlak hata (MAE), ortalama karesel hata (MSE), kök ortalama hata karesi (RMSE) ve R² skoru gibi metriklerle ölçülmüştür. Sonuçlar, her bir modelin avantaj ve dezavantajlarını açıkça ortaya koymuştur. SARIMA ve LSTM'in tek başlarına yeterince iyi tahminleme yapamadığı, Prophet'in sezonsallığı çok iyi öğrendiği görülmüştür. Hibrit modelin ise diğer modellerden daha yüksek doğruluk oranlarına ulaştığı gözlemlenmiştir. Bu durum, hibrit modellerin, farklı algoritmaların güçlü yanlarını bir araya getirerek üstün performans sağlayabileceğini göstermektedir. Sonuç olarak, bu çalışma, makine öğrenmesi algoritmalarının telekomünikasyon sektöründe ağ trafiği tahmini üzerindeki potansiyelini ve önemini vurgulamaktadır. Doğru tahmin modellerinin kullanımı, şirketlerin kaynaklarını daha verimli bir şekilde yönetmesini, maliyetlerini optimize etmesini ve kullanıcı deneyimini geliştirmesini mümkün kılmaktadır. Çalışmanın sonuçları, yalnızca akademik bir katkı sağlamakla kalmayıp, aynı zamanda sektör profesyonellerine yönelik pratik bir rehber niteliği taşımaktadır. Gelecekte, makine öğrenmesi tabanlı modellerin daha geniş bir ölçekte kullanılması ve bu alanda yeni hibrit yaklaşımların geliştirilmesi, telekomünikasyon şirketlerinin stratejik karar alma süreçlerinde önemli bir rol oynayacaktır.

Özet (Çeviri)

In recent years, the increasing demand for internet services and the rapid growth of digital transformation have significantly impacted telecommunication networks. As data consumption continues to increase, ensuring efficient network capacity planning has become a crucial challenge for network providers due to the introduction of 5G, the growth of IoT devices, and the growing dependence on cloud-based apps. Accurate forecasting of network traffic plays a vital role since it helps businesses to predict future demand, optimize network infrastructure, make well-informed investment decisions and improving overall network performance. Through my research, I aimed to explore how different machine learning algorithms can improve the accuracy and reliability of network traffic predictions. Therefore, this paper examines the effectiveness of various algorithms with a focus on SARIMA, Prophet, LSTM, and a hybrid Prophet-LSTM model. Time series forecasting techniques have been widely applied in various domains, including finance, energy, and telecommunications. In the context of network traffic forecasting, traditional statistical models such as Seasonal AutoRegressive Integrated Moving Average (SARIMA) and Prophet have been commonly used due to their interpretability and efficiency in handling seasonality. However, as deep learning has advanced, models like Long Short-Term Memory (LSTM) networks have demonstrated encouraging outcomes in capturing complicated temporal dependencies. Additionally, hybrid models that combine the strengths of both statistical and deep learning approaches have showed up as a potential solution for enhancing forecasting accuracy. The study focused on the usefulness of these models for the telecom sector in addition to quantitative assessments. Wide-ranging advantages of accurate network traffic forecasting include increased customer satisfaction, lower operating costs and improved service quality for operators. For example, operators can proactively allocate resources to avoid congestion and maintain optimal performance by forecasting peak traffic periods. In a similar way, long-term forecasts can direct strategic network expansion investments, guaranteeing that infrastructure expansion matches with the expected demand. Due to data privacy laws in Türkiye and the fact that the telecommunications sector contains a lot of critical and confidential information, some restrictions were encountered in using real data for the study. Therefore, with the help of industry experts, a two-year data set was obtained by adding daily and monthly seasonality to the average traffic value of 2023-2024. With 18 months of data set aside for training and the remaining 6 months set aside for testing, the study used a standard data partitioning technique. By simulating actual forecasting conditions, this approach made sure the models were tested on unobserved data. Hyperparameter tuning was performed for all four models. Four different forecasting models, each with its own advantages and disadvantages, were used. Based on statistical principles, the SARIMA model is excellent at detecting seasonality and linear trends. However, it assumes data stationarity, which frequently requires for transformation methods like logarithmic scaling or differencing. Despite being simple and easy to understand, SARIMA has downsides when working with datasets that contain complex, non-linear patterns or long-term dependencies. Prophet, developed by Facebook, addresses several of SARIMA's shortcomings. Its ability to model holidays, handle missing data, and incorporate custom seasonality makes it particularly well-suited for business applications. Prophet's flexibility in adjusting to irregular intervals and its user-friendly interface contribute to its popularity among practitioners. However, like SARIMA, it struggles with short-term irregular fluctuations and lacks the capacity to model complex non-linear relationships. A new approach in time series forecasting is represented by LSTM, a type of recurrent neural network. It is an effective tool for complex datasets because of its architecture, which is made to learn non-linear patterns and capture long-term dependencies. In contrast to SARIMA and Prophet, LSTM requires a large amount of processing power and careful adjustment of hyperparameters like batch size, learning rate, and layer count. Despite these difficulties, LSTM performed well in simulating both long-term trends and short-term fluctuations. A hybrid model was created to take advantage of Prophet and LSTM's complementary strengths. First, Prophet was used to extract seasonality components and long-term trends from the data. The residuals, which represent the error rate for each prediction, were then fed into the LSTM model for further analysis. This combination performed very well, achieving increased accuracy since the errors have been learned and fine-tuned. Hyperparameter tuning was performed for each model. AIC (Akaike Information Criterion) was used for SARIMA, Grid Search for Prophet, and Keras Tuner for LSTM. The hybrid model also used the best parameters determined for Prophet and LSTM. Details of these algorithms are provided in the application section. The models' performance was evaluated using key metrics, including Mean Absolute Error (MAE), Mean Squared Error (MSE), Root Mean Squared Error (RMSE) and R2 score. MAE measures the average absolute difference between actual and predicted values. MSE penalizes larger errors more heavily. RMSE provides a more interpretable measure of prediction errors and does not penalize larger errors as much as MSE. R2 score is a statistical measure that represents the proportion of the variance for a dependent variable that's explained by an independent variable. R2 score is a metric frequently used to interpret the performance of regression and time series problems. SARIMA delivered reliable results for stationary data and short-term forecasts but struggled with dynamic, non-linear datasets. However, it exhibited limitations in capturing short-term irregularities. Prophet outperformed both SARIMA and LSTM in scenarios requiring long-term predictions, achieving lower error rates and greater adaptability. The hybrid Prophet-LSTM model emerged as the best-performing approach, combining the interpretability of Prophet with the predictive power of LSTM to deliver consistently accurate results. It offers significant potential for real-world applications. Its ability to balance interpretability and predictive accuracy makes it an ideal choice for scenarios where both short-term adjustments and long-term planning are critical. Moreover, the modular nature of the hybrid approach allows for further enhancements, such as integrating external data sources. For example, incorporating football game schedules, special dates and holidays, campaign periods, weather data, social media trends, or regional demographic information could improve the model's performance by providing additional context for traffic patterns. To summarize, each of the models used in the study is based on different approaches. SARIMA, as a classic representative of statistical methods, is effective in estimating linear trends and seasonal components. The Prophet model stands out as a user-friendly tool, especially with its capacity to model seasonality, trend and holiday effects. The LSTM model, on the other hand, is a deep learning-based method, has the capacity to learn complex time series patterns and can provide high accuracy in long-term forecasts. The hybrid model combines the trend analysis power of Prophet with the high accuracy forecasting capabilities of LSTM to create a more powerful forecasting tool. This study also clarifies the larger effects of machine learning in network management. In addition to forecasting, these algorithms can be applied to tasks such as capacity optimization, anomaly detection, and user behavior analysis. For example, customer segmentation models can help operators customize their services to specific user groups, enhancing customer churn rates and revenue growth. This study recognizes several limitations and potential future research areas despite its promising results. Despite being comprehensive, the dataset's daily granularity may have covered more subtle details that could be seen in weekly or hourly data. The applicability of these models for high-frequency datasets may be investigated in future research, offering more detailed information for operational decision-making. Furthermore, even though the hybrid Prophet-LSTM model performed better, the need for more efficient methods is highlighted by its computational complexity and heavy reliance on preprocessing. The usability and scalability of the model could be further improved by creating automated pipelines for feature engineering, data preparation, and outlier detection. In conclusion, from my observations throughout this research, this study underscores the critical role of machine learning in network traffic forecasting, demonstrating the unique strengths and limitations of SARIMA, Prophet, LSTM, and hybrid Prophet-LSTM models. While SARIMA and LSTM are effective for quick, interpretable forecasts, Prophet and hybrid models excel in capturing complex, long-term patterns. The hybrid Prophet-LSTM model, in particular, represents a significant advancement in forecasting methodology, offering a balanced solution for diverse use cases. As the telecommunications industry continues to evolve, leveraging advanced machine learning techniques will be essential in addressing emerging challenges and unlocking new opportunities for growth and innovation.

Benzer Tezler

  1. Early detection of distributed denial of service attacks

    Dağıtık hizmet engelleme saldırılarının erken tespiti

    KAĞAN ÖZGÜN

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AYŞE TOSUN KÜHN

    DR. ÖĞR. ÜYESİ MEHMET TAHİR SANDIKKAYA

  2. DDoS attack detection from network traffic data using machine learning methods

    Makine öğrenimi yöntemleri kullanarak ağ trafiği verilerinden DDoS saldırısı tespiti

    NUMAN ERTİK

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇukurova Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. FATİH ABUT

  3. Predictive quality of service routing for software-defined networks

    Yazılım tanımlı ağlar için hizmet kalitesi tabanlı öngörücü rotalama

    BUSE PEHLİVAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Elektrik ve Elektronik MühendisliğiYaşar Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. VOLKAN RODOPLU

  4. Development of a new software for network traffic prediction and forecasting using time series multilayer perceptron and feedback delays

    Zaman serili çok katmanlı algılayıcı ve zaman gecikmeleri kullanılarak ağ trafiği tahmini için yeni bir yazılımın geliştirilmesi

    MURAT CAN YÜKSEL

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇukurova Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MEHMET FATİH AKAY

  5. Data-driven delay estimation and anomaly detection: A study on European and Turkish air traffic

    Veri güdümlü gecikme tahmini ve anomali tespiti: Avrupa ve Türkiye hava trafiği üzerine bir çalışma

    MUHAMMET AKSOY

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Uçak ve Uzay Mühendisliği Ana Bilim Dalı

    DR. EMRE KOYUNCU