Predicting tennis match outcome: A machine learning approach using the SRP-CRİSP-DM framework
Tenis maç sonucu tahminleme: SRP-CRİSP-DM çerçevesini kullanan bir makine öğrenmesi yaklaşımı
- Tez No: 841270
- Danışmanlar: PROF. DR. SEVGİ ÖZKAN YILDIRIM
- Tez Türü: Yüksek Lisans
- Konular: Spor, Yönetim Bilişim Sistemleri, Sports, Management Information Systems
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Enformatik Enstitüsü
- Ana Bilim Dalı: Bilişim Sistemleri Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 101
Özet
Makine öğrenimi yöntemleri tenis maçı sonuçlarının tahmin edilmesinde etkilidir. Ancak, veri kümelerinin, modellerin, özellik kümelerinin veya hiper parametrelerin seçimine ilişkin kararlar, bu yöntemlerin ampirik doğaları nedeniyle sonuçları önemli ölçüde etkilemektedir. Bu tez çalışmasında, bu belirsizliği gidermek için deneysel SRP-CRISP-DM çerçevesi kullanılmıştır. Bu yaklaşım, sonuçların çeşitli veri kümeleri ve spor türleri genelinde hem tekrarlanabilir hem de tekrarlanabilir olmasını sağlar. Çalışmamız, 2009 ile 2022 yılları arasındaki 14 yıllık tek erkekler tenis maçı verilerini kapsamaktadır. 2021 ve 2022 yıllarına ait veriler, test seti olarak ayrılmıştır. Üç makine öğrenimi modeli ve iki özellik seçme yönteminin yanı sıra altı gelişmiş özellik çıkarımı tekniği uygulanmıştır. Hiper parametre kestirimiyle birlikte 10 katlı zamana dayalı çapraz doğrulama yaklaşımı benimsenmiştir. Aşırı Gradyan Artırma modeli, eğitim ve ayarlamalardan sonra en etkili model olarak ortaya çıkmış olup test setinde 0,1913 ile en düşük Brier skoruna ve %70,5 doğruluğa ulaşmıştır. Bahis şirketlerinin bahis oranlarının ima ettiği ortalama kazanma oranlarının en yüksek tahmin gücüne sahip özellik olduğu belirlenmiştir ve bu özellik maç sonuçlarının tahmin edilmesinde önemli rol oynamıştır.
Özet (Çeviri)
Machine learning methods have demonstrated effectiveness in forecasting tennis match results. However, due to their empirical nature, decisions regarding the choice of specific datasets, models, feature sets, or hyperparameters significantly impact outcomes. In this thesis, we employed the Sports Result Prediction Cross-Industry Standard Process for Data Mining experimental framework to address this uncertainty. This approach ensures that results are both replicable and reproducible across diverse datasets and sports types. Our study encompasses 14 years of men's singles tennis match data, from 2009 to 2022, with data from 2021 and 2022 designated as the hold-out test set. We applied six advanced feature extraction techniques, alongside three machine learning models and two feature selection methods. A 10-fold time-based cross-validation approach, coupled with hyperparameter tuning, was adopted. The Extreme Gradient Boosting model, after training and tuning, emerged as the most effective, achieving the lowest Brier score of 0.1913 and an accuracy of 70.5% on the test set. The feature with the highest predictive power was identified as the average win ratios implied by the betting odds of the bookmakers, which played a pivotal role in forecasting match outcomes.
Benzer Tezler
- Elit tenisçilerde antropometrik ve motorik özellikler ile tenis performansı arasındaki ilişkilerin incelenmesi
Investigation of the relations between anthroopometric and motoric features and tennis performance in elite tennis players
HALİT ŞAR
Doktora
Türkçe
2022
SporOndokuz Mayıs ÜniversitesiBeden Eğitimi ve Spor Ana Bilim Dalı
PROF. DR. OSMAN İMAMOĞLU
- Adölesan tenis oyuncularında kavrama kuvveti ve kavrama enduransını etkileyen faktörler
Predicting factors grip strength and grip endurance in adolescent tennis players
ZEYNEP HAZAR
Yüksek Lisans
Türkçe
2011
Fiziksel Tıp ve RehabilitasyonHacettepe ÜniversitesiFizik Tedavi ve Rehabilitasyon Ana Bilim Dalı
PROF. DR. İNCİ YÜKSEL
- Alümina fiber takviyeli Al-si metal matriksli kompozitlerin üretimi ve mikroyapı-özellik ilişkilerinin incelenmesi
production of alumina fiber reinforced Al-si metal matrix composites and the investigation of their microstructure-propetry relation ships
HATEM AKBULUT
- Radyolojik ve artrosopik olarak kalça eklem dejenerasyonunun değerlendirilmesi ve cam tipi sıkışma sendromu tedavi sonuçlarına etkisi
Evaluation of radiological and artrosopically hip joint degeneration and its effects on the results of cam type impingement syndrome treatment
ABDURRAHMAN VURAL
Tıpta Uzmanlık
Türkçe
2020
Ortopedi ve TravmatolojiGazi ÜniversitesiOrtopedi ve Travmatoloji Ana Bilim Dalı
PROF. DR. ULUNAY KANATLI
- Development of a ball trajectory and stroke prediction system for table tennis robot based on machine learning
Masa tenisi robotu için makine öğrenmesi temelli top yörüngesi ve vuruş noktası tahmini yapan sistemin geliştirilmesi
MEHMET FATİH KAFTANCI
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAkdeniz ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. MELİH GÜNAY