Geri Dön

Makine öğrenmesi kullanarak Türkiye'de elektrikli araç şarj istasyonlarının potansiyel kullanım performansının mekânsal tahmini

Spatial estimation of potential utilization performance of electric vehicle charging stations in Türkiye using machine learning methods

  1. Tez No: 959203
  2. Yazar: SERKAN TANRIVERDİ
  3. Danışmanlar: DOÇ. DR. ADALET DERVİŞOĞLU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Jeodezi ve Fotogrametri, Geodesy and Photogrammetry
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: İstanbul Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Geomatik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Geomatik Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 143

Özet

Günümüzde küresel ısınma ve fosil yakıt bağımlılığının yarattığı çevresel ve ekonomik sorunlar, ulaşım sektöründe sürdürülebilir çözümler arayışını hızlandırmaktadır. Elektrikli araçlar (EA), hem karbon emisyonlarını azaltma potansiyelleri hem de yenilenebilir enerji entegrasyonuna uygun altyapıları sayesinde geleceğin ulaşım modelleri arasında ön plana çıkmaktadır. Ancak elektrikli araç kullanımının yaygınlaşabilmesi, şarj altyapısının hem nicelik hem de niceliksel ihtiyaçları karşılayacak şekilde planlanmasına bağlıdır. Bu noktada, sadece mevcut talebe yanıt verebilen değil, geleceğe dönük projeksiyonlar da sunan mekânsal tahmin modellerine duyulan gereksinim giderek artmaktadır. Bu tez çalışması, Zorlu Energy Solutions (ZES) şarj ağına ait 2024 yılı verilerini esas alarak, Türkiye genelinde elektrikli araç şarj enerji tüketimini mekânsal olarak modelleme ve öngörme ihtiyacına bütüncül bir yaklaşım getirmeyi hedeflemektedir. Kullanılan veri seti, İstanbul, Ankara, İzmir, Eskişehir ve Antalya illerindeki aylık kW cinsinden şarj tüketim miktarlarını, istasyon konumlarını ve soket tiplerini içeren gerçek saha ölçümlerinden oluşmaktadır. Bu beş il, farklı sosyo-ekonomik, coğrafi ve altyapı koşullarını temsil etmeleri nedeniyle, modelin ülke çapında genellenebilirliğini test etmek amacıyla hem çeşitlilik hem de tutarlılık ilkeleri gözetilerek seçilmiştir. Veri ön işleme aşamasında, heterojen kaynaklardan gelen bilgiler tek bir mekânsal çatı altında toplanmıştır. Türkiye İstatistik Kurumu'nun (TÜİK) 2023 yılına ait Adrese Dayalı Nüfus Kayıt Sistemi (ADNKS) verileri kullanılarak mahalle ve ilçe düzeyinde nüfus, gelir dağılımı ve araç sahipliği oranları shapefile formatında elde edilmiştir. OpenStreetMap veritabanından OSMNX kütüphanesi aracılığıyla temin edilen yol ağı, vektör tabanlı Coğrafi Bilgi Sistemleri (CBS) formatına dönüştürülmüş; yol segmentlerinin uzunlukları ve düğüm yoğunlukları, her yol sınıfı için ayrı ayrı hesaplanmıştır. Copernicus Open Access Hub'dan temin edilen Sentinel-2 uydu görüntüleri, 10 metre çözünürlükte yerleşim alanı haritalarına dönüştürülmüş ve bu raster katmanlar altıgen hücrelerle örtüştürülerek hücre başına yerleşim yoğunluğu belirlenmiştir. Ayrıca, Python'un requests ve BeautifulSoup kütüphaneleri kullanılarak web kazıma yöntemiyle elde edilen alışveriş merkezi (AVM) konum verileri, AVM sayısının her hücreye düşen yoğunluk özniteliğini oluşturmak amacıyla kullanılmıştır. Tüm bu mekânsal veriler, ortak bir koordinat referans sistemi (EPSG:3857) altında birleştirilerek tutarlı bir ön veri tabanı oluşturulmuştur. Mekânsal çözümlemenin temelini ise Uber tarafından geliştirilen H3 altıgen ızgara sistemi oluşturmuştur. Seviye 6 çözünürlük düzeyinde oluşturulan yaklaşık 200 bin adet hexagon hücre, Türkiye kara sınırları içerisinde tanımlanmıştır. Her bir hücrenin geometrik sınırları ve komşuluk ilişkileri Python API'si aracılığıyla belirlenmiş; ZES tüketim verileri ise GeoPandas kütüphanesinin spatial join fonksiyonu kullanılarak ilgili hücrelere atanmıştır. Böylece her hücreye karşılık gelen bağımlı değişken olan aylık elektrik tüketimi (kW) hesaplanabilmiştir. Bağımsız değişkenler olarak ise hücre başına düşen istasyon sayısı, nüfus yoğunluğu, ortalama gelir seviyesi, yol ağı uzunluğu, AVM sayısı, yerleşim alanı yüzdesi ve kritik güzergâhlara ilişkin kukla (dummy) değişkenleri belirlenmiştir. Özellikle Bolu, Kayseri ve Niğde gibi otoyol kavşak noktalarında yer alan hızlı şarj istasyonlarına ilişkin dummy değişkenler, uzun mesafeli yolculuk dinamiklerini yakalamak için model parametrelerine dahil edilmiştir. Makine öğrenmesi modellemesi, dört farklı algoritma kullanılarak gerçekleştirilmiştir: Doğrusal Regresyon (Linear Regression), Destek Vektör Regresyonu (Support Vector Regression, RBF çekirdeği), Rasgele Orman (Random Forest) ve Gradyan Artırma (Gradient Boosting). Her bir model, hem 93 tam özellik seti hem de İleri Özellik Seçimi (Sequential Feature Selection, SFS) yöntemiyle belirlenen 10 özellikli altküme üzerinden ayrı ayrı eğitilmiştir. Model eğitim ve değerlendirme süreçlerinde 5 katlı ve 10 katlı çapraz doğrulama (cross-validation) yaklaşımları uygulanmış; hiperparametre optimizasyonu ise GridSearchCV yöntemiyle gerçekleştirilmiştir . Modellerin performansı, açıklayıcılık gücünü gösteren R² katsayısı ile hata büyüklüğünü gösteren Ortalama Mutlak Hata (Mean Absolute Error, MAE) ve Ortalama Kare Hata (Mean Squared Error, MSE) metrikleriyle karşılaştırılmıştır. Elde edilen performans sonuçları, hem hata metrikleri hem de açıklayıcılık düzeyi açısından Gradyan Artırma algoritmasının üstünlüğünü ortaya koymuştur. 10 özellikli alt kümede Gradyan Artırma modeli 10 katlı çapraz doğrulama (CV=10) kapsamında yaklaşık olarak R² ≈ 0,75, MAE ≈ 79 kWh ve MSE ≈ 11 010 kWh² değerlerine ulaşarak en yüksek tahmin doğruluğu sağlamıştrı. Rasgele Orman algoritması, R² ≈ 0,72 ve MAE ≈ 83,5 kWh değerleri ile ikinci sırada yer alırken; SVR modeli R² ≈ 0,64, MAE ≈ 98,7 kWh; Doğrusal regresyon ise R² ≈ 0,58, MAE ≈ 112,4 kWh değerleriyle görece daha sınırlı bir perfpormans göstermiştir. Tam 93 değişkenin kullanıldığı modelleme senaryosunda ise Gradyan Artırma algoritması R² ≈ 0,78 seviyesine, Rasgele Orman algoritması R² ≈ 0,75'e yükselirken, SVR ve Doğrusal regresyon modelleri sırasıyla R² ≈ 0,67 ve R² ≈ 0,61 değerlerine yükselmiştir. Bu sonuçlar, öznitelik sayısındaki artışın özellikle doğrusal olmayan modellerin genelleme kapasitesini daha belirgin iyileştirebildiğini, ancak özellik seçiminin hem hesaplama verimliliği hem de model karmaşıklığının kontrolü açısından kritik bir rol oynadığını göstermektedir. Öznitelik önem düzeyi analizleri, tüm yüksek performanslı modellerde ortak beş parameterin öne çıktığını ortaya koymuştur: hücre başına nüfus yoğunluğu, şarj istasyonu sayısı, AVM sayısı, yol ağı uzunluğu ve ortalama gelir seviyesi. Bu değişkenlerin enerji tüketimi tahminlerindeki belirleyici rolü, özellikle demografik ve ticari altyapı yoğunluğunun şarj altyapısı planlamasında dikkate alınmasını gerekli kılmaktadır. Diğer yandan, ülke genelini kapsayan interaktif haritalar, Marmara, Ege ve Akdeniz bölgelerinde yüksek tüketim hücrelerini belirgin biçimde vurgularken, İç Anadolu ve Doğu Anadolu'da daha düşük talepli hücre kümeleri tanımlamıştır. Kritik yol güzergâhlarındaki sapmalar, turistik ve transit araç yoğunluğu gibi ek faktörlerin modele entegrasyonunun değerini ortaya koymuştur. Bu tez çalışmasının özgün katkıları özetle şu şekilde sıralanabilir: (i) Sınırlı sayıdaki il verilerinden yola çıkarak ülke geneline genellenebilir bir mekânsal tahmin modeli geliştirilmiş; (ii) Uber tarafından geliştirilen H3 altıgen grid sistemi kullanılarak farklı ölçek ve kaynaklara ait verilerin entegrasyonu başarıyla sağlanmıştır; (iii) SFS yöntemiyle 10 özniteliğe indirgenen veri setiyle yüksek performans elde edilerek hesaplama verimliliğine vurgu yapılmış; (iv) Hata metrikleri ve öznitelik önem düzeyleri üzerinden geliştirilen model içgörüleri, şarj altyapısı planlamasında karar vericilere somut ve veri temelli bir destek sunmuştur. Elde edilen bulgular doğrultusunda ileriye dönük öneriler şu şekilde sıralanabilir: ZES ve diğer şarj ağı operatörlerinin, yüksek talep potansiyeline sahip bölgelerde hızlı şarj istasyonu yatırımlarını önceliklendirmesi; yerel yönetimlerin, demografik yapı ve gelir dağılımı göstergelerine dayanan teşvik mekanizmaları tasarlaması; zaman serisi modellemelerinin entegrasyonu ile talep dalgalanmalarının daha yüksek mekânsal ve zamansal çözünürlükte modellenmesi; akıllı şebeke (smart grid) verilerinin entegre edilerek gerçek zamanlı sistem güncellemelerinin sağlanması; ve kullanıcı davranış analizlerini içeren sosyo-mekânsal veri katmanlarının analize dahil edilmesidir. Bu öneriler, hem kamu hem de özel sektörün sürdürülebilir ulaşım yatırımlarını daha etkin ve veri temelli biçimde yönlendirmesine katkı sağlayacak, böylece Türkiye'nin elektrikli araç şarj altyapısının geleceğe yönelik stratejik biçimde geliştirilmesini destekleyecektir.

Özet (Çeviri)

The rapid expansion of electric vehicle (EV) adoption worldwide has created an unprecedented need for sophisticated, data-driven approaches to inform the planning and deployment of charging infrastructure. In Türkiye, the number of registered EVs rose from fewer than twenty-five vehicles in 2011 to well over one hundred thousand by mid-2024, driven by government incentives, improvements in battery technology, and growing environmental awareness among consumers. This dramatic growth has placed considerable strain on existing charging networks and highlighted the importance of anticipating future demand across both dense urban centers and rural corridors. Traditional planning practices, which often rely on administrative boundaries or uniform grid schemes, have proven inadequate in capturing the nuanced spatial heterogeneity of charging behavior. Against this backdrop, the present study introduces a novel, hexagon-grid–based machine-learning framework designed to integrate high-resolution charging data with multiple socio-economic and infrastructural layers, thereby enabling precise, nationwide consumption forecasts at a granular spatial scale. At the core of this research lies the integration of heterogeneous datasets into a coherent geographic information system. Monthly kWh consumption records for 2024, along with station geocoordinates and socket type classifications, were provided by Zorlu Energy Solutions (ZES) for five representative Turkish metropolitan areas: İstanbul, Ankara, İzmir, Eskişehir, and Antalya. To complement these usage data, neighborhood- and district-level demographic attributes—including total population, age distributions, median household incomes, and registered vehicle counts—were extracted from the Turkish Statistical Institute's 2023 Address-Based Population Registration System (ADNKS). Transportation infrastructure metrics were derived from OpenStreetMap using the OSMNX library, which yielded detailed information on road segment lengths, intersection densities, and roadway classifications. Satellite imagery from Sentinel-2, at ten-meter resolution, was processed via GDAL/OGR to generate accurate settlement-area rasters, which were subsequently converted to polygon features to quantify the degree of urbanization within each analytical unit. Additionally, publicly accessible shopping-mall location data were harvested through Python-based web scraping (requests and BeautifulSoup), providing a measure of commercial density that serves as a proxy for trip generation potential. Each of these disparate layers was reprojected to a common coordinate reference system (EPSG:3857) and loaded into a PostgreSQL/PostGIS database to facilitate efficient spatial queries and large-scale data management. To establish a uniform spatial analysis framework, Uber's H3 library was employed to tessellate the entire Turkish landmass into level-6 hexagon cells, yielding approximately 200 000 equal-area units. This hexagonal grid offers two significant advantages over square or irregular administrative boundaries: it maintains consistent area coverage and eliminates directional bias in neighbor adjacency. Using GeoPandas and PostGIS, each data layer was spatially joined to the hexagon cells, thereby assigning to each cell a dependent variable—monthly kWh consumption—and a suite of independent variables: the count of charging stations within the cell, population density, median household income, total road network length, mall count, percentage of settled area, and binary dummy flags for critical highway interchange locations (e.g., Bolu and Kayseri junctions). This comprehensive assembly of features ensures that both demand drivers (demographic, economic, and commercial factors) and enabling infrastructure (station availability and transportation links) are encoded in the modeling dataset. Four supervised learning algorithms were systematically evaluated to forecast per-cell consumption: Linear Regression, Support Vector Regression (SVR) with a radial basis function kernel, Random Forest, and Gradient Boosting. To assess the impact of feature dimensionality on model performance, two feature-set scenarios were explored. The first scenario utilized the full 93-variable set, encompassing all raw and derived attributes, while the second scenario employed a reduced 10-variable subset identified through Sequential Feature Selection (SFS). Both scenarios were subjected to rigorous cross-validation protocols (5-fold and 10-fold) with hyperparameter tuning performed via GridSearchCV to identify optimal model configurations. Model efficacy was quantified by the coefficient of determination (R²), mean absolute error (MAE), and mean squared error (MSE) on held-out test sets, thereby providing a robust comparative assessment of predictive accuracy and generalization. Results consistently demonstrated that ensemble tree-based methods outperformed both linear and kernel-based approaches. Under the 10-feature subset with 10-fold cross-validation, Gradient Boosting achieved an R² of approximately 0.75, an MAE of approximately 79 kWh per cell, and an MSE of approximately 11 010 kWh², indicating high explanatory power and low average error. Random Forest followed closely, with an R² near 0.72 and MAE around 83.5 kWh. SVR yielded moderate performance (R² ≈ 0.64; MAE ≈ 98.7 kWh), outperforming Linear Regression (R² ≈ 0.58; MAE ≈ 112.4 kWh). Expanding to the full 93 features further elevated Gradient Boosting's R² to approximately 0.78 and Random Forest's R² to 0.75, while SVR and Linear Regression saw more modest improvements (R² ≈ 0.67 and R² ≈ 0.61, respectively). These findings underscore that although additional features can marginally enhance predictive performance, carefully selected compact feature sets can achieve comparable accuracy with significantly reduced computational burden. Critical insights into the determinants of charging demand were gleaned via feature importance analyses within the ensemble models. Five predictors emerged as consistently influential: population density, station count, mall density, road network length, and median household income. This fusion of socio-demographic and infrastructural variables confirms that EV energy consumption is driven by a multifaceted interplay of factors; densely populated, higher-income neighborhoods with robust commercial activity and accessible road networks exhibit the greatest demand. The inclusion of dummy variables for key highway interchanges successfully captured demand spikes along major transit corridors, validating the approach for modeling long-distance travel behaviors. To translate model outputs into actionable insights, high-resolution choropleth and heat maps were generated using the Folium library. These interactive visualizations reveal spatial patterns of projected monthly consumption, highlighting demand hotspots in coastal regions—particularly the Marmara, Aegean, and Mediterranean areas—and comparatively lower consumption in Central and Eastern Anatolian hinterlands. Moreover, hotspot overlays expose critical deficiencies in current infrastructure, offering a spatial decision-support template for prioritizing new fast-charging station deployments in high-need hexagon cells. This thesis contributes to the field in several ways. First, it demonstrates the applicability of a hexagon-grid machine-learning pipeline for large-scale, fine-resolution demand forecasting, offering a replicable methodology for other regions and countries. Second, it provides empirical evidence that sequential feature selection can substantially reduce model complexity and computational time without materially sacrificing accuracy. Third, it delivers high-fidelity demand forecasts and feature-importance results that can directly inform infrastructure investment strategies, tariff design, and regulatory policies. The study's outputs—including interactive maps and tabulated performance metrics—serve as decision-support tools for both public agencies and private operators seeking to expand EV charging networks efficiently. Based on the findings, several policy and practice recommendations are proposed. Infrastructure planners should prioritize the installation of fast-charging units in identified demand hotspots, particularly in coastal metropolitan zones and along critical highway interchanges. Local governments and utilities may design targeted incentives—such as reduced electricity tariffs or infrastructure subsidies—tailored to neighborhood income and population profiles to stimulate equitable EV adoption. To capture temporal dynamics in charging behavior, integrating time-series models (e.g., ARIMA, SARIMA, Prophet) alongside spatial regression could refine demand projections under seasonal and hourly variations. Real-time telemetry from smart-grid systems should be incorporated into iterative model updates, enabling dynamic load balancing and demand-response strategies. Future research should also incorporate user-level charging session data, analyze the impact of weather and air-quality parameters, and extend the framework to multimodal mobility contexts, thereby broadening its applicability to comprehensive urban planning scenarios. In summary, this thesis offers a robust, data-driven approach to forecasting EV charging demand at a granular, nationwide scale. By effectively integrating diverse spatial datasets, leveraging advanced machine-learning techniques, and providing actionable visualizations, it seeks to expedite the transition to a sustainable, resilient electric mobility ecosystem in Türkiye and beyond.

Benzer Tezler

  1. Doğal dil işleme ve kümeleme yöntemleri ile müşteri yorumlarının incelenmesi

    Analysis of customer reviews by using natural language processing and clustering methods

    RECEP ALİ AY

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKTO Karatay Üniversitesi

    Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SEMİH YUMUŞAK

  2. Short term electricity load forecasting with deep learning

    Derin öğrenme ile kısa dönemli elektrik yük talep tahmini

    İBRAHİM YAZICI

    Doktora

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖMER FARUK BEYCA

  3. Electricity consumption forecasting of turkey usingrecurrent neural networks

    Tekrarlayan sınır ağlarıyla Türkiyenin elektriktüketim tahmini

    FATEMEH GANDOMI TAJRAQ

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Bilim ve Teknolojiİstanbul Teknik Üniversitesi

    Bilişim Uygulamaları Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SEFER BADAY

  4. Enabling adaptive road lighting through lighting class prediction with real time and historical data

    Gerçek zamanlı ve geçmiş veriye dayanan aydınlatma sınıfı tahmini ile uyarlanabilir yol aydınlatmasının sağlanması

    HASAN MERT TOKGÖZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Enerjiİstanbul Teknik Üniversitesi

    Enerji Bilim ve Teknoloji Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MUSTAFA BERKER YURTSEVEN

  5. New deep learning based approaches for land cover classificationin satellite images

    Uydu görüntülerinde arazi örtüsü sınıflandırması için yeni derin öğrenme tabanlı yaklaşımlar

    BAHAA AWAD

    Doktora

    İngilizce

    İngilizce

    2025

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. IŞIN ERER