Geri Dön

Vision transformer-based physics informed CFD prediction of axial fans with self-supervised contrastive learning for enhanced geometric sensitivity

Eksenel fanlarda geometrik farklılıkların yakalanmasına yönelik kontrastif öğrenme destekli, fizik bilinçli vısıon transformer tabanlı CFD tahmini

  1. Tez No: 955270
  2. Yazar: MEHMET FATİH REYHAN
  3. Danışmanlar: DOÇ. DR. BAHA ZAFER
  4. Tez Türü: Yüksek Lisans
  5. Konular: Uçak Mühendisliği, Aeronautical Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: İngilizce
  9. Üniversite: İstanbul Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Uçak ve Uzay Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Uçak ve Uzay Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 81

Özet

Bu tez çalışmasında, çok kademeli fan geometrilerinin aerodinamik performansını hızlı ve fiziksel olarak tutarlı bir şekilde tahmin etmek amacıyla fizik bilinciyle yapılandırılmış bir derin öğrenme modeli geliştirilmiştir. Hesaplamalı Akışkanlar Dinamiği yöntemleri, özellikle yüksek çözünürlüklü ve doğruluğu yüksek çözümler sağlamak açısından güçlü olsa da, her tasarım iterasyonunda baştan çözüm alınmasının getirdiği yüksek hesaplama maliyeti, bu yöntemlerin pratik uygulamalarda sınırlı kalmasına neden olmaktadır. Özellikle turbomakinelerde farklı devirlerde ve koşullarda (stall/choke) hesaplamaların gerekliliği yüksek bir hesaplama maliyeti oluşturmaktadır. Bu nedenle, hem doğruluğu hem de hesaplama verimliliği hedefleyen yapay zeka tabanlı tahmin sistemlerine olan ihtiyaç giderek artmaktadır. Literatürde son yıllarda turbomakine alanında derin öğrenme tabanlı birçok çalışma yapılmıştır. Bu çalışmalar genellikle belirli bir geometrik konfigürasyon veya sınırlı bir operasyonel rejim için özel olarak geliştirilmiş modeller sunmaktadır. Kimi çalışmalar doğrudan akış alanı tahmini üzerine odaklanırken, kimileri ise basınç kaybı ya da deviasyon gibi türetilmiş parametrelerin tahminine yönelmiştir. Bununla birlikte, bu modellerin büyük çoğunluğu yalnızca sınırlı sayıda girişe ve dar bir tasarım aralığına sahip olup, farklı sınır koşullarına ve tasarımsal varyasyonlara karşı genelleme yapma kapasitesine sahip değildir. Literatürde, özellikle tasarım iterasyonlarını yönlendirecek; farklı geometrilerle, çoklu sınır koşulları altında çalışabilen ve fiziksel anlamda genelleştirilebilir bir model eksikliği göze çarpmaktadır. Bu çalışma, söz konusu boşluğu doldurmayı hedeflemekte ve fiziksel tutarlılığı sağlayabilen, geometrideki değişimlere karşı hassas ve sınır koşullarına göre doğru sonuçlar verebilen genel amaçlı bir tahmin modeli geliştirmeyi amaçlamaktadır. Modelin eğitimi ve değerlendirmesi için kullanılan veri seti, NUMECA yazılımı ile daha önce TEI bünyesinde çözülmüş toplam 1600 adet CFD sonucundan oluşturulmuştur. Veri seti, farklı RPM değerlerinde, iki ve üç kademeli fan konfigürasyonlarında, değişen çıkış basınçları ve farklı geometrilerdeki eksenel fan çözümlerini içermektedir. Bazı konfigürasyonlarda IGV ve OGV bulunurken, bazılarında bu elemanlar yer almamaktadır. Bu çeşitlilik sayesinde hem tasarım noktası hem de tasarım noktası dışındaki koşullarda modelin genelleme yeteneği sınanabilmiştir. CFD verileri işlenirken, her rotor ve stator kanatçıklarının önünde ve arkasında tanımlanan akış düzlemlerinden, radyal yönde 15 adet streamtube oluşturulmuştur. Bu streamtube düzlemleri, radyal yönde eşit kütlesel debi taşıyacak şekilde oluşturulmuş ve her bir kesitten toplam ve statik basınç, sıcaklık, Mach sayısı gibi fiziksel parametreler çıkarılmıştır. Bu yapılandırma, modelin hem spanwise hem de streamwise yönde anlamlı çıkışlar üretmesini mümkün kılmıştır. Geometri verileri, endüstride yaygın olarak kullanılan geomTurbo formatında elde edilmiştir. Bu format, her rotor veya stator kanadının basınç ve emme yüzeylerine ait noktasal koordinatlarını içermektedir. Başlangıçta Kartezyen koordinat sisteminde tanımlanmış olan bu veriler, modelin turbomakinalardaki simetrik yapıyı daha etkin öğrenebilmesi amacıyla kutupsal koordinat sistemine dönüştürülmüştür. Elde edilen koordinatlar, her bir kanat yüzeyi için radyal, açısal ve eksensel bileşenleri içerecek şekilde yapılandırılmıştır. Böylece her bir geometri örneği, suction ve pressure yüzeyleri için toplam 6 kanallı bir tensör olarak temsil edilmiştir. Modelin girişinde kullanılacak geometrik tensörlerin boyutu sabit tutulabilmesi için, maksimum üç kademe ve bir IGV (yani yedi rotor/stator sırası) içerecek şekilde yapılandırılmıştır. Veri setinde yer alan bazı örneklerin yalnızca iki ya da üç kademeye sahip olması nedeniyle, eksik kalan kısımlar sıfırlarla doldurulmuş, yani padding işlemi uygulanmıştır. Ancak verilerin bu yapay kısımlarının, modelin öğrenme sürecini olumsuz etkilememesi ve dikkat mekanizması içinde hesaba katılmaması için, attention mask adı verilen özel bir maskeleme stratejisi kullanılmıştır. Bu strateji sayesinde, sadece gerçek (yani fiziksel olarak mevcut) koordinatlar birbirleriyle bilgi alışverişi yapabilirken; doldurulmuş (sıfırlanmış) kısımlar tamamen izole edilmiştir. Böylece model, sadece geçerli geometrik içerik üzerinden öğrenme gerçekleştirir ve sahte girişlerin eğitimi bozmasının önüne geçer. Modelin mimarisi olarak iki ana yapıdan oluşmaktadır: encoder ve decoder. Encoder tarafında, Vision Transformer (ViT) mimarisinden esinlenilmiş özel bir yapı kullanılmaktadır. Giriş geometrisi, önce 3 kanat kesidini ve her kanat yüzeyi için 225 noktayı kapsayacak şekilde parçalara (patch) bölünmektedir. Her bir parça, 3x225 boyutundaki bir bölgeyi temsil eder ve bu bölgeden 192 boyutlu bir öznitelik vektörü çıkarılmaktadır. Tüm geometri, bu şekilde 35 perçaya bölünmekte (5 span x 7 sıra) ve bu parçalar ardışık bir sırayla Transformer katmanlarına verilmektedir. Bu katmanlar içerisinde hem dikkat mekanizmaları, hem normalizasyon katmanları hem de atlama bağlantıları (skip-connection) bulunmaktadır. Encoder'ın iç yapısında, her bir 3x225'lik tensörü temsil eden parçaların vektörlerei çok başlı dikkat (multi-head self-attention) ve beslemeli ileri ağlar (feed-forward networks) içeren katmanlar boyunca işlenmektedir. Bu yapılar, her bir geometrik parçanın diğer tüm parçalarla olan ilişkisini modelleyerek, uzun menzilli ve çapraz etkileşimleri yakalayabilmektedir. Attention mask, bu katmanlar içinde doğrudan dikkat skorlarına uygulanmakta; geçersiz (padding ile doldurulmuş) parçaların dikkate alınmaması sağlanmaktadır. Bu, modelin sadece fiziksel olarak mevcut geometri bölümleri arasında ilişki kurmasına olanak tanır. Buna ek olarak encoder mimarisine, standart Vision Transformer mimarisinden farklı olarak öğrenilebilir bir giriş istasyonu (learnable inlet station) adlı bir vektör eklenmiştir. Bu vektör, giriş koşullarına karşılık gelen sabit bir istasyonu temsil eder ve eğitim sürecinde öğrenilir. Encoder tarafından çıkarılan tüm parçalarla birlikte bu özel vektör de işlenerek, modelin başlangıç akış koşullarını yapısal olarak anlamlandırmasına katkı sağlanır. Böylece, geometrik temsile fiziksel anlam katılmış olur. Decoder tarafında üç önemli yapı yer almaktadır. İlk olarak, dikkat tabanlı bir upsampler modülü ile 40 parçadan (5 span x 8 istasyon) oluşan encoder çıktısı, 120 parçaya çıkarılarak 15 span × 8 istasyonluk bir yapı oluşturulmaktadır. Daha sonra, Boundary Conditioning modülü devreye girmekte; burada giriş koşulları (örneğin RPM, giriş toplam basınç ve sıcaklık) FiLM (Feature-wise Linear Modulation) yöntemi ile modele işlenmekte, çıkış basıncı gibi downstream koşullar ise cross-attention ile geometrik özelliklere bağlanmaktadır. Bu sayede model, sınır koşullarına duyarlı tahminler üretmekte ve speedline üzerindeki konumunu doğru yakalamayı (stall veya choke rejiminde olup olmadığını) öğrenmektedir. Son aşamada, beslemeli ileri ağlardan (feed-forward networks) oluşan projector modülü, 192 boyutlu vektörleri fiziksel çıktılara dönüştürmektedir. Elde edilen tensör, 7 farklı büyüklüğü temsil eden ve 15 span × 8 istasyonluk bir çıktıya dönüştürülmektedir. Modelin eğitimi iki aşamalı olarak gerçekleştirilmiştir. İlk olarak encoder, kontrastif öğrenme yöntemi ile eğitilmiş; benzer geometriler yakın, farklı olanlar uzak temsillerle kodlanacak şekilde NT-Xent kaybı kullanılmıştır. Bu sayede model, minimal geometrik farkları bile ayrıştırabilir hâle gelmiştir. Ardından encoder dondurularak, decoder kısmı CFD verileri üzerinden eğitilmiştir. Eğitim sürecinde yalnızca yüzde bazlı hata dikkate alınmamış, aynı zamanda iki fizik temelli kayıp fonksiyonu entegre edilmiştir. Bunlardan ilki, süreklilik (continuity) ilkesine dayanan ve tüm istasyonlarda kütle korunumunu sağlayan bir hata fonksiyonudur. İkincisi ise izantropik akış koşullarından türetilmiş ve statik parametrelerden hesaplanan teorik toplam basınç ve sıcaklık ile modelin tahmin ettiği değerler karşılaştırılarak oluşturulmuştur. Modelin toplam kaybı, bu üç farklı kaybın toplamından oluşmuş ve eğitim, toplam hata oranı yüzde birin altına düştüğünde durdurulmuştur. Yüzde kayıba ek olarak eklenen bu iki fiziksel kayıp sayesinde modelin genelleştirme kabiliyeti artmıştır. Modelin değerlendirme sürecinde hem doğrudan tahmin edilen hem de hesaplanan büyüklükler üzerinden analiz yapılmıştır. Yüksek, orta ve düşük hızlarda yapılan testlerde modelin, spanwise ve streamwise yönde hem doğruluğu hem de fiziksel eğilimleri başarıyla yakaladığı gösterilmiştir. Ayrıca model, düşük veri içeren stall ve choke bölgelerinde bile CFD ile tutarlı eğilimler göstermiştir. Bununla birlikte, speedline üzerindeki nokta tahminlerinde model, çalışma rejimini RPM ve çıkış basıncı değerine göre doğru bir şekilde konumlandırabilmiş ve beklenen eğilimleri yansıtmıştır. Son olarak, modelin farklı geometrik varyasyonlara karşı duyarlılığı incelenmiştir. Küçük değişiklikler içeren ancak fiziksel anlamı büyük olan modifikasyonlarda, örneğin metal açı değişimi ve hub yarıçapındaki küçülme gibi durumlarda modelin çıktıları CFD ile aynı yönde eğilim göstermiştir. Bu da modelin yalnızca veri ezberleyen bir yapı değil, fiziksel neden-sonuç ilişkilerini öğrenebilen ve tasarım sürecinde karar destek aracı olarak kullanılabilecek bir yapı olduğunu ortaya koymaktadır. Bu tez kapsamında geliştirilen fizik bilincine sahip, kontrastif ön-eğitimle desteklenmiş ViT tabanlı derin öğrenme modeli, turbomakine aerodinamiğinde hem doğruluk hem de hesaplama verimliliği açısından umut verici bir alternatif sunmaktadır. Modelin gelecekte daha fazla veri setiyle eğitilmesi, fiziksel kısıtların çeşitlendirilmesi, endüstriyel uygulamalar için çok daha yetkin bir tahmin aracı ortaya çıkaracaktır.

Özet (Çeviri)

In recent years, deep learning has emerged as a transformative approach in aerodynamic modeling, offering efficient alternatives to Computational Fluid Dynamics methods, particularly for design-intensive applications in turbomachinery. This thesis proposes a physics-informed deep learning framework for predicting aerodynamic performance parameters across multi-stage fan geometries, leveraging the Vision Transformer (ViT) architecture for its capacity to model complex spatial patterns and geometric variability. The proposed architecture is composed of an encoder-decoder structure specifically designed for turbomachinery geometries. The encoder utilizes a ViT backbone, where input geometries are divided into non-overlapping patches and embedded into high-dimensional feature vectors via convolutional patch embedding. Positional encoding is added to preserve spatial structure, followed by multiple self-attention layers that extract long-range geometric dependencies. To account for varying stage configurations, attention masking and a learnable inlet station token are integrated into the encoder pipeline. The decoder begins with an attention-based upsampler that increases the spatial resolution of the latent representation, followed by a boundary conditioning module that modulates the geometric features using Feature-wise Linear Modulation (FiLM) for inlet conditions and cross-attention for RPM and outlet pressure. The final stage of the decoder, referred to as the projector, consists of multi-layer perceptrons that reduce the feature dimensionality and map the encoded information to the target output space. The architecture is carefully designed to ensure that both spatial and physical structures are retained throughout the transformation. To enhance geometric sensitivity and avoid overfitting to global input–output mappings, the encoder is first pretrained using contrastive learning with the NT-Xent loss. This step enables the model to distinguish subtle geometric variations, which are critical in turbomachinery design. The decoder is then fine-tuned using supervised learning, guided by a combination of a percentage-based loss and two physics-based losses: a continuity loss enforcing mass conservation, and an isentropic loss ensuring thermodynamic consistency between predicted flow variables. The model is evaluated across a comprehensive CFD dataset covering multiple speedlines and six distinct fan designs, including variations in metal angle and hub radius. The results demonstrate that the model successfully captures both radial and streamwise flow behaviors, performs reliably across off-design operating conditions, and accurately simulates performance trends in response to design modifications. Notably, even with subtle geometric changes, the model reflects physically consistent shifts in aerodynamic quantities. This work highlights the efficacy of integrating self-supervised learning with physics-based constraints in achieving generalizable, computationally efficient aerodynamic models. The approach offers significant promise as a surrogate model for accelerating turbomachinery design cycles and supporting early-stage performance evaluations under varying geometric and operational scenarios.

Benzer Tezler

  1. Learning-based reconstruction methods for magnetic particle imaging

    Manyetik parçacık görüntüleme için öğrenme tabanlı geriçatım teknikleri

    ALPER GÜNGÖR

    Doktora

    İngilizce

    İngilizce

    2023

    Elektrik ve Elektronik Mühendisliğiİhsan Doğramacı Bilkent Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. TOLGA ÇUKUR

  2. Grafik işlemci birimi üzerinde genel amaçlı hesaplama yöntemi ile görüntülerin gerçek zamanlı ortorektifikasyonu

    Real time orthorectification of images by general purpose computation on graphical processing units method

    HAKAN ŞAHİN

    Doktora

    Türkçe

    Türkçe

    2016

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET SITKI KÜLÜR

  3. Öğrenen organizasyonlar profili

    Başlık çevirisi yok

    CENK ALTUN

    Yüksek Lisans

    Türkçe

    Türkçe

    1998

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Yöneylem Araştırması Ana Bilim Dalı

    DOÇ. DR. SEÇKİN POLAT

  4. Vision transformer tabanlı öz denetimli öğrenme ile histopatolojik görüntülerde mitoz hücrelerinin tespiti

    Detection of mitosis cell in histopathological images using vit-based self-supervised learning

    MUHAMMED CİHAD ARSLANOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDicle Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ HÜSEYİN ACAR

    DOÇ. DR. ABDÜLKADİR ALBAYRAK