Geri Dön

Architectural section generation and semantic evaluation with deep learning methods

Derin öğrenme yöntemleri ile mimari kesit üretimi ve anlamsal değerlendirilmesi

  1. Tez No: 958831
  2. Yazar: ECE SAVAŞ
  3. Danışmanlar: PROF. DR. MİNE ÖZKAR KABAKÇIOĞLU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Mimarlık, Architecture
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: İngilizce
  9. Üniversite: İstanbul Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilişim Ana Bilim Dalı
  12. Bilim Dalı: Mimari Tasarımda Bilişim Bilim Dalı
  13. Sayfa Sayısı: 117

Özet

Mimarlıkta mekanın anlaşılması, tasarlanması ve temsil edilmesinde mimari kesit çizimleri temel bir araç olarak öne çıkar. Özellikle ortografik kesitler, farklı yapı katmanlarının, mekânsal ilişkilerin karmaşık detaylarının ve taşıyıcı sistem gibi yapısal elemanların hassas bir biçimde aktarılmasına olanak tanıyan güçlü bir temsil biçimi sunar. Bu çizimler, bir yapının iç işleyişini, yüksekliğini, ışık ve gölge ilişkilerini, malzeme geçişlerini tek bir düzlemde gözler önüne serebilmektedir. Ancak mimari temsilin tarihsel evriminde, plan çizimlerinin merkezi bir rol oynaması, kesit çizimlerinin çoğunlukla ikincil planda kalmasına neden olduğu söylenebilir. Antik ve tarihi yapılara ait plan çizimlerine ulaşmak genellikle daha kolayken, kesit çizimleri çoğu zaman kapsamlı restitüsyon çalışmaları veya derinlemesine araştırmalar sonucunda elde edilebilmektedir (Lotz, 1977). Bu durum, kesitlerin sadece bir tasarım aracı olmakla kalmayıp, aynı zamanda kültürel mirasın belgelenmesi, korunması ve yeniden yorumlanması süreçlerinde de kritik bir öneme sahip olduğunu açıkça göstermektedir. Kesit çizimlerine ilişkin bu tarihsel bilgi eksikliği ve sınırlı arşiv erişimi, özellikle tarihi yapılar üzerinde yapılacak dijital analiz ve üretken tasarım süreçlerini önemli ölçüde zorlaştırmaktadır. Üretken sistemlerle mimari tartışma ortamları var olan durumların özellikle plan çizimleri ile tartışmaları kuralseti gibi tasarım ölçütleri ile yaratılabilirken kesitlerde bu durum geri planda kalmıştır. Bu bağlamda, bu çalışma, Rönesans dönemi mimarlarından Andrea Palladio'nun villa yapılarındaki plan ve kesit çizimlerini birer vaka çalışması olarak ele alarak, bu alandaki eksikliği gidermeye yönelik bir yöntem önerisi sunmayı hedeflemiştir. Çalışmanın temel hedefi, mimari kesitlerin derin öğrenme tabanlı yöntemlerle, özellikle semantik segmentasyon ve üretken çekişmeli ağlar gibi yaklaşımlarla detaylı bir şekilde analiz edilmesi ve özgün bir şekilde yeniden üretilebilmesidir. Bu yaklaşım, sadece mevcut çizimleri anlamlandırmakla kalmayıp, aynı zamanda olası eksik veya kayıp kesitleri dijital olarak yeniden inşa etme potansiyeli taşımaktadır. Çalışma, mimari kesit çizimlerinin anlaşılması ve üretilmesi için titizlikle tasarlanmış kapsamlı bir derin öğrenme metodolojisini benimsemiştir. İlk aşamada, diğer birçok üretken sistemde görülen kural seti tabanlı tasarım yaklaşımlarının kesit çizimleri için uygulanabilirliği araştırılmıştır. Özellikle Palladio mimarisi bağlamında, plan bazlı sistematik kural setleri oldukça iyi belgelenmiş ve incelenmiş olmasına rağmen, kesitler üzerinden benzer kapsamda kural setleri oluşturan araştırmalara rastlanmamıştır. Palladio'nun kendi mimari tasarım prensiplerini detaylandırdığı“The Four Books of Architecture”adlı eserinde bazı mimari prensiplerden bahsetse de, bu prensiplerin otomatik bir kural setine dönüşüp dönüşmediğini anlamak için derinlemesine incelemeler yapılmıştır. Palladio'nun eserleri, ölçüsel tutarlılık ve geometrik düzen açısından mimarlık literatüründe sıkça incelenmiş, özellikle plan düzleminde sistematik analizlere olanak sağlamıştır. Ancak kesit düzleminde, örneğin tonoz, çatı formları, tavan yükseklikleri ve cephe kompozisyonları gibi unsurların sistematik olarak tanımlanmamış olması, yapısal organizasyonun dijital olarak modellenmesini ve otomatik üretimini zorlaştırmıştır. Bu nedenle, çalışma kapsamında kullanılan kesit verileri, hem güvenilir gerçek arşiv kaynaklarından elde edilmiş hem de derin öğrenme modellerinin eğitimini desteklemek amacıyla rekonstrükte edilmiş üç boyutlu modellerden alınmış kesit dilimlerinden oluşmaktadır. Bu hibrit yaklaşım, veri miktarını artırarak model performansını optimize etmeyi hedeflemiştir. Kesit çizimleri analiz edilirken, geleneksel mekansal organizasyon sınıflandırmalarının ötesine geçerek, kesitlerin yapısal mimari elemanlara göre sınıflandırılması esasına odaklanılmıştır. Bu yaklaşım, kesitlerin planlardan temel farkını ortaya koymak ve derin öğrenme modellerinin mimari elemanları daha iyi tanımasını sağlamak amacıyla benimsenmiştir. Mimari elemanların detaylı analizi için semantik segmentasyon yöntemi kullanılmıştır. Semantik segmentasyon için,U-Net mimarisi tercih edilmiştir, bu segmentasyon süreci, iki ana veri grubunu (plan ve kesit) ayrı ayrı işleyerek gerçekleştirilmiştir. U-Net modelinin performansı, hem plan çizim eğitimi hem de kesit çizim eğitimi aşamalarında“Leave-One-Out Cross-Validation”tekniği kullanılarak değerlendirilmiştir. Bu çapraz doğrulama yöntemi, kıstlı veriseti ile modelin genellenebilirliğini ve farklı veri alt kümeleri üzerindeki tutarlılığını ölçmek için kritik öneme sahiptir. Çalışmada, U-Net modelinin özellikle kesit çizimlerinde, daha fazla sayıda ve çeşitlilikte mimari eleman/sınıf içermesi nedeniyle daha doğru ve detaylı segmentasyon yaptığı gözlemlenmiştir. Ayrıca, bu aşamada üretilen veri setleri arasındaki benzerlik ve çeşitlilik oranları da niceliksel olarak analiz edilerek, veri kalitesinin ve modelin genelleme yeteneğinin anlaşılmasına katkıda bulunulmuştur. Bu araştırma, kesit çizimlerinin sadece görsel üretim aracı olmadığını, aynı zamanda semantik anlam katmanlarını ortaya çıkaran veri odaklı yöntemlerle de ele alınması gerektiğini açıkça göstermiştir. Bu çerçevede, derin öğrenme temelli semantik segmentasyon yaklaşımı, kesitlerde yer alan mimari elemanları yüksek doğrulukla ayırt ederek, hem dijital temsil süreçlerinde hem de kültürel mirasın dijital olarak belgelenmesi ve korunmasında güvenilir bir araç olarak değerlendirilmektedir. Görsel üretimde bulunmak amacıyla, mevcut sınırlı kesit veri seti sorununu aşmak için çalışmada, 3B modeller üzerinden kesit dilimleri alınarak geniş ve zengin bir yeni kesit veri seti oluşturulmuştur. Bu veri arttırımı, derin öğrenme modellerinin daha çeşitli örnekler üzerinde eğitilmesine olanak tanıyarak modelin genelleme yeteneğini artırmıştır. Oluşturulan bu kapsamlı veri seti, farklı derin öğrenme mimarileri ile denenmiştir. Çalışmada ilk olarak mimari plan organizasyonu ve yapay zeka ilişkisine dair kapsamlı bir literatür taraması gerçekleştirilmiş; ardından, StyleGAN, DCGAN ve VAE (Varyasyonel Otoenkoder) gibi önde gelen üretken modeller, oluşturulan sınırlı veri setleriyle test edilmiştir. Bu modellerin saf plan-kesit üretiminde bazı yetersizlikler gösterdiği gözlemlenirken, Pix2pix gibi koşullu veya tahmine dayalı üretken modellerin, özellikle kesit düzleminde eksik veya kısmi elemanlar üzerinden yapının bütününü öngörebilme potansiyeli sunduğu tespit edilmiştir. Pix2pix modeli, eksik kesit alanlarını belirli ölçüde tahmin ederek, hem mimari tipoloji analizi hem de iç mekan ilişkileri açısından yeni tartışma zeminleri yaratmıştır. Bu, özellikle restitüsyon ve tarihi yapıların eksik verilerini tamamlama gibi alanlarda büyük bir potansiyel barındırmaktadır. Deneysel süreçte, VAE deneyleri ve özellikle DCGAN , farklı yaklaşımlarla görsel üretim kapasitelerini test etmek amacıyla detaylı bir şekilde gerçekleştirilmiştir. Bu modellerin başarısını nesnel olarak değerlendirmek için uygun değerlendirme metriklerinden, Fréchet Inception Distance (FID) kullanılmıştır. Yapılan kapsamlı deneyler sonucunda en verimli ve tutarlı sonuçları veren modelin DCGAN olduğu tespit edilmiş ve çalışma bu model üzerinde derinleştirilmiştir. Özellikle DCGAN ile yapılan deneyler, farklı veri seti konfigürasyonları altında detaylandırılmıştır. Konfigürasyonlar bir yapının dikey hattı boyunca birbirini dik kesen akslarınlardan oluşmaktadır. Cephesel ve sagital olarak isimlendirilen bu aksların toplandığı veriseti ise birleşik olarak adlandırılmıştır. Deney sonuçlarında karşılaşılan sdurumlar sonrasında birleşik verisetinin bir kısmı renklendirrilerek renkli birleşik veri seti oluşturulmuştur. Veriseti eğitim sonuçları, kesit çizimlerinin karmaşıklığını ve derin öğrenme modellerinin bu karmaşıklığı nasıl yönettiğini anlamak için kritik adımlar olmuştur. Sonuç olarak, bu tez, mimari kesitlerin makine öğrenmesi yaklaşımlarıyla okunması, kesit çiziminin mimarisini oluşturan parçaların anlaşılması konusunda Plan çalışmalarında karşılaşılan mekan organizasyhonları gibi tasarlama süreçleri kesit çizimlerinde mimari elemanlar yani parçalar olarak açıklanmasının mümkün ve daha verimli olduğu görülmesi sağlanmıştır. Bu yönden derin öğrenme modellerinin, bir tasarım aracı olarak ele alınması karmaşık mimari bilgiyi işleme ve görselleştirme potansiyeli, yeni çalışma alanları açmaktadır. Sonuç olarak bu tez çalışması, Palladio mimarisini kesit çizimleri ile ele alarak bütün içerisindeki yapısal tutarlılığı sorgulamaktadır. Araştırma, kesit çizimleri üzerinden parça-bütün ilişkisini, mimari eleman odaklı veri setlerinin oluşturulması, kesit çizimi alanındaki boşluğunu doldurarak, makine öğrenmesi destekli mimari tasarım ve analiz çalışmalarına ışık tutacak temel bir yönelim olarak ortaya koymaktadır.

Özet (Çeviri)

Architectural section drawings serve as crucial visual tools in the fields of architectural education and professional practice, allowing for a deeper understanding and communication of spatial configurations. Within this classification, orthographic sections stand out for their ability to depict various levels within a structure, showcase the intricate relationships between different spaces, and detail the essential structural elements. Section drawings provide a glimpse into the design, enabling architects to understand how various architectural elements interact and coexist within the overall architectural composition. Throughout architectural history, plan drawings have dominated representation, compared to section drawings, which often require interpretive processes such as documentation (Guillerme and Verin, 1989). Although the definitions and roles of section drawings have evolved throughout architectural history, plan drawings have gradually assumed a more dominant position. The prominence of plans is not only well-established in architectural discourse but also widely reflected in computational design practices. In particular, rule-based design approaches tend to foreground plan drawings, often relegating sections to a secondary role. For a focused discussion on the architectural section, this study proposes a case analysis based on the works of Andrea Palladio, the architect whose design principles and built forms have been extensively examined as one of the canons of architectural history. Thesis aims to investigate the potential of machine learning–based methods, particularly deep learning approaches such as semantic segmentation and generative adversarial networks (GANs), in analyzing and interpreting Palladio's architectural logic through the section plane. Palladio's villas, known for their geometric clarity and dimensional consistency, provide a reliable dataset for this investigation. In the initial phase of the thesis, the spatial ratios, height relationships, and organizational features of Palladian architecture were examined through plan and section drawings. While plan drawings often conform to systematic geometric rules, section drawings present more complex challenges, as they incorporate not only walls, openings, and columns but also ceilings, roofs, and vertical spatial information. At the first stage, Palladio's section drawings were examined, and the results revealed that Palladian sectional drawings do not follow the specific rules that plan drawings do. Space organization can vary depending on the sectioned point. While architectural elements reflect this change, it is possible to distinguish sectional drawings from plan drawings. Palladio's plan drawings, as Stiny and Mitchell (1978) point out, may consist of specific sets of rules; sectional drawings, on the other hand, are not based on these rules, but rather are created by replicating architectural elements and components according to specific principles. While section drawings offer different possibilities, doing a rule-based study is limited. Therefore, in the continuation of the study, various generative networks were employed to generate designs that are not based on rules but exhibit repetitive similarities. Semantic segmentation was applied to understand the section drawings better and to distinguish between plans. Semantic segmentation is a model that assigns each pixel in an image to a meaningful class. Classes of architectural elements were created using semantic segmentation using the U-Net model. This approach aimed not to create new drawings, but to reveal underlying spatial patterns by analyzing and analyzing existing sectional data. Despite the limited dataset, this method successfully distinguished between different spatial and structural components within section drawings, yielding diverse results. This process was similarly applied to plan drawings. Comparing the results of the two different datasets revealed the class diversity in the section dataset and, consequently, the higher accuracy of predictions. The thesis also aimed to test various generative models to facilitate image-based generation. For this phase, a dataset with high-dimensional data was required. After demonstrating the difference between a section drawing and a plan, the goal was to create a dataset and select the most appropriate model to generate Palladian-style sections. One of the biggest limitations of the thesis was creating a dataset for the section. During the dataset research for semantic segmentation, we discovered that the number of section drawings was small. Even Palladio, in his book on his principles, did not include a section on the entire building. In his book, Palladio often refers to sections as detailed drawings. In this context, a real-world cross-section dataset, specifically derived from Bertotti's drawings, was converted into a 3D model format, taking into account Palladio's plan drawings and principles. Cross-section slices from these 3D models then formed the dataset and were used in the relevant training processes. At the next stage, a comprehensive literature review on architecture related and machine learning was conducted to explore these issues, followed by the application of various models, including StyleGAN, DCGAN, and VAE, to a set of collected real datasets and created datasets. Although these generative models yielded limited accuracy and spatial comprehension results, the thesis found that image-based generative model , such as DCGAN, offered more promising outcomes. While not delivering fully defined sections, these models provided approximations of missing spaces and elements, allowing for architectural reasoning about typologies and spatial components. In doing so, they served as image-generation tools and platforms for architectural speculation and discussion. Considering the analyses of previous models and the nature of the obtained outputs, the DCGAN architecture has been chosen for this phase of the thesis to enhance the level of detail. This study continued the analysis of loss graphs, FID scores, and overall visual outputs using the same methods used in previous phases. Furthermore, to provide a more in-depth analysis of the architectural outputs, these outputs were evaluated based on sagittal, frontal, composite, and color composite datasets. Although all the datasets have issues such as overfitting or mode collapse, certain architectural features from the datasets make evaluation possible. The especially colored composite section dataset, which includes a semantic version of the sections, demonstrates more opportunities for future projects. The overall results of the study demonstrate that examining section drawings based on the part-whole relationship of architectural elements offers a more suitable tool for design processes. Plan-based visual generation more clearly presents organizational structures, while section drawings can provide a more layered and semantically rich representation that encompasses structural narratives. Despite the limited dataset, it has been observed that different deep learning models have generated valuable results about section drawings and have revealed the features that distinguish section drawings from plan drawings. Semantic segmentation, in particular, has emerged as an effective tool for extracting meaningful information from complex visual inputs. Semantic segmentation, which highlights the differences between plan and section through classes, enables us to understand the potential of section drawings better. Experiments conducted on DCGAN demonstrate that, despite generating images with less data, the results obtained with classed colored combined section dataset demonstrate that section studies provide significant information about architectural elements and the part-whole relationship. This demonstrates that section drawings extend beyond mere visual representation and serve as a valuable tool for examining the relationships between structural elements in greater depth. Future work plans to focus more on section-based analysis and develop a new dataset specifically targeting architectural elements. This will enable the detailed analysis of section drawings using deep learning methods to gain a better understanding of the internal structural logic of individual components in architectural systems. Predictive modeling techniques have demonstrated utility in tasks such as completing architectural documentation, whereas image generation models offer promising opportunities for creating innovative design proposals. Consequently, a shift in focus toward data-driven approaches, such as semantic segmentation, which can reveal deeper structural and semantic layers, proved necessary. Such methods enable more reliable analysis of architectural section drawings, contributing to design and digital documentation practices. In conclusion, this research offers a methodological framework for reading, analyzing, and reconstructing architectural sections through machine learning techniques. It contributes to understanding spatial organization and design logic while proposing a new approach for digital documentation of cultural heritage. Additionally, it opens up avenues for further discussions on the use of predictive models in design speculation and restitution processes, particularly in relation to Palladian villas. Future work will focus on developing datasets centered around architectural elements and the part–whole relationship, suggesting new pathways for section-based architectural analysis and synthetic reconstruction.

Benzer Tezler

  1. Discovering market insights from online product reviews through sentiment analysis

    Çevrimiçi müşteri yorumları ile duygu analizi ve pazar payı için bir içgörü aracı

    MUHAMMET ALİ KADIOĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ERKAN IŞIKLI

  2. İstanbul'da yerin ruhu (Sâmiha Ayverdi eserleri üzerinden okumak)

    The spirit of place in Istanbul (study from the perspective of Sâmiha Ayverdi's literature)

    BERFU SERDAROĞLU SUBAŞI

    Doktora

    Türkçe

    Türkçe

    2024

    MimarlıkFatih Sultan Mehmet Vakıf Üniversitesi

    Mimarlık Ana Bilim Dalı

    PROF. DR. İBRAHİM NUMAN

  3. Kentin iç mekanları: Ankara belleğinde pasajlar, (1950-1980)

    Urban interiors: Arcades in Ankara memory, (1950-1980)

    GÜLİZ KÜÇÜKTAŞDEMİR

    Sanatta Yeterlik

    Türkçe

    Türkçe

    2018

    İç Mimari ve DekorasyonHacettepe Üniversitesi

    İç Mimarlık ve Çevre Tasarımı Ana Bilim Dalı

    PROF. PELİN YILDIZ

  4. Yapıda döngüsellik

    Circularity in building

    ZEYNEP MELİS OĞUZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    MimarlıkMimar Sinan Güzel Sanatlar Üniversitesi

    Mimarlık Ana Bilim Dalı

    DOÇ. DR. ÖMER ŞÜKRÜ DENİZ

  5. Mimari dil bağlamında bir parametrik biçim grameri

    A Parametrik shape grammer in the context of architectural languages

    SUZAN SANLI

    Yüksek Lisans

    Türkçe

    Türkçe

    1993

    Mimarlıkİstanbul Teknik Üniversitesi

    PROF.DR. GÜLSÜN SAĞLAMER