Mimari tasarımda yapay zekâ yaklaşımı: Makine öğrenmesi ile mekân işlevlerinin tanınması ve üretken çekişmeli ağlarla mimari plan üretimi
Artificial intelligence approach in architectural design: Recognition of space functions with machine learning and architectural plan generation with generative adversarial networks
- Tez No: 901564
- Danışmanlar: PROF. DR. GÜLEN ÇAĞDAŞ, DR. ÖĞR. ÜYESİ İBRAHİM ZİNCİR
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Mimarlık, Computer Engineering and Computer Science and Control, Architecture
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilişim Ana Bilim Dalı
- Bilim Dalı: Mimari Tasarımda Bilişim Bilim Dalı
- Sayfa Sayısı: 186
Özet
Mimari tasarımda yapay zekânın işbirlikçi potansiyelini araştıran bu tez çalışmasında, mimari konut kat planlarında temsil edilen mekânların, makine öğrenmesi (machine learning -ML) algoritmaları ile tanınmasını ve derin öğrenme ağlarından, üretken çekişmeli ağlar (generative adversarial newtork- GAN) ile oluşturulacak modelde yeniden üretimini hedefleyen bir yaklaşım sunulmaktadır. Çalışma, mimari kat planlarındaki karmaşık mekânsal ilişkilerin yapay zekâ algoritmaları tarafından anlaşılması ve yeni kat planlarının üretilmesine odaklanan iki model önerisi getirmektedir. Derin üretken modeller tasarımları üretmek için bir dizi örnekten öğrenme konusunda etkileyici bir yetenek göstermektedir. Bu tez kapsamında da potansiyel olarak görünen derin öğrenme algoritmalarının konut planlarının üretilmesi konusundaki etkinliği araştırılacaktır. Konut, oturma odası, yemek odası gibi etkileşim ve ortak yaşam alanı özelliği taşıyan mekânların yanı sıra yatak odası, giyinme odası, banyo gibi bireyin mahremiyetine özgü mekânların yer aldığı, birçok farklı seviyede ilişki barındıran geniş bir alan sunmaktadır. Açık planlı mekânlar, bir yapı içindeki iç mekânların duvar, kapı gibi geleneksel bölme elemanlarından bilinçli olarak arındırıldığı bir tasarım yaklaşımını ifade eder. Mekânların hangi elemanlar ile birbirinden ayrıldığı mekânsal deneyimi farklılaştırmaktadır. Açık düzen tipik olarak bir alandan diğerine sorunsuz bir şekilde akan birbirine bağlı ve görsel olarak sürekli alanlar içerir. Araştırma, ayırıcı unsur olarak duvarların bulunmadığı açık plan düzenlemesi ile karakterize edilen konutlardaki işlevsel mekân farklılaşmalarının araştırılması yoluyla literatürdeki bir boşluğa değinerek katkıda bulunmaktadır. Ortogonal plan setlerinin yanında açılı ve eğrisel planlarda da uygulamanın yapılması, topolojik ilişki yanında mekânlar arası görsel ilişkinin de tanıma ve üretim süreçlerinde dikkate alınması, tek katlı konut planlarına ek olarak iki katlı konut planlarında düşey sirkülasyon ve katlar arası mekânsal ve görsel ilişkinin de göz önünde bulundurulması gibi hedefler aynı zamanda çalışmanın özgün yönlerini de oluşturmaktadır. Makine öğrenmesi ile oluşturulan tanıma modeliyle, mekân işlevlerinin gerektirdiği topolojik ve görsel ilişkiler açısından işlevlerin tanınması için yeni bir yöntem sunulmaktadır. ML aracılığıyla daha yüksek görsel ilişkiye ve fiziksel erişilebilirliğe sahip olan oturma odaları gibi ortak alanların, yatak odası ve banyo gibi mahremiyet nedeniyle daha az görsel ve fiziksel ilişkiye sahip mekânlardan ayrıştırılması beklenmektedir. Önerilen model 20. yüzyılın önde gelen mimarlarının tek ve iki katlı konut planlarına uygulanmıştır. Performansları karşılaştırmalı olarak değerlendirilen beş farklı ML modeli arasında en iyi sonuçlar Cascade Forward Neural Networks (CFNN) ile elde edilmiş ve ortalama model başarısı %93 olarak hesaplanmıştır. Bu farklı ML modellerini etkileyen özellikler SHAP değerlerine göre incelenmiş ve genişlik, kontrol, 3 boyutlu görünürlük ve 3 boyutlu doğal gün ışığı özelliklerinin en etkili olanlar arasında olduğu gözlenmektedir. Beş farklı ML modelinin sonuçları, mimari mekân işlevlerinin tanınmasında, topolojik ve 3 boyutlu görsel ilişki özelliklerinin kullanılmasının, yüksek düzeyde sınıflandırma doğruluğu sağladığını göstermektedir. Bulgular, tanıma modelinin daha verimli ve uyarlanabilir kat planı tasarımı, bina yönetimi ve etkili yeniden kullanım stratejileri geliştirmenin önemli bir parçası olabileceğini göstermektedir. Tanıma modeli sonucunda, mekân işlevlerine göre RGB renk kodları ile tanımlanan ve etiketlenen kat planı verisi, üretken modelde girdi niteliğinde kullanılmaktadır. Buna ek olarak literatürde sıkça kullanılan R2V ve R3D veri setleri, görsel veri boyutunu ve çeşitliliğini arttırmak için çalışmaya dahil edilmiştir. Açık plan düzeninin RGB etiket gösterimi için geçişli renklendirme yöntemi önerilmektedir. Bu yöntem ile mekânsal işlev değişimi, iki farklı işlev renginin geçişi şekilde temsil edilmektedir. Üretken modelde planın formu, algoritmanın bir dış sınıra bağlı kalarak işlevleri üretmesi için girdi olarak verilmektedir. Buna göre derin ağın, verilen sınırlar içerisinde nasıl bir mekânsal düzenleme önereceğinin izlenmesi amaçlanmaktadır. Ayrıca çalışma, önerilen metodolojiyi dik açılı planların yanı sıra açısal ve eğrisel plan setlerine de uygulayarak bu araştırmayı genişletmektedir.GAN'ların kullanıldığı üretken modelde, mekânsal belirsizliği, mahremiyeti ve görsel ilişkileri göz önünde bulundurarak kat planı tasarımlarının oluşturulması hedeflenmiştir. Açık plan düzenlerini ve mekânsal mahremiyet gereksinimlerini tanımada ve yeniden üretmede başarılı sonuçlar elde edilmiştir. Dikdörtgen, ortogonal, açılı ve eğrisel planlar dahil olmak üzere farklı plan formları üzerinde eğitilen derin üretken model, farklı çözüm yöntemleri önermektedir. Derin öğrenme algoritmaları, iki katlı planlarda da düşey sirkülasyon elemanlarını ve katlar arası ilişkileri tanımakta ve yeniden üretebilmektedir. Ancak bunların etkinliği, eğitim veri kümelerinin çeşitliliğine ve sayısına bağlıdır. Sonuç olarak, derin öğrenme algoritmaları mimari tasarımda önemli gelişme potansiyelleri taşırken, mimarlar da mekânsal tasarım ilkelerini, insan merkezli tasarımı ve estetik yönleri ön planda tuttuklarından emin olmak için bu modellerin gelişimlerine aktif olarak katkıda bulunmalıdır. Yapay zekâ teknolojilerinden etkin bir şekilde yararlanmak, mimarların tasarımları için hızlıca alternatif üretmesine olanak tanıyarak yapılı ortamın işlevselliğini arttırabilecektir. Derin öğrenme yöntemi ile önerilen konut planları için üretken model, bu yöntemle geliştirilen ilk örneklerden olup mimar ve tasarımcılara erken tasarım evresinde destek sağlayacak bir model niteliği taşımaktadır.
Özet (Çeviri)
In this thesis study, which investigates the collaborative potential of artificial intelligence (AI) in architectural design, the spaces represented in architectural residential floor plans are recognized with machine learning (ML) and the generative model to be created with generative adversarial newtork (GAN). An approach targeting reproduction is presented. The study proposes two models that focus on the understanding and generation of complex relationships in architectural floor plans by AI algorithms. Deep generative models show an impressive ability to learn from a set of examples to generate designs. Within the scope of this thesis, the effectiveness of deep learning algorithms, which appear to be potential, in generating housing plans is investigated. Housing offers a wide range of activities that involve relationships at many different levels, including spaces that are areas of interaction and common living, such as the living room and dining room, as well as spaces specific to the privacy of the individual, such as the bedroom, dressing room, and bathroom. Open-plan spaces refer to a design approach in which interior spaces within a building are deliberately free of traditional partition elements such as walls and doors. The elements by which spaces are separated from each other differentiate the spatial experience. Open layouts typically include interconnected and visually continuous spaces that flow seamlessly from one space to another. The research contributes by addressing a gap in the literature by investigating functional space differentiation in residences characterized by open plan arrangement without walls as a separating element. In the proposed study: (i) application is made in vertical plan sets as well as angled and circular plans, (ii) including the visual relationship as well as the topological relationship between spaces in the recognition and generation processes, (iii) taking into account vertical circulation and the spatial and visual relationship between floors in two-storey housing plans, in addition to single-storey housing plans, such processes constitute the unique aspects of the study. The recognition model incorporates visual and topological relations through machine learning algorithms in residential floor plans. The machine learning (ML) approach holds the potential to emerge as a significant collaborative tool for architects, as it learns and comprehends the intricate relationships inherent in architectural floor plans. This novel methodology entails an in-depth exploration of geometric, visual, and topological variables defining architectural space functions. The analysis involves measuring geometric attributes, conducting 3D visual assessments, and evaluating topological relationships within the dataset. It's important to highlight that the proposed approach relies on comprehensive analysis data to be effectively implemented. This study employs five machine learning-based algorithms to conduct a thorough examination of various methods for feature analysis in space classification. These algorithms include support vector machine (SVM), decision tree (DT), random forest (RF), feed-forward neural network (FFNN), and cascade forward neural networks (CFNN). Evaluation of ML algorithm performance is conducted based on metrics such as accuracy, precision, recall, F-measure, and AUC. Furthermore, the significance of each feature is assessed through SHAP value analysis. The recognition model achieves high classification accuracy, particularly distinguishing between common areas with higher visual accessibility (e.g., living rooms) and private spaces with less visual connection (e.g., bedrooms). The Cascade Forward Neural Network (CFNN) model performs best, with an average success rate of 93%. As a result of the recognition model, floor plan data defined and labeled with RGB color codes according to space functions is used as input in the generative model. In addition, R2V and R3D datasets, which are frequently used in the literature, were included in the study to increase the visual data size and diversity. The R2V dataset primarily consists of floor plans with rectangular shapes and uniform wall thickness. A total of 182 plan images were incorporated into the study, with 131 featuring an open plan layout. In contrast, the R3D dataset, includes curved shaped floor plans. Out of the 216 plan images in the R3D dataset, 125 exhibit an open plan layout. Notably, unlike the R2V dataset, the R3D dataset comprises non-orthogonal plan sets characterized by nonuniform wall thickness. While 168 images from the R2V plan set adhere to orthogonal plans, this number decreases significantly to 132 in the R3D dataset. Both datasets are publicly available and can be accessed through the provided references. A gradient coloring method is proposed for RGB label representation of open-plan layout. It aims to generate floor plan designs within specified boundaries, considering spatial uncertainty, privacy, and visual relationships. Using this method, the spatial function change is represented in the figure as the transition of two different function colors. In the generative model, the form of the plan is given as input for the algorithm to produce functions adhering to an outer limit. Different plan forms (e.g., rectangular, angled, curved) influence spatial organization and user experience in generated designs. Deep learning algorithms adapt to various plan forms, offering diverse design solutions and improving vertical circulation in two-story floor plans. Accordingly, it is aimed to monitor what kind of spatial arrangement the deep network will propose within the given boundaries. The study expands this research by applying the proposed methodology to angled and curved plan sets as well as right-angled plans. In the generative model using GANs, it is aimed to create floor plan designs taking into account spatial uncertainty, privacy and visual relationships. The generative model utilizes the GAN network, designed for the task of image-to-image translation. These networks are trained to learn the mapping from an input image to an output image, effectively synthesizing new visuals from existing ones. Notably, it has demonstrated effectiveness in various applications such as generating images from semantic label maps, reconstructing objects from edge maps, and colorizing images. The architecture comprises two primary components: the generator and the discriminator. The discriminator network is trained to distinguish between real and generated images present in the training dataset. On the other hand, the generative network takes a floor plan footprint image as input, aiming to produce visuals that closely resemble those in the training set. During training, the discriminator evaluates whether the generated images are real or fabricated. Over time, as the generative network evolves, it becomes proficient in generating increasingly realistic images, while the discriminator becomes adept at discerning between genuine and synthetic visuals. The refinement of the generative network is guided by feedback based on the error values computed using the discriminator's loss function. Through this adversarial training process, the objective is to reach a Nash equilibrium, where the generated images are virtually indistinguishable from real ones. Deep learning algorithms enable the generation of new architectural plans through generative models like GANs, leveraging learned patterns and features from existing datasets. The study highlights the importance of spatial uncertainty, privacy, and visual relationships in architectural space production, emphasizing the need for flexible models that capture open-plan relationships. However, while current generative models excel in exploring design possibilities, their precision in rendering architectural details remains limited, necessitating further development. Successful results have been achieved in recognizing and generating open plan layouts and spatial privacy requirements. Deep learning models trained on different plan forms, including rectangular, orthogonal, angled and curved plans, propose different solution methods. The choice of plan form significantly influences spatial organization and functionality in architectural designs, with deep learning algorithms showcasing adaptability across various plan forms. Notably, the study underscores the importance of considering architectural geometry and functional axes in circulation space analysis across different plan forms. In the context of multi-storey floor plans, deep learning algorithms demonstrate success in recognizing vertical circulation elements and spatial relationships between floors, despite difficulties in capturing third-dimensional spatial components. However, their effectiveness depends on the diversity and number of training datasets. Despite the limitations of pixel-based generative models, their role in recognizing spatial patterns and topological relationships underlines their importance in supporting architects in design research. As a result, while artificial intelligence algorithms carry a significant development potential in architectural design, architects need to actively contribute to the development of these models and prioritize spatial design principles, human-centered design and aesthetic aspects. Effective use of artificial intelligence technologies allows architects to quickly generate alternatives for their designs. Architects can thus explore design possibilities, optimize spatial layouts and improve the functionality and aesthetics of the built environment. As a result, the proposed generative model for housing plans developed with deep learning methods serves as a valuable tool for architects and designers at the early design stage. The research contributes to both academic knowledge and practical design applications by highlighting the potential of artificial intelligence in architectural design. Ultimately, the study highlights the symbiotic relationship between architecture and AI, with architectural datasets serving as valuable training data for AI algorithms. Architects are encouraged to actively contribute to the development of artificial intelligence models that prioritize spatial design principles, human-centered design and aesthetic concerns, thereby expanding the boundaries of design possibilities and encouraging innovation in architectural practice.
Benzer Tezler
- Sistemli mimari tasarım sürecinde üretken bir yapay yardımcı önerisi
Proposal for a productive artificial aid in the systematic architectural design process
BETÜL ŞEN
Yüksek Lisans
Türkçe
2024
Mimarlıkİstanbul Teknik ÜniversitesiBilişim Ana Bilim Dalı
PROF. DR. YÜKSEL DEMİR
- From black box to transparency: Advances in ai-drivenco-creation in architectural design
Kara kutudan şeffaflığa: Mimari tasarımda yapay zeka destekli ortak yaratımdaki ilerlemeler
SEVDA BAŞAR
Yüksek Lisans
İngilizce
2024
MimarlıkTOBB Ekonomi ve Teknoloji ÜniversitesiMimarlık Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ZELAL ÇINAR
- Fake news classification using machine learning and deep learning approaches
Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması
SAJA ABDULHALEEM MAHMOOD AL-OBAIDI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR
- Deep learning-based behavior analysis of seafarers
Derin öğrenme tabanlı gemi adamlarının davranış analizi
VEYSEL GÖKÇEK
Doktora
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiDeniz Ulaştırma Mühendisliği Ana Bilim Dalı
DOÇ. DR. GAZİ KOÇAK
DR. ÖĞR. ÜYESİ YAKUP GENÇ
- Game-based learning in architecture education: Consolidating visual design principles in freshmen
Mimarlık eğitiminde oyun-tabanlı öğrenme: Mimarlık 1. sınıf öğrencilerinde görsel tasarım ilkelerinin pekiştirilmesi
MERT KARAKAYA
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiOyun ve Etkileşim Teknolojileri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ASLI KANAN