Identification and categorization of defects in construction specifications by utilizing NLP
İnşaat teknik şartnamelerindeki kusurların NLP kullanarak tespiti ve sınıflandırılması
- Tez No: 918863
- Danışmanlar: DOÇ. DR. GÜZİDE ATASOY ÖZCAN, PROF. DR. İREM DİKMEN TOKER
- Tez Türü: Doktora
- Konular: İnşaat Mühendisliği, Civil Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İnşaat Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 195
Özet
İnşaat teknik şartnameleri tasarım ve sözleşme belgelerinin önemli bir parçasıdır. Kusurlu şartname maddeleri sadece hatalı bir inşaata yol açmakla kalmaz, proje paydaşları arasında maliyet ve süreyi arttıracak ihtilaflara, inşaatın kesilmesine ve bazen de davalara neden olur. Şartnamelerdeki sayfa sayısının yüksek, insan kaynağının ve zamanın yetersiz olması ve teknik personelin deneyimine bağımlılık gibi nedenler bu kusurların tespit edilmesini oldukça güçleştirmektedir. Doğal Dil İşleme'nin (NLP) insan dilini yorumlayıp belgelerdeki kalıpları ve bağlamları analiz edebilme yeteneği manuel yöntemlerde karşılaşılan zorlukları aşarak başarılı çözümler sunabilir. Bu çalışmada inşaat teknik şartname maddelerindeki kusurların tespit ve sınıflandırılması için yapısal bir çerçeve ve bunun denetimli öğrenme NLP yöntemleri ile uygulanması hedeflenmiştir. Uluslararası 16 inşaat projesinden 21 farklı mimari işe ait toplam 175 şartname veri seti olarak kullanılmıştır. 15569 şartname maddesi içindeki kusurlar dört farklı kusur sınıfında el ile işaretlenmiş, farklı metin vektörü dönüştürme yöntemleri ile 8 farklı makine öğrenimi modeli eğitilmiş ve test edilmiştir. Akabinde ChatGPT ile benzer bir çalışma yapılmıştır. Araştırma, eğitilmiş RoBERTa modelinin %91,2 oranında makro F1 ve %98 oranında doğrulukla teknik şartnameler içindeki kusurların tespit ve sınıflandırılmasında başarı elde ettiğini göstermiştir. Buna karşın ChatGPT alana özel veri ile eğitilmiş makine öğrenimi modellerine göre oldukça düşük bir performans sergilemiştir. Bu çalışma, inşaat sektörü paydaşlarına şartnamelerin kalitesini geliştirecek ve tasarım, ihale ve inşaat öncesi hazırlık aşamalarında şartnamelerdeki kusurları eksilterek olası ihtilafları azaltacak veri odaklı ve otomatikleştirilmiş bir yöntem önermektedir.
Özet (Çeviri)
Construction specifications are crucial parts of design and contract documents. Defective specification statements can cause not only a faulty outcome but also disputes among project stakeholders, claims for project budget and time, project disruptions and even litigation. Identification of defects in technical sections of construction specifications is challenging due to the extensive document volume, limited resources, and reliance on technical staff's experience. Natural Language Processing (NLP) can facilitate analyzing language, uncovering patterns, providing insights, and overcoming the limitations of manual methods. This research aims to develop a structured framework and implement supervised NLP methods for identifying and categorizing defects in specifications. Dataset includes 175 specifications related to 21 architectural works collected from 16 construction projects. A total of 15569 statements were extracted and manually labeled in four defect categories and 8 Machine Learning models, ranging from shallow to transformer-based models, were trained and tested with combinations of different text representation techniques. Subsequently, a study with ChatGPT was conducted. The research concluded that the pre-trained RoBERTa model outperformed the recognition of defects in construction specifications with a macro F1 score of 91.2% and 98% accuracy. Whereas the performance of the ChatGPT was evaluated as considerably low compared to domain-specific trained ML models. This research offers a data-driven and automated methodology providing construction stakeholders with practical tools to enhance the quality of specifications and decrease disputes by reducing the deficiencies during design, bidding and pre-construction.
Benzer Tezler
- Power system fault identification and classification in fuel cells via artificial neural network
Yakıt hücrelerinde yapay sinir ağı kullanılarak güç sistemi arıza tespiti ve sınıflandırması
RAFAH HUSSEIN ALZURFI
Yüksek Lisans
İngilizce
2024
Elektrik ve Elektronik MühendisliğiKarabük ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ CİHAT ŞEKER
- Optimizing photovoltaic system diagnostics: integrating machine learning and DBFLA for advanced fault detection and classification
Fotovoltaik sistem tanılarının optimizasyonu: gelişmiş arıza tespiti ve sınıflandırma için makine öğrenimini ve DBFLA'yı entegre etme
OMAR MOHAMMED NSAIF AL-QARAGHULI
Doktora
İngilizce
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAltınbaş ÜniversitesiElektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ABDULLAHİ ABDU IBRAHIM
- Dehidratasyonun derecelendirilmesinde kapiller kan ketonu ölçümünün değeri: Deneysel çalışma
The value of the capillary blood ketone measurement in rating of dehydration: Experimental study
MEHMET AKÇİMEN
Tıpta Uzmanlık
Türkçe
2010
İlk ve Acil YardımAkdeniz ÜniversitesiAcil Tıp Ana Bilim Dalı
YRD. DOÇ. DR. FIRAT BEKTAŞ
- Using digital technologies to facilitate identification of political risks in international construction projects
Uluslararası inşaat projelerinde siyasi risklerin belirlenmesini kolaylaştırmak için dijital teknolojilerin kullanılması
BESTE ÖZYURT ERSÖZ
Doktora
İngilizce
2024
İnşaat MühendisliğiOrta Doğu Teknik Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
PROF. DR. MUSTAFA TALAT BİRGÖNÜL
PROF. DR. İREM DİKMEN TOKER