A machine learning model for labor efficiency prediction in construction projects
İnşaat projelerinde iş gücü verimi tahmini için bir makine öğrenme modeli
- Tez No: 865884
- Danışmanlar: DOÇ. DR. ONUR BEHZAT TOKDEMİR
- Tez Türü: Yüksek Lisans
- Konular: İnşaat Mühendisliği, Civil Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: İnşaat Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Yapı İşletmesi Bilim Dalı
- Sayfa Sayısı: 101
Özet
Bu tez, makine öğrenme tekniklerinin inşaat endüstrisindeki işçi verimliliği tahmininde uygulanmasını araştırmıştır. Araştırma, bir şirketin günlük çalışma raporlarından toplanan ve çeşitli veritabanlarından elde edilen verilerle daha da zenginleştirilmiş kapsamlı bir veri kümesi kullanılarak gerçekleştirilmiştir. Öncelikli amaç, inşaat projesinin yönetimi için kritik bir yönü olan verimlilik ölçütlerini doğru bir şekilde tahmin edebilecek bir analitik çerçeve geliştirmektir. İlk olarak, farklı ülkelerde projeleri devam eden bir inşaat şirketinin 3 farklı ülkedeki toplam 4 projesinin günlük raporları toplanmıştır. Kümülatif olarak yapılan işlerin ve harcanan insan-saatlerin yer aldığı bu raporlar uygun formata getirilerek veriler incelenmiştir. Projelerde çeşitli sebeplerden ötürü günlük raporlarda eksik veriler olduğu tespit edilmiş, ve bu eksik veriler şirketin Oracle Primavera ve SAP veritabanlarından toplanan verileri kullanarak giderilmiştir. Günlük yapılan işler ve harcanan insansaatler kullanılarak, iş bazında günlük iş gücü verimleri hesaplanmıştır. Veri toplama aşamasına devam etmeden önce detaylı bir literatür taraması yapılarak, verimlilik üzerinde etkili olabilecek 17 farklı faktör belirlenmiştir. Bu faktörler arasından erişilmesi mümkün olanlar belirlenerek, şirket veritabanları ve internet üzerinden ilgili veriler toplanmıştır. Veri havuzunun son hali, aralarında hava şartları, işçi tecrübesi, işin karmaşıklığı, fazla mesai gibi verimlilik üzerinde etkili olması beklenen 13 farklı koşulu kapsamaktadır. Çalışmanın bir sonraki aşamasında, verilerin temizlenmesi de dahil olmak üzere toplanan verilerin kapsamlı bir veri işleme ve veri temizleme süreci yer almıştır. Bu yaklaşım, verilerin sonraki modelleme süreci için bütünlüğünü ve uygunluğunu sağlamak için gerekli görülmüştür. Değerlendirilen özellikler arasında hava koşulları, işin karmaşıklığı, fazla mesai gibi işçi verimliliği üzerinde etkili olması beklenen koşullar yer almıştır. Veri temizleme aşaması için veri setlerindeki aykırı değerler tespit edilerek veri setinden çıkarılmıştır. Bu veriler makine öğrenmesi modelleri için ana girdiler olarak kullanılmıştır. Çalışmanın bir sonraki aşaması için literatür taramasına tekrar başvurulmuş, ve işgücü verimliliği tahmini için sıkça kullanıldığı görülen Linear Regression, Decision Trees, Random Forest, Gradient Boosted Trees ve Support Vector Regression gibi çeşitli makine öğrenme metodlarının kullanılmasına karar verilmiştir. Bu aşamada Rapidminer yardımıyla bahsedilen modeller kullanılarak veri seti incelenmiştir. Bu modeller, verilerin karmaşık ve çok yönlü doğasıyla başa çıkmaya uygun olmaları dolayısı ile seçilmiştir. Bu modellerin değerlendirilmesi için Root Mean Square Error (RMSE) ve Correlation Coefficient (R) gibi metrikler kullanılarak, her bir modelin tahmin kapasitesinin kapsamlı bir şekilde anlaşılması sağlanmıştır. Ele alınan tüm veriler bu altı makine öğremesi metodu ile değerlendirilerek RMSE ve R skorları incelenmiş, ve doğruluk payının yüksek olduğu altı ana iş kalemi, kalıp, donatı, beton, çelik, atölye boru kaynağı ve saha boru kaynağı olarak belirlenmiştir. Bu altı faklı iş türü için veri seti altıya bölünmüş, ve her bir veri seti ve bahsedilen altı makine öğrenme modeli ile ayrı ayrı tahmin modeller oluşturulmuştur. Modeller oluşturulurken veri setleri %70-%30 olarak ayrılmış, verinin %70'i modele girdi olarak verilmiş ve öğretilmiş, kalan %30'luk kısmın tahmin edilmesi istenmiştir. Çıkan sonuçların doğruya yakınlığı, her bir tahminin gerçek değere uzaklığının kareleri yardımıyla hesaplanan, dolayısı ile değerlerin büyüklüğüne bağlı olarak değeri değişebilecek RMSE skoru ve tahmin edilen değerler ve gerçek değerler arasındaki korelasyona bağlı olan ve standart sapma kullanılarak ölçülen R skorları incelenerek ölçülmüştür. Ayrıca, Rapidminer programında yer alan, otomatik parametre optimizasyonu, uygun model seçimi gibi özellikleri olan AutoModel aracı kullanılarak, her bir veri seti için birer model daha oluşturulmuş ve skorlar karşılaştırılmıştır. Kimi veri setlerinde otomatik olarak belirlenen bu parametreler ile oluşturulan modeller daha iyi sonuçlar verirken, kiminde el ile oluşturulan modellerde gerçeğe daha yakın tahminler elde edilmiştir. Araştırma sonuçları, Gradient Boosted Trees (GBT) ve Random Forest gibi makine öğrenme modellerinin, iş gücü verimliliğini tahmin etmede daha etkili olduğunu göstermiştir. Söz konusu modeller, inşaat projelerinin karmaşık veri yapılarını analiz etme ve işlenme kapasitesinde diğer modellere kıyasla daha üstün performans sergilemiştir. Gradiend Boosted Trees ve Random Forest modelleri, veri setindeki gizli kalıpları etkili bir şekilde tespit edebilmiş ve bu kalıpları kullanarak iş gücü verimliliğini yüksek doğrulukla tahmin edebilmiştir. Bu modeller, veri setlerinin içerdiği gürültüyü ve aykırı değerleri yönetme yetenekleri sayesinde, özellikle zorlayıcı inşaat ortamlarında karar verme süreçlerini destekleyecek güvenilir tahminler sağlamıştır. Bu tez, makine öğrenme modellerinin iş gücü verimliliği tahminindeki pratikliğini ve etkisini kanıtlayarak inşaat yönetimi alanına önemli bir katkıda bulunmuştur. Araştırma, inşaat projelerinin yönetiminde karşılaşılan zorlukların üstesinden gelmek için gerekli olan karmaşık veri desenlerinin çözülmesinde sofistike analitik tekniklerin kullanılmasının önemini vurgulamaktadır. Bu teknikler, projelerin daha etkin bir şekilde planlanmasını ve yönetilmesini sağlayarak, zaman ve maliyet verimliliğinin artırılmasına yardımcı olmuştur. Ayrıca, bu çalışma, farklı makine öğrenme algoritmalarının uygulanabilirliğini ve bu algoritmaların tahmin doğruluğunu artırmak için çeşitli tahmin faktörlerinin dahil edilmesinin mümkün olduğunu göstermektedir. Bu kapsamda, modelleme süreçlerinde veri setlerinin iyileştirilmesi ve genişletilmesi, gerçeğe daha yakın ve güvenilir tahminler elde etme potansiyelini artıracaktır. Özetle bu çalışma, inşaat endüstrisinde makine öğrenme modellerinin kullanımını destekleyen yapısal bir yaklaşım sunmakta ve bu yaklaşımın iş gücü verimliliği tahminlerindeki başarısını incelemektedir. Çalışmanın bulguları, inşaat projelerinin yönetiminde gelişmiş veri analizi tekniklerinin uygulanması konusunda gelecekteki araştırmalara zemin hazırlamakta ve bu alanda yeni araştırma yolları açmaktadır. Bu çalışmanın sonuçları, inşaat sektöründe daha bilinçli ve veriye dayalı karar verme süreçlerinin geliştirilmesine önemli katkılar sağlamaktadır.
Özet (Çeviri)
This thesis investigates the utilization of machine learning methods for forecasting labor efficiency in the construction projects. The study focused on utilizing an extensive dataset derived from daily work reports, which was subsequently enhanced with information obtained from other business databases. The main objective of this study was to create an analytical framework that can reliably predict efficiency of person-hours, which is a crucial element in building project management. During the first stage, the study required thorough pre-processing of the collected data. The technique was systematic, ensuring the accuracy and applicability of the data for the future modeling procedure. The main factors taken into account were weather conditions, work complexity, and overtime, among others, which were recognized for their potential influence on construction productivity and project person-hours. The main focus of this thesis was to develop and evaluate several machine learning models, including Linear Regression, Decision Trees, Random Forest, Gradient Boosted Trees, and Support Vector Regression. The selection of these models was based on their ability for managing the complex and diverse characteristics of the data. The assessment of these models was performed utilizing standard metrics such as the Root Mean Squared Error (RMSE) and Correlation Coefficient (R), which provided an extensive look into the predicting abilities of each model. The research findings showed that specific models, such as gradient boosted trees and random forests, had a greater effectiveness in forecasting labor efficiency. These models possess exceptional skills in maneuvering through the intricacies of the dataset and offer a reliable tool for predicting production. This thesis enhances the field of construction management by showcasing the feasibility and efficiency of machine-learning algorithms in forecasting labor efficiency and person-hours. This underscores the capacity of data-driven methodologies to augment the decision-making procedures in building projects. This study emphasizes the significance of employing advanced analytical methods to identify complex trends in building project data, resulting in enhanced planning and management. This study suggests that future research might be conducted to explore the potential use of other machine learning algorithms and the inclusion of a wider range of predictive criteria. This could lead to further insights and findings. Exploring the possibilities of these models in various building project settings is also an ongoing field of research. This thesis provides a systematic methodology for effectively employing machine learning models in the construction sector, with a specific focus on predicting worker efficiency. The results of this study establish a basis for future research efforts in utilizing sophisticated data analytics in the field of construction project management.
Benzer Tezler
- Su kalitesi indeksinin tahmini için makine öğrenme yöntemlerinin karşılaştırılması: KASKİ örneği
Comparison of machine learning methods for water quality index estimation: KASKİ example
NUR ORHAN
Yüksek Lisans
Türkçe
2024
İnşaat MühendisliğiErciyes Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
PROF. DR. AHMET ALPER ÖNER
- Deep learning-based building segmentation using high-resolution aerial images
Yüksek çözünürlüklü hava görüntüleri kullanarak derin öğrenme temelli bina bölütlemesi
BATUHAN SARITÜRK
Doktora
İngilizce
2022
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
PROF. DR. DURSUN ZAFER ŞEKER
- İlaç-ilaç etkileşimlerini makine öğrenmesiyle tespit eden tahmin modeli
Forecast model determining drug-drug interactions by machine learning
AHMET ŞENER
Yüksek Lisans
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Medeniyet ÜniversitesiBiyolojik Veri Bilimi Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ARAFAT SALİH AYDINER
- Kestirimci bakım için ara katman mimari uygulaması
Middleware architecture application for predictive maintenance
OSMAN USLU
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEskişehir Osmangazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ EYÜP ÇİNAR
- An ensemble classification model for detecting voice phishing in telecommunication networks and its integration into a visual analysis tool
Telekomünikasyon ağlarında sesli olta saldırılarının birleşik sınıflandırma modeli ile tespiti ve görsel analiz aracına entegrasyonu
HÜSEYİN EREN ÇALIK
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. UĞUR DOĞRUSÖZ