Semantic segmentation of UAV images in archaeological sites using deep learning
Arkeolojik alanlardaki İHA görüntülerinin derin öğrenme yardımıyla anlamsal segmentasyonu
- Tez No: 776490
- Danışmanlar: PROF. DR. DURSUN ZAFER ŞEKER
- Tez Türü: Yüksek Lisans
- Konular: Jeodezi ve Fotogrametri, Geodesy and Photogrammetry
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Geomatik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Geomatik Mühendisliği Bilim Dalı
- Sayfa Sayısı: 75
Özet
Arkeolojik veriler, dünyanın kimliğinin tanımlanmasında, belleğinin oluşturulmasında, kentlerin ekonomisine yön verilmesinde, insanlığın kültürel ve sosyal köklerinin tanınmasında ve geleceğin doğru kurulmasında önemli bir role sahiptir. İçinde bulunduğumuz küreselleşme süreci ve çağımızın bilinçsiz insan hareketleri arkeolojik alanların korunmasında büyük zorluklara yol açmaya başlamıştır. Arkeolojik kalıntılara ve kayıtlara olan ilgi 20. yüzyılda Dünya Savaşları'nın neden olduğu kayıplardan sonra yoğunlaşmıştır. Teknolojik yöntemler de kullanarak bu kaybın önüne geçmeye çalışılmaktadır. İnsanlar arkeolojik alanları korurken; geleceklerine yön vermek ve kaynaklarını korumak için geçmişle ilgili soruları yanıtlamaya çalışmaktadır. Beraberinde arkeolojik alanların korunması ve yönetimine ilişkin ilkeler, Birleşmiş Milletler Eğitim, Bilim ve Kültür Örgütü (UNESCO), ICOMOS, ICCROM, Avrupa Konseyi vb. tarafından hazırlanan çeşitli uluslararası tüzük ve sözleşmelerde ana hatlarıyla belirtilmiştir. Bu bağlamda arkeolojik alanların tespiti, kalıntıların keşfedildikleri yerde belgelenmesi, dijitalleştirilmesi, araştırılması, korunması ve paylaşılması aşamaları büyük önem taşımaktadır. Etkili yerinde koruma, arkeolojik miras alanı hakkında bilgi sahibi olmayı ve doğru tespit etmeyi gerektirir. Bugün gelinen noktada arkeolojik alanların tespiti için, uzaktan algılama belgeleme teknikleri, bu koruma yaklaşımlarının kritik bir parçasıdır. Dijital fotoğrafçılık, fotogrametrik kayıt, insansız hava araçları (İHA), uydu görüntüleri, 3D lazer tarama ve LiDAR, arkeolojik alanların hızlı ve doğru bir şekilde belgelenmesi ve tespit edilmesi için en yaygın kullanılan araçlardır. Bu araçlar manuel yüzey araştırma yükünü azaltmakta, hatta ön-tespit ve belgeleme aşamaları için yeterli veri sağlamaktadır. Fakat sürekli büyüyen bu dinamik dijital verinin analiz edilmesi, işlenmesi ve yorumlanması aşamalarında bilgisayar destekli yöntemler benimsenmelidir. Derin Öğrenme algoritmaları; veri yığınlarını işleme, bu verilerden modeller oluşturma ve sonraki verileri yorumlama fırsatı sağlar. Ayrıca bu verilerden elde edilen modeller; sonraki verileri yorumlamaya, sonuçları etkili yorumlara yeniden entegre etmeye olanak tanır. Bu çalışmada Derin Evrişimsel Sinir Ağları (CNNs) yaklaşımı kullanılarak arkeolojik alanların tespiti için anlamsal bölütleme gerçekleştirilmiştir. Bu sayede, yenilikçi yaklaşımlar kullanılarak arkeolojik saha araştırmalarına katkıda bulunmak hedeflenmektedir. Çalışma aynı zamanda derin öğrenme ve arkeoloji bağlamında derinlemesine bir literatür taraması sunmaktadır. Evrişimsel Sinir Ağları mimarisi, elde edilen veri kümesi üzerinde arkeolojik yapıların bölütlenmesi için güçlü dedektör algoritmaları sağlamıştır. Bugün çevre, tarım, şehircilik, tıp gibi alanlarda yaygın olarak kullanılan bu yöntem, arkeolojide henüz yaygınlaşmamıştır. Bu nedenle, arkeoloji disiplininde erişilebilir, açık kaynaklı veri kümeleri bulmak oldukça zordur. Çalışma öncesi yapılan aramalarda da arkeolojik alanların segmentasyonu için hazırlanmış bir veri setine rastlanmamıştır. Bu nedenle bu çalışma için, Syedra Antik Kenti veri kümesi hazırlanmıştır. Syedra Antik Kenti; günümüzde Antalya ili Alanya ilçesinin 20 km güneydoğusunda, Seki Köyü sınırları içerisinde yer almaktadır. Aynı zamanda kent, büyük yapı kalıntıları içeren merkezi alanı 1. Derece arkeolojik sit alanı olarak tescil edilmiştir.Yerleşim tarihinin MÖ 9. yüzyıldan MS 13. yüzyıla kadar uzandığı tespit edilmiştir. Veri setinde kullanılan görüntüler, DJI Mavic 2 Pro kullanılarak elde edilmiştir. İHA'lar özellikle uzak arazi koşullarında düşük maliyetli, kolay lojistik, yüksek çözünürlüklü ve hızlı veri elde edebilme özellikleri beraberinde fotogrametrik belgeleme yetenekleri nedeniyle arkeolojik alanlarda yaygın olarak kullanılmaktadır. 2020 yılının Kasım ayında DroneDeploy uygulaması ile planlanan 4 farklı uçuş grubundan 5472 x 3648 piksel boyutlarında, 1653 görüntü elde edilmiştir. Uçuş gruplarından 76 görüntü eğitim ve test sürecine dahil edilmek üzere seçilmiştir. Sahada doğrulanan arkeolojik alanlar veri kümesi üzerinde“Arkeolojik Yapı Var”ve“Arkeolojik Yapı Yok”sınıfları şeklinde temsil edilmiştir. Sınıf bilgisine sahip görüntüler ayıklandığında elde edilen toplam 1986 görüntü üzerinde eğitim ve test işlemleri gerçekleştirilmiştir. Etiketlenmiş görüntüler 256 x 256 piksel boyutlarına getirilmişlerdir. Hazırlanan veriseti, 1320 görüntü (%66,47) eğitim için, 233 görüntü (%11,73) eğitim sırasında doğrulama için ve 433 görüntü (%21,80) test için kullanılmıştır. Çalışmada az sayıda eğitim görüntüsü ile iyi sonuçlar elde etme yeteğine sahip olan U-net ve beraberinde LinkNet modellerinin yanı sıra, ResNet34 ve ResNeXt50 olmak üzere iki CNN mimarisi kodlayıcı olarak tercih edilmiştir. Modellerin daha hızlı yakınsamasını ve daha güçlü genelleme yeteneğine sahip olmasını desteklemek amacıyla kullanılan kodlayıcılar ile birlikte 6 farklı model mimarisi hazırlanmıştır. Eğitim ve test ortamı olarak, Google tarafından ücretsiz bir bulut hizmeti olarak sunulan ve Jupyter Notebook arayüzü sağlayan Colaboratory (Colab) kullanılmıştır. ImageNet üzerinde ön eğitim uygularak, her model 4,8,16 olmak üzere üç farklı parça boyutu kullanılarak eğitilmiştir. Eğitim sürecinde optimize edici olarak Adam, 0.0001 optimum öğrenme oranı kullanılmıştır. Segmentasyon modellerinin performansını ve ortaya çıkan tahminin kalitesi, hazırlanan test veri kümesi kullanılarak değerlendirilmiştir. Beraberinde tahmini görüntü örnekleri hazırlanmıştır. Sonuçlar genel olarak değerlendirildiğinde, arka plan ile arkeolojik yapının farklı renk, doku ve özelliklere sahip olduğu senaryolarda tüm model mimarilerinin başarılı sonuçlar verdiği söylenebilmektedir. Bununla beraber, daha önce yapıya ait olan kalıntı parçalarının da bulunduğu bir zeminde yer alan arkeolojik yapıları ayırt etmekte zorlandığı gözlenmiştir. Değerlendirme sonuçları ışığında, 16'lık bir parça boyutu kullanan LinkNet ResNet34 mimarisinin %94,43 ile en yüksek test doğruluğuna sahip olduğu görülmüştür. Öte yandan, model mimarileri üzerinden değerlendirme yapıldığında yığın boyutunun doğruluğu güçlü bir şekilde etkilemediği gözlenmiştir. Model performansları değerlendirilirken IoU ve F1 skorları ana değerler olarak alınmıştır. En iyi model mimarisi 0,7326 IoU ve 0,8136 F1 skoruna sahiptir ve LinkNet ResNet34 önerilen model mimarisidir. Ayrıca yapılan testlerde en düşün performans gösteren mimari, U-Net ResNext50 olmuştur. Deney sonuçlarından yola çıkarak, veriseti geliştirilerek farklı modellerle test edilebilir ve aynı zamanda modellerin genelleme yeteneği farklı özelliklere sahip ya da farklı sensörlerden elde edilen veri kümeleri üzerinde test edilebilir. Çalışma sonucunda önerilen yaklaşım ile arkeolojik alanların tespiti için manuel yüzey araştırmalarına gerek kalmadan derin öğrenme kullanımı ile doğru sonuçlar elde edilebileceği kanıtlanmıştır. Bununla birlikte, arka planda motivasyonu da destekleyerek arkeolojik sahalarda ön koruma koşulunun gerçekleştirilmesine yenilikçi bir yaklaşım sunulmuştur. IHA görüntüleri kullanılarak sunulan yaklaşım gelecekte fotogrametrik süreçler ve sayısal yükseklik modelleri (DEM) ile desteklenebilir. Tespit edilen arkeolojik alan, konum ve öznitelik bilgileriyle birlikte, kurumlar ve çeşitli kuruluşlar tarafından kullanılabilecek bir coğrafi bilgi sistemi (CBS) platformlarına entegre edilebilir.
Özet (Çeviri)
Archaeological data plays an important role in defining the identity of the world, creating its memory, steering the economy of cities, recognizing the cultural and social origins of humanity, and building the future well. The globalization world process we are in and the unconscious human actions of this era have begun to cause major difficulties in the preservation of archaeological sites. Archaeological site detection, identification, and documentation are essential processes in preservation strategies. Archaeological research, preliminary preservation, excavation, and city planning require these processes to be effectively performed. Technological methods reduce the manual survey effort and even provide sufficient data for the pre-detection and documentation processes. However, computer-aided methods should be adopted to analyze, process, and interpret this ever-growing dynamic digital data. Deep Learning algorithms provide the ability to process masses of data, build models from this data and interpret subsequent data. In addition, the models obtained from this data allow the interpretation of subsequent data and reintegrating of the results into effective interpretations. Accordingly, in this study, in this study semantic segmentation is performed to detect archaeological structures utilizing the transfer learning-based deep Convolutional Neural Networks (CNNs) approach. The dataset from the Ancient City of Syedra, whose archaeological research continues today, is used. The dataset consists of UAV images and contains ancient Roman structures that were manually labeled and field-verified to a large extent. The architecture of CNNs has provided powerful detector algorithms for segmenting archaeological structures on the acquired dataset. In the study, U-net and LinkNet models, two CNN architectures, which are ResNet34 and ResNeXt50 were implemented as encoders to the U-Net and LinkNet CNN models. In order to support faster convergence and stronger generalization capability of the models, 6 different model architectures were prepared with the encoders used. The training and testing environment was Colaboratory (Colab), a free cloud service provided by Google, which provides a Jupyter Notebook interface. By pre-training on ImageNet, each model was trained using three different batch sizes 4,8,16. The performance of the segmentation models and the quality of the resulting predictions were evaluated using a test dataset. Prediction image samples were also prepared. When the results are generally analyzed, it can be said that all model architectures give successful results in scenarios where the background and the archaeological structure have different colors, textures, and features. In light of the evaluation results, it was observed that the LinkNet ResNet34 architecture, which uses a batch size of 16, had the highest test accuracy with 94.43%. IoU and F1 scores were taken as the main values when evaluating model performances. The best model architecture has an IoU score of 0.7326 and an F1 score of 0.8136 and is the LinkNet ResNet34 recommended model architecture. As a result of the study, it is shown that with the recommended method, accurate results can be obtained with the use of deep learning for the segmentation of archaeological sites without the need for manual surveys. In addition, an innovative approach to the realization of the pre-protection requirement in archaeological sites is presented, supporting the motivation in the background. The approach using UAV imagery can be supported by the photogrammetric processes and digital elevation models (DEM) in the future. The detected archaeological site, together with its location and attribute information, can be integrated into a geographic information system (GIS) platform that can be used by institutions and organizations.
Benzer Tezler
- Semantic segmentation of panoramic images and panoramic image based outdoor visual localization
Panoramik imgelerde anlamsal bölütleme ve panoramik imge tabanlı dış mekan görsel konumlandırma
SEMİH ORHAN
Doktora
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİzmir Yüksek Teknoloji EnstitüsüBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. YALIN BAŞTANLAR
- COVID-19 tanılı bilgisayarlı tomografi görüntülerinde akciğer ve pnömoni bölgelerinin farklı senaryolarda semantik segmentasyonu
Semantic segmentation of lung and pneumonia regions in different scenarios on COVID-19 diagnosed computer tomographic images
HÜSEYİN EMRE ALEMDAROĞLU
Yüksek Lisans
Türkçe
2022
Mühendislik BilimleriNecmettin Erbakan ÜniversitesiBiyomedikal Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MUHAMMET ÜSAME ÖZİÇ
- Derin öğrenme metotları kullanılarak farklı sosyal statüye sahip yapısal alanlarda binaların semantik segmentasyonu: İstanbul örneği
Semantic segmentation of buildings in structural areas with different social statuses using deep learning methods: Istanbul example
BURCU AMİRGAN
Yüksek Lisans
Türkçe
2023
Jeodezi ve FotogrametriKocaeli ÜniversitesiJeodezi ve Jeoinformasyon Mühendisliği Ana Bilim Dalı
PROF. DR. ARZU ERENER
- Tarihi hava fotoğraflarının derin öğrenme ile semantik segmentasyonu
Semantic segmentation of historical aerial photographs using deep learning
GÜLSENA YILANCI
Yüksek Lisans
Türkçe
2024
Jeodezi ve FotogrametriKaradeniz Teknik ÜniversitesiHarita Mühendisliği Ana Bilim Dalı
DOÇ. DR. MUSTAFA DİHKAN
- Semantic segmentation of RGBD videos with recurrent fully convolutional neural networks
RGBD videoların özyinelemeli tamamen konvolüsyonel yapay sinir ağları ile semantik bölütlenmesi
EKREM EMRE YURDAKUL
Yüksek Lisans
İngilizce
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç ÜniversitesiBilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
DOÇ. DR. YÜCEL YEMEZ