Classification of the effects of natural disasters on structures through social media posts with machine learning methods
Sosyal medya paylaşımları üzerinden doğal afetlerin yapılar üzerindeki etkilerinin makine öğrenmesi yöntemleri ile sınıflandırılması
- Tez No: 832230
- Danışmanlar: DOÇ. DR. ÖZLEM AKTAŞ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Dokuz Eylül Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 106
Özet
Doğal afetler insanlara ve yapılara büyük zararlar verir. Özellikle depremler geniş alanları etkileyerek şiddetli ve yıkıcı etkiler bırakabilmektedir. Deprem sonrasında etkilenen bölgelerde hasar tespitini hızlı bir şekilde yapıp, doğru ve etkin bir şekilde bölgeye müdahale edebilmek ise afet yönetiminin verimliliği, can ve mal kaybınının minimize edilebilmesi için kritik öneme sahiptir. Son yıllarda sosyal medyanın, durumsal farkındalığı artırmak ve etkilenen alanları belirlemek için büyük bir araç olduğu kanıtlanmıştır. Bu bağlamda, bu çalışma, doğal afetlerden en yıkıcılarından biri olan deprem'i ele alarak, deprem sonrası hızlı ve etkin hasar tespiti için makine öğrenimine dayalı çözümler sunmaktadır. Bunlardan birincisi, sosyal medya verilerini analiz ederek Naïve Bayes, Support Vector Machine (SVM), Random Forest ve BERT gibi sınıflandırma algoritmaları ile deprem bölgelerinde ki hasar seviyelerinin tespit edilmesidir. Bu noktada Twitterdan Türkçe tweetleri derleyip, manuel olarak etiketlenerek Türkçe Deprem Sonrası Hasar Sınıflandırma Veriseti (Location Oriented NER Dataset) oluşturulmuştur. Hangi modelin problem özelinde daha başarılı olduğunu tespit edebilmek için, oluşturduğumuz bu veri seti kullanılarak modelleri kendi aralarında karşılaştırılmıştır. Deprem sonrası Türkçe tweetlerden hasarlı yapıların tespit edilmesi önerdiğimiz çözümün ilk adımıdır. Çözümün diğer bir adımı ise mekansal analizdir. Mekansal analizin düzgün yapılabilmesi için hasar bilgisi içeren tweetlerden, yapıların adres bilgilerinin düzgün bir şekilde çıkartılması gerekmektedir. Bu nedenle, bu çalışmada, adres ayıklama için Adlandırılmış Varlık Tanıma kullanılmıştır ve önceden eğitilmiş BERT modelinde, kendi derlediğimiz ayrıntılı Konum Odaklı NER Verisetimiz ile ince ayar yapılmıştır. Modelin adresleri daha iyi çıkarabilmesi için Çok Yönlü Adres Tanımlama Algoritması geliştirilmiştir. Bu algoritma sayesinde Adlandırılmış Varlık Tanıma'dan tespit edilen adresler Türkiye sınırları içerisinde ki adreslerle karşılaştırılarak adreslerin iyileştirilmesi ve gerçeğe yakın sonuçlar alınması hedeflenmiştir. Bu sayede çıkarılan adreslerin coğrafi konumlarını yüksek doğruluk oranı ile saptayarak, hasarlı yapıları hasar durumlarına göre Türkiye haritası üzerinde il-ilçe-mahalle-cadde-sokak özelinde gösterimi yapılmıştır. Böylece kurtarma ekipleri daha etkin müdahale edebilmelerini ve başarı oranlarını artırabilmeleri hedeflemektedir. Son olarak tüm bu çözümleri etkin bir şekilde bir arada kullanabilmek için uçtan uca çalışabilen bir yazılım mimarisi önermekteyiz. Bu sayede deprem anı ve sonrasını kapsayacak şekilde, deprem ile ilgili atılan tweetler analiz edilerek, hasarlı yapıları konumlarına göre haritada gösterilmesi hedeflenmektedir.
Özet (Çeviri)
Natural disasters cause great damage to people and structures. Especially earthquakes can affect large areas and leave severe and destructive effects. After an earthquake, it is critical to be able to quickly assess the damage in the affected areas and intervene in the region in a correct and effective manner in order to minimize the loss of life and property and the efficiency of disaster management. In recent years, social media has proven to be a great tool to increase situational awareness and identify affected areas. In this context, this study takes one of the most devastating natural disasters, earthquakes, as a use case and proposes machine learning-based solutions for fast and effective damage assessment after an earthquake. The first one is to analyze social media data and use classification algorithms such as Naïve Bayes, Support Vector Machine (SVM), Random Forest, and Bidirectional Encoder Representations From Transformers (BERT) to identify damage levels in earthquake zones. At this point, a Turkish Post-Earthquake Damage Classification Dataset was created by compiling Turkish tweets from Twitter and manually labeling them. In order to determine which model is more successful in the specific problem, we compared the models among themselves using this dataset. Identifying damaged structures from post-earthquake Turkish tweets is the first step of our proposed solution. The other step of the solution is spatial analysis. In order to perform the spatial analysis properly, the address information of the structures must be extracted properly from the tweets which contain damage information. Therefore, in this study, Named Entity Recognition is used for address extraction, and the pre-trained BERT model is fine-tuned with our own compiled detailed Location Oriented NER Dataset. In order to improve the model's ability to extract addresses, we developed a Versatile Address Identification Algorithm. According to this algorithm, the addresses detected from Named Entity Recognition are compared with the addresses within the borders of Turkey in order to improve the quality of addresses and obtain realistic results. In this way, by determining the geographical locations of the extracted addresses with a high accuracy rate, the damaged structures were displayed on the map of Turkey according to their damage status in the province-district-neighborhood-avenue-street specific. Thus, the primary objective is that rescue teams can intervene more effectively and increase their success rates. Finally, we propose an end-to-end software architecture to effectively use all these solutions together. In this way, it is aimed to show damaged structures on the map according to their location by analyzing tweets about the earthquake, covering the moment and aftermath of the earthquake.
Benzer Tezler
- Akarsu kıyı yerleşimlerinde kent kimliğinin sürdürülebilirliği
Sustainability of urban identity of riverfront settlements
MERVE ÖZKAYNAK
- Uydu görüntü verileri kullanılarak orman yangın analizi
Forest fire analysis using satellite images
ÇİĞDEM İNAN
Yüksek Lisans
Türkçe
2018
Mühendislik Bilimleriİstanbul Teknik Üniversitesiİletişim Sistemleri Ana Bilim Dalı
PROF. DR. SEDEF KENT PINAR
- Knidos'un Geç Antik Dönem seramikleri
Late Antique ceramics of Knidos
SONGÜL SÖZEL
Doktora
Türkçe
2023
ArkeolojiSelçuk ÜniversitesiArkeoloji Ana Bilim Dalı
PROF. DR. ERTEKİN MUSTAFA DOKSANALTI
- Deprem kayıtlarının istatistiksel analizi ile fay uzaklığına ve kayıtlara dayalı şiddet haritalarının oluşturulması
Generation of intensity maps based on fault distance and earthquake records through statistical analysis of seismic data
HAKAN TURAN
Yüksek Lisans
Türkçe
2024
Deprem Mühendisliğiİstanbul Teknik ÜniversitesiDeprem Mühendisliği Ana Bilim Dalı
DOÇ. DR. BEYZA TAŞKIN
DR. KEREM PEKER
- İstanbul'da kentsel büyümenin senaryo tabanlı modellenmesi ve ekolojik açıdan değerlendirilmesi
Scenario-based modeling and evaluation of urban growth in Istanbul
ALİYE GONCA BOZKAYA KARİP
Doktora
Türkçe
2024
Şehircilik ve Bölge PlanlamaMimar Sinan Güzel Sanatlar ÜniversitesiŞehir ve Bölge Planlama Ana Bilim Dalı
PROF. DR. FATMA ÜNSAL