Geri Dön

A video dataset of incidents & video-based incident classification

Felaket video veriseti & video-tabanlı felaket sınıflandırması

  1. Tez No: 765019
  2. Yazar: DUYGU SESVER
  3. Danışmanlar: PROF. DR. HAZIM KEMAL EKENEL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: İstanbul Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 77

Özet

Son günlerde dünyada, doğal afetlerin ve felaketlerin sayısında artış görülmeye başlandı. Bu gibi durumlar meydana geldiğinde hızlı aksiyon almak önemli bir hal aldı. Sosyal medya bu konuda önemli bir veri kaynağıdır. Dünyanın herhangi bir yerinde felaket meydana geldiğinde, bu olaylara ait görüntüler, sosyal medyada hemen yer alabilir. Bu sebeple, bu gibi durumlarda sosyal medyayı verimli kullanmak gerekmektedir. Literatürde, felaketlerin tespiti için pek çok çalışma yapılmıştır. Ancak, var olan veri setleri, çoğunlukla metin ve resim üzerinedir ve literatürdeki video tabanlı felaket veri setleri sınırlı sayıdadır. Var olan veri setleri ise, sınırlı sayıda felaket sınıf etiketine sahiptir. Bu eksiklikten yola çıkarak, bu çalışma ile literatüre çeşitliliği fazla ve yüksek sayıda sınıfa sahip VIDI adında video tabanlı bir veri seti sunulması hedeflenmiştir. Yüksek sınıf sayısına sahip olup çeşitliliği yüksek olan bir resim tabanlı veri seti, halihazırda literatürde mevcuttur. Bu çalışmada, resim veri setini tamamlayacak, video tabanlı bir veri seti oluşturulması hedeflenmiştir. Oluşturulan veri setinin sınıfları, var olan felaket resim veri setinin sınıfları ile aynı olup, 43 adet farklı sınıf sayısına sahiptir. Oluşturulan veri seti, her bir felaket sınıfı için pozitif ve negatif veriler içermektedir. Veri seti, toplamda 8.881 adet videodan oluşmaktadır. Bunlardan 4.534 tanesi pozitif örnekler olup felaket içermekteyken, 4.347 tanesi 43 sınıfın negatif örnekler olarak veri setinde bulunmaktadır. Her bir sınıf için yaklaşık 100 tane pozitif ve negatif video bulunmaktadır. Video kliplerinin süresi minimum 2 saniye, maksimum 60 saniyedir. Çoğu video, ortalama on saniye sürmektedir. Veri setindeki bütün videoların kaynağı olarak YouTube kullanılmıştır. Veri setinin pozitif örnekleri deprem, sel, heyelan gibi doğal afetler, araba kazası, kamyon kazası, motosiklet kazası gibi araç kazaları ve bu olayların sonuçlarını içeren hasarlı, yanmış, yıkılmış durumlarını içeren videolardan oluşur. Pozitif örnekler, birden fazla etiket ile etiketlenmiş olabilir. Bunun sebebi, bir videonun birden fazla felaketi içerebilmesidir. Örneğin, yanmış bir ev hem yanmış hem hasarlı etiketiyle etiketlenebilir veya bir araba kazası hem trafik kazası hem de bloklu olarak etiketlenebilir. Negatif örnekler ise, her sınıf için o felaketi içermeyen videolardan oluşur. Negatif örnekler toplanırken, bu verilerin, pozitif örneklerle kolayca karıştırılabilecek videolar olmasına özen gösterilmiştir. Örneğin,“araba kazası”sınıfının negatifi olarak, kaza olmayan araba sürüş videoları ya da“sel”içeren videolar, araba kazası içermediği için, araba kazasının negatifi olarak veri setine eklenmiştir. Veriler toplanırken, çeşitliliğin yüksek olması hedeflenmiştir. Bu sebeple, her bir sınıfın pozitif ve negatif örnekleri için farklı lokasyonlardan videolar toplanmıştır. Çeşitliliği artırmaya yönelik bir diğer yaklaşım da, farklı kültürlerin tarzlarını elde etmek ve o bölgeye özgü olayları dahil etmek için çeşitli dillerde videolar aramaktır. Temel olarak şu altı dil kullanılmıştır: Türkçe, İngilizce, Standart Arapça, Fransızca, İspanyolca, Basitleştirilmiş Çince. Bu dillerde toplanan video sayısı yeterli olmadığında, daha fazla video toplamak amacıyla, veri setinde Hintçeye, Almancaya ve birkaç farklı dile de yer verilmiştir. Bu dillerin seçiminde, dünya genelinde konuşulma sıklığı ve bu dillerin konuşulduğu bölgelerdeki çevre şartları dikkate alınmıştır. Örneğin, farklı bölge veya ülkelerdeki binaların görünümü kültür, konum ve malzeme mevcudiyetine bağlı olarak birbirinden farklı olabilir. Amerika'da yapı malzemesi olarak yaygın olarak ahşap kullanılırken, Orta Doğu'da kireçtaşı daha yaygındır. Ayrıca, farklı iklim olaylarının önlemleri ve sonuçları, beklendiği ülkelerde ve beklenmediği ülkelerde oldukça farklıdır. Bazı afetlerin, belirli bölgelerde yaşanması nedeniyle, her sınıfta bu dillerin bulunması mümkün olmayabilir. Örneğin, derecho -Türkçeye, düz ve sert esen rüzgar olarak çevrilebilir ancak Türkiye'de görülmemektedir.-, çoğunlukla Kuzey Amerika'da var olan bir olaydır. Bu nedenle, derecho video klipleri ağırlıklı olarak İngilizce olarak toplanmıştır. Bu etiketteki problemi düzeltmek için bu felaketin yaşandığı ülkelerin listesi bulunmuş ve bu bölgelere göre farklı dillerde aramalar yapılmıştır. Veri toplama sırasında karşılaşılan bir diğer engel ise anahtar kelimelerin diller arası çevirisi sırasında ortaya çıkan uyuşmazlıklar olmuştur. Bazı diller için yapay sinir ağları tabanlı çeviri uygulamaları kullanılmıştır. Kullanılan çeviri uygulamasının çalışma prensipleri gereği, hedef dilde çevirilmek istenen olaya ait bir kelime olmadığında, o olaya en yakın isim veya isim tamlaması önerilmektedir. Tropikal siklon bu duruma örnek olarak verilebilir.“Tropikal siklon”etiketi Arapçaya çevrildiğinde, tercüme edilen kelimenin kasırga ile aynı anlama geldiği görülmektedir. Bu sorunlar, hedef dili anadili olarak kullanan insanlar ile birebir etkileşime geçilerek çözülmeye çalışılmıştır. Çeviri sorunlarının yanı sıra, bir diğer problem de nükleer patlama gibi bazı etiketler için video bulunmasıdır. Nükleer patlamalar için mevcut videolar 1945 ile 1963 yılları arasında Amerika Birlȩsik Devletleri ve Sovyet Sosyalist Cumhuriyetler Birliği'nde kaydedilmiştir. O yıllardan sonra atmosferik testler yasaklandığından dolayı, bu etikete sahip sınırlı sayıda video vardır. Bu nedenle, toplanan videolar çoğunlukla aynı sahnenin, farklı kanallardan kopyalarını içermektedir. Veri seti toplandıktan sonra, üzerinde çeşitli deneyler yapılmıştır. Bu deneyleri gerçekleştirirken, hem var olan resim tabanlı hem yeni oluşturulan video tabanlı felaket veri setlerinde en yeni video ve resim sınıflandırma mimarileri kullanılmıştır. Adil bir performans karşılaştırması yapılmasına özen gösterildiği için, her iki veri seti de aynı sınıf etiketlerine sahiptir. Çalışmanın ilk bölümünde sadece pozitif veriler kullanılırken, ikinci bölümünde ise hem pozitif hem de negatif veriler kullanılmıştır. Bu çalışmanın motivasyonlarından biri, felaket sınıflandırması için resim yerine video verileri kullanmanın faydasını gözlemlemektir. Bunu sağlamak için ilk aşamada, Vision Transformer ve TimeSformer mimarileri, felaket sınıflandırması için her iki veri kümesinin yalnızca pozitif örnekleri kullanılarak eğitilmiştir. Kullanılan mimarilerden bahsetmek gerekirse, Vision Transformer mimarisi, resim sınıflandırma amaçlı tasarlanmıştır. Temel olarak doğal dil işleme görevleri için kullanılan ve herhangi bir konvolüsyonel katman kullanmayan Transformer bloklarından oluşur. Transformer bloklarının birleştirilmesi ile ViT mimarisi oluşturularak resimlere uygulanmıştır ve resim sınıflandırma için literatürde elde edilen doğruluk oranlarından daha iyi bir sonuç elde edilmiştir. ViT mimarisi çalışma düzeninde, ilk olarak, resimler kare parçalara bölünür ve her biri bir simge olarak ele alınır. Bir sonraki adımda parçalar düzleştirilir ve alt boyuta indirgenir. Parçaların sırası model tarafından bilinmediğinden dolayı, düzleştirilen parçaya konum bilgisi eklenir. Ardından, standart Transformer kodlayıcı blokları, hem parçalarla hem de düzleştirilmiş yamaların konumları ile beslenir. Pek çok veri setinde başarılı sonuçlar elde etmiştir. Bu sebeple, bu çalışmada da sınıflandırma problemleri için bu mimari tercih edilmiştir. TimeSformer modeli, Vision Transformer'dan ilham alınan bir mimaridir ve ViT mimarisine zamansal boyutta dikkat mekanizmaları eklenerek video işleme için uygun hale getirilmiştir. Vision Transformer'a benzer şekilde TimeSformer da, video işleme için Transformer mimarisini kullanır. TimeSformer mimarisinde, bir videodaki her bir ekran parçalara ayrılarak doğrusal olarak düzleştirilir. Ardından, bu düzlemlere parçaların uzamsal ve zaman konumları eklenir. Dikkat mekanizmasından geçirilerek sınıflandırma yapılır. TimeSformer mimarisi çalışmasında, tasarlanan beş farklı dikkat mekanizması ile çeşitli deneyler yapılmıştır. En iyi sonucu elde eden bölünmüş uzay-zaman dikkat mekanizması, bu çalışmada kullanılmıştır. Bu mimariler iki adet veri seti üzerinde eğitilmiştir. Bunlardan ilki Incidents veri setidir. Bu veri seti resim tabanlı olup, 43 adet farklı kategoriden oluşmaktadır. Veri seti, makalenin yazarları tarafından, eğitim, doğrulama ve test kümelerine bölünerek paylaşılmıştır. Eğitim setinde 312.742 örnek bulunurken, doğrulama setinde 17.357 örnek ve test setinde 17.255 örnek bulunmaktadır. Karşılaştırma yapabilmek amacıyla, VIDI, bu çalışmada oluşturulmuştur ve video tabanlı bir veri setidir. Oluşturulan veri seti, pozitif örnekler ile sınıflandırma deneylerinde kullanılmıştır. Bu deneyler, eğitim için 3.721 video, doğrulama için 408 video ve test için 405 video içermektedir. Toplanan negatif örnekler, pozitif örnekler ile birleştirilerek, her bir sınıf için ikili sınıflandırma deneyleri yapılmıştır. Her sınıfın %10'i doğrulama ve %10'i test işlemleri için kullanılırken, geriye kalan kısmı eğitim için ayrılmıştır. VIDI kümesi üzerinde 43 sınıflı ve 44 sınıflı felaket sınıflandırma deneyleri yapılmıştır. 43 sınıflı deneylerde VIDI kümesi ile Incidents veri setinin felaket sınıflandırma sonuçları karşılaştırılmıştır. 44 sınıflı deneylerde ise, hiç bir felaket içermeyen 100 adet negatif örnek, veri setine 44. sınıf olarak eklenmiştir. Eklenen 44. sınıf ile tekrardan TimeSformer mimarisi felaket sınıflandırma üzerine eğitilmiş ve negatif örneklerin eklenmesinin sınıflandırma başarısına olan etkisi ölçülmüştür. 43 ve 44 sınıflı deneylerde performansı ölçmek için, en iyi bir ve en iyi beş doğrulukları kullanılmıştır. İkili sınıflandırma deneylerinde, en iyi bir doğruluk metriği kullanılmıştır. Deney bölümünde, bu mimariler farklı veri setleri ve veri setlerinin farklı versiyonları ile çalıştırılmıştır. Örneğin, resim verilerini işlemek için tasarlanan ViT, resim veri seti üzerinde çalıştırılmıştır. Daha sonra, toplanan video tabanlı veri seti üzerinde, video için tasarlanan TimeSformer çalıştırılmıştır. Toplanan veri kümesindeki her videodan sekiz ardışık ekran alınmış ve TimeSformer modelinin eğitimi için kullanılmıştır. Veri setleri ve mimariler aynı olmadığı için ve bu durumda resim ve video arasındaki performans karşılaştırması da adil olmayacağı için, resim veri seti üzerinde TimeSformer mimarisi ve video veri seti üzerinde de ViT mimarisi çalıştırılmıştır. Fakat, ilgili modellere uygun bir şekilde girdi verebilmek için, resim veri seti, tek çerçeveli bir video gibi kullanılmış, video veri seti ise pek çok çerçeveden oluştuğundan dolayı, videonun ortasındaki çerçeve alınarak resim gibi kullanılmıştır. Son olarak, video verisinin felaket sınıflandırmasındaki etkisini görebilmek için, TimeSformer mimarisi, video veri setinden tek çerçeve alınarak mimari bir kez daha çalıştırılmıştır. Tek çerçeve alınırken kullanılan aynı altörnekleme yöntemi uygulanmış ve eğitim için videonun ortasındaki çerçeve kullanılmıştır. TimeSformer, çok-ekranlı VIDI üzerinde, %76.56 doğruluk elde ederken, tek-ekranlı VIDI üzerinde %67.37 doğruluk elde etmiştir. Bu sonuç, mevcut olduğunda video bilgilerinin kullanılmasının, felaket sınıflandırma performansının iyileştirilmesine yardımcı olduğunu göstermektedir. Deneylerde, felaket sınıflandırması için son teknoloji mimarilerin, ViT ve TimeSformer, performansı resim ve video veri setlerinde ölçülmüş ve Incidents veri setinin makalesinde kullanılan yaklaşım ile karşılaştırılmıştır. İlgili makalede ResNet-18 mimarisi kullanılmıştır. Bu çalışmada yapılan deneyler sonucunda, ViT ve TimeSformer mimarilerinin, resim tabanlı Incidents veri kümesinde ResNet-18'den daha yüksek doğruluklar elde ettiği gözlemlenmiştir. ResNet-18 tabanlı model %77.3 en iyi bir doğruluk elde ederken, ViT ve TimeSformer sırasıyla %78.5 ve %81.47 en iyi bir doğruluk elde etmiştir. Ek olarak, ViT ve TimeSformer mimarilerinin performansı, her iki veri kümesinin de tek çerçeveli versiyonları kullanılarak karşılaştırılmıştır. Video tabanlı veri kümesinin tek çerçeveli versiyonunda TimeSformer %67.37 ve ViT %61.78 doğruluk oranı elde etmiştir. Ayrıca, TimeSformer Incidents veri kümesinde %81.47, ViT ise aynı veri setinde %78.5 doğruluk oranı elde etmiştir. TimeSformer'ın hem Incidents hem VIDI veri setinde ViT'den daha yüksek doğruluk elde ettiği gözlemlenmiştir. Ancak, toplanan veri kümesindeki sonuçlar, Incidents veri kümesinde elde edilen sonuçlara kıyasla daha düşük çıkmıştır. Bunun iki ana nedeni öngörülmektedir: (1) resim tabanlı veri kümesi eğitim için daha fazla örnek içerir ve böylece sistemler daha iyi modeller öğrenebilir. (2) Toplanan veri kümesi, sınıflandırma için daha zor örnekler içerir. Çalışmanın ikinci kısmı negatif örnekler dahil edilerek yapılmıştır. Negatif örnekler ile tüm sınıflar için ikili sınıflandırma modelleri eğitilmiştir. Ana fikir, bir modelin belirli bir videoda o sınıf felaketinin olup olmadığını tespit edebilmesidir. Bu nedenle, 43 felaket çeşidi için 43 farklı model eğitilmiştir. Sonuç olarak, en iyi doğruluk“heyelan”ve“kirli kontamine”sınıfları tarafından elde edilmiştir.“Bloklu”sınıfının tespiti, en düşük doğruluğa sahip olan modeldir. Son olarak, bu çalışma kapsamında bir sınıflandırma daha yapılmıştır. Diğer sınıflandırma deneylerinden farklı olarak, bu deneyde 44. sınıf olarak negatif örnekler kullanılmıştır. 44. sınıf için hiçbir felaket içermeyen 100 video negatif örneklerin arasından seçilmiştir. Bu deney sonucunda TimeSformer mimarisi %72.18 en iyi bir doğruluk oranını elde etmiştir. Sonuç olarak, bu çalışmada pek çok sınıf sayısına sahip, çeşitliliği yüksek bir felaket video veri seti sunulmuştur. Sunulan veri setinin pozitif örnekleri kullanılarak sınıflandırma deneyleri yapılmıştır. En yeni mimarilerin video ve resim veri seti üzerindeki performansları karşılaştırılmıştır. Sunulan veri setinin negatif örnekleri de kullanılarak her bir sınıf için ikili sınıflandırma deneyleri yapılmıştır.

Özet (Çeviri)

Nowadays, the occurrence of natural disasters, such as fires, earthquakes, and floodings have increased in our world. Detection of incidents and natural disasters became more important when action is needed. Social media is one of the data sources to see natural disasters and incidents thoroughly and immediately. There are a lot of studies to detect incidents in the literature. However, most of them are using still images and text datasets. The number of video-based datasets is limited in the literature. Moreover, existing video-based studies have a limited number of class labels. Motivated by the lack of publicly available video-based incident datasets, a diverse dataset with a high number of classes is collected which we named as Video Dataset of Incident (VIDI). The collected dataset has 43 classes which are exactly the same as the ones in the previously published Incidents Dataset. It includes both positive and negative samples for each class as in the Incidents Dataset. The dataset contains 8.881 videos in total, 4.534 of them are positive samples and 4.347 of them are negative samples. Approximately, there are 100 videos for each positive and negative class. Video duration is ten seconds on average. YouTube is used as the source of the videos and video clips are collected manually. Positive examples of the dataset consist of natural disasters such as landslides, earthquakes, floods, vehicle accidents, such as truck accidents, motorcycle accidents, and car accidents, and the consequences of these events such as burned, damaged, and collapsed. Positive samples may contain multiple labels per video and image. It means video can belong to more than one class category. On the other hand, negative samples do not contain the disaster of that class. Samples in the negative can be instances that the model can easily confuse. For instance, the negative example of“car accident”class can be a normal car driving or a video that includes a“flooded”incident, since it contains“flooded”incident but it does not include a“car accident”. It is aimed to ensure diversity in the dataset while collecting videos. Videos from different locations for each positive and negative sample are collected to increase diversity. Another approach to increase diversity is to look for videos in various languages to capture the styles of different cultures and include region-specific events. Six languages are used and they are as follows: Turkish, English, Standard Arabic, French, Spanish, and Simplified Chinese. When these languages are not sufficient, videos are queried in different languages, too. After the dataset is collected, various experiments are performed on it. While performing these experiments, the latest video and image classification architectures are used on both existing image-based and newly created video-based incident datasets. The first part of the study is conducted by using only positive samples and negative samples are included in the second part. One of the motivations was to explore the benefit of using video data instead of images for incident classification. To investigate this need, the Vision Transformer and TimeSformer architectures are trained using only positive samples of both datasets for the classification of the incident. Top-1 and top-5 accuracies are used as evaluation metrics. ViT which is designed for the images is performed on the Incidents Dataset. Then, TimeSformer which is designed for multi-frame data is performed on the collected video-based dataset. Eight frames are sampled from each video in the collected dataset and used for the TimeSformer multi-frame training. Since datasets and architectures are not the same in these experiments, it would not be a fair comparison between the image and the video datasets. So, the TimeSformer architecture is performed also on the Incidents Dataset and the ViT is performed also on the VIDI. Input data is adapted according to the requirements of the architectures. In the video classification architecture, each image from the Incidents Dataset was treated as a single-frame video. In the image classification architecture, the middle frame of the input video is used as an image. Finally, to be able to show the impact of using multiple-frames in the incident classification, the TimeSformer architecture is performed also with a single-frame from a video dataset. The same downsampling method is applied and the middle frame is used for the training. TimeSformer achieved 76.56% accuracy in the multi-frame experiment, while 67.37% accuracy is achieved in the single-frame experiment on the collected dataset. This indicates that using video information when available improves incident classification performance. In the experiments, the performance of the state-of-the-art, ViT and TimeSformer architectures, for incident classification is also evaluated. The used method in the Incidents Dataset paper and state-of-the-art image classification architecture performance are compared. The used approach in the Incidents Dataset paper was using ResNet-18 architecture. ViT and TimeSformer achieved higher accuracies than the ResNet-18 on the image-based Incidents Dataset. While the Resnet-18-based model achieved 77.3% accuracy, ViT and TimeSformer achieved 78.5% and 81.47% top-1 accuracy, respectively. Additionally, the performance of ViT and TimeSformer is compared using both datasets in their single-frame version. TimeSformer achieved 67.37% and ViT achieved 61.78% on the single-frame version of the video-based dataset. Moreover, TimeSformer performed 81.47% and ViT performed 78.5% on the image dataset. TimeSformer is found to be superior to ViT on both datasets. However, the results in the collected dataset are lower than those obtained in the Incidents Dataset. There could be two main reasons for this: (1) the image-based dataset contains more examples for training, so systems can learn better models. (2) The collected dataset contains more difficult examples for classification. The second part of the study includes negative samples. By using both positive and negative samples, binary classification models are trained for all classes. The main idea was to measure the performance that a model could detect whether or not that disaster occurs in a given video. Therefore, 43 separate models are trained. As a result, the best accuracy is achieved by the“landslide”, and“dirty contamined”classes. The model got the lowest accuracy in the detection of“blocked”disasters. Finally, one more classification experiment has been run on VIDI. This experiment uses negative samples as the 44th class. For the 44th class, 100 videos that do not include any incidents are selected from the negative samples. By using these classes, 72.18% accuracy is achieved for this experiment. In summary, a highly diverse disaster dataset with many classes is presented in this study. For the classification tasks, the performances of the recent video and image classification architectures on video and image datasets are compared, and binary classification experiments are done for each class.

Benzer Tezler

  1. Highway traffic classification using data mining in machine learning

    Başlık çevirisi yok

    KHALID FARHAN MOHAMMED MOHAMMED

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAltınbaş Üniversitesi

    Bilgi Teknolojileri Ana Bilim Dalı

    PROF. DR. OSMAN NURİ UÇAN

  2. Optimization of deep neural network architectures for the forest fire detection

    Orman yangini tespitinde derin sinir aği mimarilerinin optimizasyonu

    BERRİN SAVDA

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. MÜŞTAK ERHAN YALÇIN

    PROF. DR. HAZIM KEMAL EKENEL

  3. Video üzerinde derin öğrenme ile nesne sansürlüme

    Sensor processing on video with deep learni̇ng

    YERNIYAZ BAKHYTOV

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. CEMİL ÖZ

  4. Autolanding control system design with deep learning based fault estimation

    Derin öğrenme tabanlı hasar tespitli gürbüz otomatik iniş kontrol sistemi

    BATUHAN EROĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Uçak Mühendisliğiİstanbul Teknik Üniversitesi

    Uçak ve Uzay Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ NAZIM KEMAL ÜRE

  5. Derin öğrenme ile görüntü sahtecilik tespiti

    Image forgery detection with deep learning

    ELNUR OSMANOV

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOSTİM TEKNİK ÜNİVERSİTESİ

    Yazılım Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ İCLAL ÇETİN TAŞ