Geri Dön

Yaşanan terör olaylarını içeren büyük verinin makine öğrenmesi teknikleri ile analizi

Analysis of big data including terror terms with machine learning techniques

  1. Tez No: 572424
  2. Yazar: BARIŞ KARABAY
  3. Danışmanlar: DR. ÖĞR. ÜYESİ MUSTAFA ULAŞ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Büyük veri, Apache spark, Terör olayları, Makine Öğrenme Algoritmaları, Apache spark, Big data, Terrorist incidents, Machine Learning Algorithms
  7. Yıl: 2019
  8. Dil: Türkçe
  9. Üniversite: Fırat Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Yazılım Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 78

Özet

Teknoloji ve internet sayesinde veriler anlık olarak üretilmektedir. Bu verilerin çoğalması ile birlikte bilgi çıkarımı işlemleri önemli hale gelmekte ve veriden çıkarılacak bilgiler çok değerli olabilmektedir. Teknolojinin gelişmesi ve haberleşme ağlarının çoğalması ile birlikte günümüzde bilginin büyüklüğü ve değerli olması daha net bir şekilde görülmektedir. Günümüz teknolojisinde birçok cihaz anlık veri üretebilmekte, verileri kayıt altına almakta ve bu kayıtlar çoğaldıkça veriler yeterince incelenemeden veri deposuna gönderilmektedir. Araştırma ve geliştirme çalışmalarını bu yönde yürüterek karmaşık ve çeşitli verilerin altında zengin kaynaklarının yattığının farkına varan birçok araştırmacı“Büyük Veri”denilen bir yapıyı ortaya çıkartmıştır. Büyük veri işleme yöntemleri sayesinde anlamlı, faydalı ve önemli verilerin ortaya çıktığı görülmektedir. Büyük Veri, sadece büyük miktardaki veri anlamına gelmemekle birlikte geleneksel metotlar ile işlenemeyen veri anlamına da gelmektedir. Bu çalışmada, uluslararası haber ajanslarından ve kaynaklardan elde edilen verilerin oluşturulduğu dünyada yaşanmış olan terör olaylarını içeren Global Terrorism Database (GTD) veri kümesi ele alınmıştır. Bu veri kümesi üzerinde büyük veri kapsamında makine öğrenmesi yöntemleri ile analiz ve sınıflandırma işlemleri gerçekleştirilmiştir. Yaşanan bir terör olayının hangi örgüt tarafından gerçekleştirildiğini tahmin eden bir uygulama geliştirilmiştir. Bu çerçevede, terör saldırısının saldırı tipi, kullanılan silah türü, saldırı yapılan ülke, bölge ve saldırıdaki hedef kitle bilgileri kullanılarak yaşanan terör olayının hangi örgüt tarafından gerçekleştirildiğini tahmin eden Apache Spark tabanlı açık kaynak büyük veri işleme aracı Python dili kullanılarak geliştirilmiştir. GTD veri kümesinden, en çok saldırı gerçekleştiren ilk 10 terör örgütü seçilerek altı farklı makine öğrenmesi algoritması uygulanmış olup, algoritmaların performansları arasında karşılaştırma ve değerlendirme yapılmıştır. Uygulanan algoritmalarda en yüksek doğruluk oranı K-En Yakın Komşu (KNN) algoritması ile % 98,2 olarak bulunmuştur. Lojistik Regresyon (LR) algoritmasının büyük veri kümesi için uygun olmadığı tespit edilmiştir.

Özet (Çeviri)

Thanks to technology and the internet, data is produced instantly. With the reproduction of this data, information extraction processes become important and the information to be extracted from the data can be very valuable. With the development of technology and the proliferation of communication networks, the size and value of information has come to the forefront today. In today's technology, many devices can produce instant data, record the data, and as these records increase, the data is considered insignificant and sent to the data store. By carrying out research and development efforts in this direction, many institutions and organizations realized that the rich resources underlie the complex and varied data have emerged as a structure called Big Data. It is seen that meaningful, useful and important data emerge thanks to large data processing methods. Big Data means not only large amounts of data, but data that cannot be processed by conventional methods. In this study, the Global Terrorism Database (GTD) data set, which includes the terrorist incidents that took place in the world where data obtained from international news agencies and sources, was discussed. Machine learning methods and analysis and classification operations were performed on this data set within the scope of big data. An application has been developed which predicts the organization of a terrorist incident. Within this framework, the Apache Spark-based open source big data processing tool, which uses the information about the type of weapon, type of weapon, country, region and target group in the attack, was developed using Python language. Six different machine learning algorithms have been applied by selecting the first 10 terrorist organizations performing the most attacks from the GTD dataset and comparisons and evaluations have been made between the performances of the algorithms. The highest accuracy rate in the applied algorithms is 98,2 % with K-Nearest Neighbor (KNN) algorithm. The logistic regression (LR) algorithm was specified according to the situation appropriate for the big data set.

Benzer Tezler

  1. Yeni nesil TNT sensör sistemleri: Enkapsüle piren içeren içi boş silika jel yapıları

    Next generation TNT sensor systems: Hollow silica gel structures with encapsulated pyrene

    BEGÜM ÇETİNEL KÜLCÜ

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    KimyaHacettepe Üniversitesi

    Kimya Ana Bilim Dalı

    PROF. DR. SOLMAZ KARABULUT

  2. Afganistan ve Pakistan ilişkisinin iniş ve çıkışları

    Afganistan and Pakistan relations with their ups and downs

    MOHAMMAD DAVUD IBRAHIMI

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Uluslararası İlişkilerİstanbul Medeniyet Üniversitesi

    Uluslararası İlişkiler Ana Bilim Dalı

    PROF. DR. MUHAMMET LUTFULLAH KARAMAN

  3. 1970 sonrası Türk resim sanatında insan figürünün tematik bağlamda değerlendirilmesi

    Thematic evaluation of human figure in Turkish art of painting after 1970

    SÜLEYMAN ÇAĞLIYAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2010

    Güzel SanatlarMimar Sinan Güzel Sanatlar Üniversitesi

    Resim Bölümü

    YRD. DOÇ. AHMET UMUR DENİZ

  4. Dünya'da ve Türkiye'de kimyasal, biyolojik, radyolojik, nükleer (KBRN)-toksikolojik afetlere karşı oluşturulmuş kurumsal yapılanmaların mevzuat ve uygulamalar bağlamında karşılaştırılması

    Comparison of institutional structures created against chemical, biological, radiological, nuclear (CBRN)-toxicological disasters in the world and Turkey in the context of legislation and practices

    BÜŞRA NUR TÜRKERİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Adli TıpTekirdağ Namık Kemal Üniversitesi

    Acil Yardım ve Afet Yönetimi Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ NAİLE ESRA SAKA

  5. Almanya Parlamentosu ve TBMM'de 2015 ve 2016 yıllarında göç hareketliliği üzerine yapılan tartışmaların analizi

    An analysis of the debates on migration mobility in the German Parliament and TBMM in 2015 and 2016

    SELİM YILDIRIM

    Doktora

    Türkçe

    Türkçe

    2024

    Siyasal BilimlerGalatasaray Üniversitesi

    Siyaset Bilimi Ana Bilim Dalı

    DOÇ. DR. ASLI DİDEM DANIŞ ŞENYÜZ