Geri Dön

Yaşanan terör olaylarını içeren büyük verinin makine öğrenmesi teknikleri ile analizi

Analysis of big data including terror terms with machine learning techniques

  1. Tez No: 572424
  2. Yazar: BARIŞ KARABAY
  3. Danışmanlar: DR. ÖĞR. ÜYESİ MUSTAFA ULAŞ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Büyük veri, Apache spark, Terör olayları, Makine Öğrenme Algoritmaları, Apache spark, Big data, Terrorist incidents, Machine Learning Algorithms
  7. Yıl: 2019
  8. Dil: Türkçe
  9. Üniversite: Fırat Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Yazılım Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 78

Özet

Teknoloji ve internet sayesinde veriler anlık olarak üretilmektedir. Bu verilerin çoğalması ile birlikte bilgi çıkarımı işlemleri önemli hale gelmekte ve veriden çıkarılacak bilgiler çok değerli olabilmektedir. Teknolojinin gelişmesi ve haberleşme ağlarının çoğalması ile birlikte günümüzde bilginin büyüklüğü ve değerli olması daha net bir şekilde görülmektedir. Günümüz teknolojisinde birçok cihaz anlık veri üretebilmekte, verileri kayıt altına almakta ve bu kayıtlar çoğaldıkça veriler yeterince incelenemeden veri deposuna gönderilmektedir. Araştırma ve geliştirme çalışmalarını bu yönde yürüterek karmaşık ve çeşitli verilerin altında zengin kaynaklarının yattığının farkına varan birçok araştırmacı“Büyük Veri”denilen bir yapıyı ortaya çıkartmıştır. Büyük veri işleme yöntemleri sayesinde anlamlı, faydalı ve önemli verilerin ortaya çıktığı görülmektedir. Büyük Veri, sadece büyük miktardaki veri anlamına gelmemekle birlikte geleneksel metotlar ile işlenemeyen veri anlamına da gelmektedir. Bu çalışmada, uluslararası haber ajanslarından ve kaynaklardan elde edilen verilerin oluşturulduğu dünyada yaşanmış olan terör olaylarını içeren Global Terrorism Database (GTD) veri kümesi ele alınmıştır. Bu veri kümesi üzerinde büyük veri kapsamında makine öğrenmesi yöntemleri ile analiz ve sınıflandırma işlemleri gerçekleştirilmiştir. Yaşanan bir terör olayının hangi örgüt tarafından gerçekleştirildiğini tahmin eden bir uygulama geliştirilmiştir. Bu çerçevede, terör saldırısının saldırı tipi, kullanılan silah türü, saldırı yapılan ülke, bölge ve saldırıdaki hedef kitle bilgileri kullanılarak yaşanan terör olayının hangi örgüt tarafından gerçekleştirildiğini tahmin eden Apache Spark tabanlı açık kaynak büyük veri işleme aracı Python dili kullanılarak geliştirilmiştir. GTD veri kümesinden, en çok saldırı gerçekleştiren ilk 10 terör örgütü seçilerek altı farklı makine öğrenmesi algoritması uygulanmış olup, algoritmaların performansları arasında karşılaştırma ve değerlendirme yapılmıştır. Uygulanan algoritmalarda en yüksek doğruluk oranı K-En Yakın Komşu (KNN) algoritması ile % 98,2 olarak bulunmuştur. Lojistik Regresyon (LR) algoritmasının büyük veri kümesi için uygun olmadığı tespit edilmiştir.

Özet (Çeviri)

Thanks to technology and the internet, data is produced instantly. With the reproduction of this data, information extraction processes become important and the information to be extracted from the data can be very valuable. With the development of technology and the proliferation of communication networks, the size and value of information has come to the forefront today. In today's technology, many devices can produce instant data, record the data, and as these records increase, the data is considered insignificant and sent to the data store. By carrying out research and development efforts in this direction, many institutions and organizations realized that the rich resources underlie the complex and varied data have emerged as a structure called Big Data. It is seen that meaningful, useful and important data emerge thanks to large data processing methods. Big Data means not only large amounts of data, but data that cannot be processed by conventional methods. In this study, the Global Terrorism Database (GTD) data set, which includes the terrorist incidents that took place in the world where data obtained from international news agencies and sources, was discussed. Machine learning methods and analysis and classification operations were performed on this data set within the scope of big data. An application has been developed which predicts the organization of a terrorist incident. Within this framework, the Apache Spark-based open source big data processing tool, which uses the information about the type of weapon, type of weapon, country, region and target group in the attack, was developed using Python language. Six different machine learning algorithms have been applied by selecting the first 10 terrorist organizations performing the most attacks from the GTD dataset and comparisons and evaluations have been made between the performances of the algorithms. The highest accuracy rate in the applied algorithms is 98,2 % with K-Nearest Neighbor (KNN) algorithm. The logistic regression (LR) algorithm was specified according to the situation appropriate for the big data set.

Benzer Tezler

  1. Karanlıkdere Vadisi'nin (Yozgat) phenopelopoid akarları üzerine sistematik araştırmalar

    Systematic investigations on the phenopelopoid mites of Karanlıkdere Valley (Yozgat)

    SALİH KÖKEZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    BiyolojiBozok Üniversitesi

    Biyoloji Ana Bilim Dalı

    YRD. DOÇ. DR. SEDAT PER

  2. İşletmelerde finansal başarısızlık tahminlemesi ve Borsa İstanbul'da faaliyet gösteren gıda şirketlerinde uygulama

    Financial distress forecasting in businesses and application in food companies operating in stock exchange Istanbul

    KEREM URAL

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    İşletmeGediz Üniversitesi

    İşletme Ana Bilim Dalı

    YRD. DOÇ. ŞEVİN GÜRARDA

  3. Gestasyonel diyabetli kadınlarda yaşam kalitesi ve depresyon durumlarının incelenmesi

    The examination of life quality and the event of depression in the period of pregnancy of diabetic women

    REYHAN AYDIN

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    HemşirelikHaliç Üniversitesi

    Hemşirelik Ana Bilim Dalı

    PROF. DR. NEZİHE KIZILKAYA BEJİ

  4. Krizlerle mücadelede mali uyum politikaları ve mali alan ilişkisi: Türkiye açısından bir analiz

    Fiscal adjustment policies and fiscal space relations on struggling with crisis: An analysis from the view point of Turkey

    AYŞEGÜL DURUCAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    EkonomiKırıkkale Üniversitesi

    İktisat Ana Bilim Dalı

    DOÇ. DR. HİLMİ ÜNSAL

  5. Fikir ve Sanat Eserleri Hukuku açısından imar planları ve plan müellifinin hakları

    The rights of zoning plans and plan owner in terms of law on intellectual and artistic works

    ELİF CANBOLAT

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    HukukKırıkkale Üniversitesi

    Özel Hukuk Ana Bilim Dalı

    PROF. DR. MEHMET EMİN BİLGE