Yaşanan terör olaylarını içeren büyük verinin makine öğrenmesi teknikleri ile analizi
Analysis of big data including terror terms with machine learning techniques
- Tez No: 572424
- Danışmanlar: DR. ÖĞR. ÜYESİ MUSTAFA ULAŞ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Büyük veri, Apache spark, Terör olayları, Makine Öğrenme Algoritmaları, Apache spark, Big data, Terrorist incidents, Machine Learning Algorithms
- Yıl: 2019
- Dil: Türkçe
- Üniversite: Fırat Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Yazılım Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 78
Özet
Teknoloji ve internet sayesinde veriler anlık olarak üretilmektedir. Bu verilerin çoğalması ile birlikte bilgi çıkarımı işlemleri önemli hale gelmekte ve veriden çıkarılacak bilgiler çok değerli olabilmektedir. Teknolojinin gelişmesi ve haberleşme ağlarının çoğalması ile birlikte günümüzde bilginin büyüklüğü ve değerli olması daha net bir şekilde görülmektedir. Günümüz teknolojisinde birçok cihaz anlık veri üretebilmekte, verileri kayıt altına almakta ve bu kayıtlar çoğaldıkça veriler yeterince incelenemeden veri deposuna gönderilmektedir. Araştırma ve geliştirme çalışmalarını bu yönde yürüterek karmaşık ve çeşitli verilerin altında zengin kaynaklarının yattığının farkına varan birçok araştırmacı“Büyük Veri”denilen bir yapıyı ortaya çıkartmıştır. Büyük veri işleme yöntemleri sayesinde anlamlı, faydalı ve önemli verilerin ortaya çıktığı görülmektedir. Büyük Veri, sadece büyük miktardaki veri anlamına gelmemekle birlikte geleneksel metotlar ile işlenemeyen veri anlamına da gelmektedir. Bu çalışmada, uluslararası haber ajanslarından ve kaynaklardan elde edilen verilerin oluşturulduğu dünyada yaşanmış olan terör olaylarını içeren Global Terrorism Database (GTD) veri kümesi ele alınmıştır. Bu veri kümesi üzerinde büyük veri kapsamında makine öğrenmesi yöntemleri ile analiz ve sınıflandırma işlemleri gerçekleştirilmiştir. Yaşanan bir terör olayının hangi örgüt tarafından gerçekleştirildiğini tahmin eden bir uygulama geliştirilmiştir. Bu çerçevede, terör saldırısının saldırı tipi, kullanılan silah türü, saldırı yapılan ülke, bölge ve saldırıdaki hedef kitle bilgileri kullanılarak yaşanan terör olayının hangi örgüt tarafından gerçekleştirildiğini tahmin eden Apache Spark tabanlı açık kaynak büyük veri işleme aracı Python dili kullanılarak geliştirilmiştir. GTD veri kümesinden, en çok saldırı gerçekleştiren ilk 10 terör örgütü seçilerek altı farklı makine öğrenmesi algoritması uygulanmış olup, algoritmaların performansları arasında karşılaştırma ve değerlendirme yapılmıştır. Uygulanan algoritmalarda en yüksek doğruluk oranı K-En Yakın Komşu (KNN) algoritması ile % 98,2 olarak bulunmuştur. Lojistik Regresyon (LR) algoritmasının büyük veri kümesi için uygun olmadığı tespit edilmiştir.
Özet (Çeviri)
Thanks to technology and the internet, data is produced instantly. With the reproduction of this data, information extraction processes become important and the information to be extracted from the data can be very valuable. With the development of technology and the proliferation of communication networks, the size and value of information has come to the forefront today. In today's technology, many devices can produce instant data, record the data, and as these records increase, the data is considered insignificant and sent to the data store. By carrying out research and development efforts in this direction, many institutions and organizations realized that the rich resources underlie the complex and varied data have emerged as a structure called Big Data. It is seen that meaningful, useful and important data emerge thanks to large data processing methods. Big Data means not only large amounts of data, but data that cannot be processed by conventional methods. In this study, the Global Terrorism Database (GTD) data set, which includes the terrorist incidents that took place in the world where data obtained from international news agencies and sources, was discussed. Machine learning methods and analysis and classification operations were performed on this data set within the scope of big data. An application has been developed which predicts the organization of a terrorist incident. Within this framework, the Apache Spark-based open source big data processing tool, which uses the information about the type of weapon, type of weapon, country, region and target group in the attack, was developed using Python language. Six different machine learning algorithms have been applied by selecting the first 10 terrorist organizations performing the most attacks from the GTD dataset and comparisons and evaluations have been made between the performances of the algorithms. The highest accuracy rate in the applied algorithms is 98,2 % with K-Nearest Neighbor (KNN) algorithm. The logistic regression (LR) algorithm was specified according to the situation appropriate for the big data set.
Benzer Tezler
- Yeni nesil TNT sensör sistemleri: Enkapsüle piren içeren içi boş silika jel yapıları
Next generation TNT sensor systems: Hollow silica gel structures with encapsulated pyrene
BEGÜM ÇETİNEL KÜLCÜ
- Afganistan ve Pakistan ilişkisinin iniş ve çıkışları
Afganistan and Pakistan relations with their ups and downs
MOHAMMAD DAVUD IBRAHIMI
Yüksek Lisans
Türkçe
2021
Uluslararası İlişkilerİstanbul Medeniyet ÜniversitesiUluslararası İlişkiler Ana Bilim Dalı
PROF. DR. MUHAMMET LUTFULLAH KARAMAN
- 1970 sonrası Türk resim sanatında insan figürünün tematik bağlamda değerlendirilmesi
Thematic evaluation of human figure in Turkish art of painting after 1970
SÜLEYMAN ÇAĞLIYAN
Yüksek Lisans
Türkçe
2010
Güzel SanatlarMimar Sinan Güzel Sanatlar ÜniversitesiResim Bölümü
YRD. DOÇ. AHMET UMUR DENİZ
- Dünya'da ve Türkiye'de kimyasal, biyolojik, radyolojik, nükleer (KBRN)-toksikolojik afetlere karşı oluşturulmuş kurumsal yapılanmaların mevzuat ve uygulamalar bağlamında karşılaştırılması
Comparison of institutional structures created against chemical, biological, radiological, nuclear (CBRN)-toxicological disasters in the world and Turkey in the context of legislation and practices
BÜŞRA NUR TÜRKERİ
Yüksek Lisans
Türkçe
2022
Adli TıpTekirdağ Namık Kemal ÜniversitesiAcil Yardım ve Afet Yönetimi Ana Bilim Dalı
DR. ÖĞR. ÜYESİ NAİLE ESRA SAKA
- Almanya Parlamentosu ve TBMM'de 2015 ve 2016 yıllarında göç hareketliliği üzerine yapılan tartışmaların analizi
An analysis of the debates on migration mobility in the German Parliament and TBMM in 2015 and 2016
SELİM YILDIRIM
Doktora
Türkçe
2024
Siyasal BilimlerGalatasaray ÜniversitesiSiyaset Bilimi Ana Bilim Dalı
DOÇ. DR. ASLI DİDEM DANIŞ ŞENYÜZ