Yaşanan terör olaylarını içeren büyük verinin makine öğrenmesi teknikleri ile analizi
Analysis of big data including terror terms with machine learning techniques
- Tez No: 572424
- Danışmanlar: DR. ÖĞR. ÜYESİ MUSTAFA ULAŞ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Büyük veri, Apache spark, Terör olayları, Makine Öğrenme Algoritmaları, Apache spark, Big data, Terrorist incidents, Machine Learning Algorithms
- Yıl: 2019
- Dil: Türkçe
- Üniversite: Fırat Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Yazılım Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 78
Özet
Teknoloji ve internet sayesinde veriler anlık olarak üretilmektedir. Bu verilerin çoğalması ile birlikte bilgi çıkarımı işlemleri önemli hale gelmekte ve veriden çıkarılacak bilgiler çok değerli olabilmektedir. Teknolojinin gelişmesi ve haberleşme ağlarının çoğalması ile birlikte günümüzde bilginin büyüklüğü ve değerli olması daha net bir şekilde görülmektedir. Günümüz teknolojisinde birçok cihaz anlık veri üretebilmekte, verileri kayıt altına almakta ve bu kayıtlar çoğaldıkça veriler yeterince incelenemeden veri deposuna gönderilmektedir. Araştırma ve geliştirme çalışmalarını bu yönde yürüterek karmaşık ve çeşitli verilerin altında zengin kaynaklarının yattığının farkına varan birçok araştırmacı“Büyük Veri”denilen bir yapıyı ortaya çıkartmıştır. Büyük veri işleme yöntemleri sayesinde anlamlı, faydalı ve önemli verilerin ortaya çıktığı görülmektedir. Büyük Veri, sadece büyük miktardaki veri anlamına gelmemekle birlikte geleneksel metotlar ile işlenemeyen veri anlamına da gelmektedir. Bu çalışmada, uluslararası haber ajanslarından ve kaynaklardan elde edilen verilerin oluşturulduğu dünyada yaşanmış olan terör olaylarını içeren Global Terrorism Database (GTD) veri kümesi ele alınmıştır. Bu veri kümesi üzerinde büyük veri kapsamında makine öğrenmesi yöntemleri ile analiz ve sınıflandırma işlemleri gerçekleştirilmiştir. Yaşanan bir terör olayının hangi örgüt tarafından gerçekleştirildiğini tahmin eden bir uygulama geliştirilmiştir. Bu çerçevede, terör saldırısının saldırı tipi, kullanılan silah türü, saldırı yapılan ülke, bölge ve saldırıdaki hedef kitle bilgileri kullanılarak yaşanan terör olayının hangi örgüt tarafından gerçekleştirildiğini tahmin eden Apache Spark tabanlı açık kaynak büyük veri işleme aracı Python dili kullanılarak geliştirilmiştir. GTD veri kümesinden, en çok saldırı gerçekleştiren ilk 10 terör örgütü seçilerek altı farklı makine öğrenmesi algoritması uygulanmış olup, algoritmaların performansları arasında karşılaştırma ve değerlendirme yapılmıştır. Uygulanan algoritmalarda en yüksek doğruluk oranı K-En Yakın Komşu (KNN) algoritması ile % 98,2 olarak bulunmuştur. Lojistik Regresyon (LR) algoritmasının büyük veri kümesi için uygun olmadığı tespit edilmiştir.
Özet (Çeviri)
Thanks to technology and the internet, data is produced instantly. With the reproduction of this data, information extraction processes become important and the information to be extracted from the data can be very valuable. With the development of technology and the proliferation of communication networks, the size and value of information has come to the forefront today. In today's technology, many devices can produce instant data, record the data, and as these records increase, the data is considered insignificant and sent to the data store. By carrying out research and development efforts in this direction, many institutions and organizations realized that the rich resources underlie the complex and varied data have emerged as a structure called Big Data. It is seen that meaningful, useful and important data emerge thanks to large data processing methods. Big Data means not only large amounts of data, but data that cannot be processed by conventional methods. In this study, the Global Terrorism Database (GTD) data set, which includes the terrorist incidents that took place in the world where data obtained from international news agencies and sources, was discussed. Machine learning methods and analysis and classification operations were performed on this data set within the scope of big data. An application has been developed which predicts the organization of a terrorist incident. Within this framework, the Apache Spark-based open source big data processing tool, which uses the information about the type of weapon, type of weapon, country, region and target group in the attack, was developed using Python language. Six different machine learning algorithms have been applied by selecting the first 10 terrorist organizations performing the most attacks from the GTD dataset and comparisons and evaluations have been made between the performances of the algorithms. The highest accuracy rate in the applied algorithms is 98,2 % with K-Nearest Neighbor (KNN) algorithm. The logistic regression (LR) algorithm was specified according to the situation appropriate for the big data set.
Benzer Tezler
- Karanlıkdere Vadisi'nin (Yozgat) phenopelopoid akarları üzerine sistematik araştırmalar
Systematic investigations on the phenopelopoid mites of Karanlıkdere Valley (Yozgat)
SALİH KÖKEZ
- İşletmelerde finansal başarısızlık tahminlemesi ve Borsa İstanbul'da faaliyet gösteren gıda şirketlerinde uygulama
Financial distress forecasting in businesses and application in food companies operating in stock exchange Istanbul
KEREM URAL
- Gestasyonel diyabetli kadınlarda yaşam kalitesi ve depresyon durumlarının incelenmesi
The examination of life quality and the event of depression in the period of pregnancy of diabetic women
REYHAN AYDIN
Yüksek Lisans
Türkçe
2013
HemşirelikHaliç ÜniversitesiHemşirelik Ana Bilim Dalı
PROF. DR. NEZİHE KIZILKAYA BEJİ
- Krizlerle mücadelede mali uyum politikaları ve mali alan ilişkisi: Türkiye açısından bir analiz
Fiscal adjustment policies and fiscal space relations on struggling with crisis: An analysis from the view point of Turkey
AYŞEGÜL DURUCAN
- Fikir ve Sanat Eserleri Hukuku açısından imar planları ve plan müellifinin hakları
The rights of zoning plans and plan owner in terms of law on intellectual and artistic works
ELİF CANBOLAT
Yüksek Lisans
Türkçe
2014
HukukKırıkkale ÜniversitesiÖzel Hukuk Ana Bilim Dalı
PROF. DR. MEHMET EMİN BİLGE