Suç kategori tespiti için istifleme topluluğu modeli kullanan sistem tasarımı
A design of crime category detection framework using stacking ensemble model
- Tez No: 905850
- Danışmanlar: DOÇ. DR. RECEP SİNAN ARSLAN
- Tez Türü: Yüksek Lisans
- Konular: Mühendislik Bilimleri, Engineering Sciences
- Anahtar Kelimeler: Suç tahmini, Kriminoloji, Doc2Vec, İstifleme Topluluğu Modeli, Crime prediction, Criminology, Doc2Vec, Stacking Ensemble Model
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Kayseri Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Hesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 85
Özet
Suç, toplum açısından yasal olarak zararlı olarak tanımlanan bir eylemi ifade eder ve bu eylemlerin önlenmesi için suç türünün anlaşılması büyük bir öneme sahiptir. Ancak suç, herhangi bir zamanda ve yerde ortaya çıkabilir, bu da suçun tahmin edilebilirliğini zorlaştırabilir. Daha önce işlenmiş suçlara dayalı olarak oluşturulan verilerin kullanılması bu zorluğun aşılmasına katkı sağlamaktadır. Bu tez çalışmasında suç faaliyetlerini sınıflandırmak için uzunluğundan bağımsız olarak metinlerin sayısal temsilini üretebilen Doc2Vec yapısı ve 8 farklı yapay öğrenme modelini içeren bir istifleme topluluğu modelinin kullanıldığı özgün bir model önerilmiştir. Model literatürden farklı olarak öznitelikleri kategorik olarak değil metin olarak işlemekte ve vektör haline dönüştürmektedir. Önerilen model 12 yıl boyunca işlenen suçları içeren, San Francisco Suç Sınıflandırması isimli çevrimiçi dağıtımlı bir yarışma veriseti kullanılarak test edilmiştir. En yüksek suç kaydının olduğu 15 suç kategorisi için %99,28 doğruluk değeri elde edilirken, kesinlik, geri çağırma ve f-skoru sırasıyla %99,18; %99,38 ve %99,20 olmuştur. Çapraz doğrulama (k=10) ile 0,001 standart sapma değeri ile %99,8 başarım yakalanmıştır. Bu performans değerleri kategorik özellik yapısının kullanıldığı literatürdeki tüm çalışmalardan yüksektir. Elde edilen sonuçlar metin tabanlı özellikler barındıran suç faaliyet raporlarının kategorik olarak model eğitimlerinde kullanılması yerine Doc2Vec gibi doğal dil işleme teknikleri ile işlenebilir vektörlere dönüştürülmesinin sınıflandırma performansına doğrudan katkı sunabildiğini göstermiş ve daha az ön işlem sayesinde daha verimli bir modelin ortaya çıkmasını sağlamıştır.
Özet (Çeviri)
Crime refers to an action that is legally defined as harmful to society, and understanding the type of crime is of great importance in order to prevent these actions. However, crime can occur at any time and place, making crime predictability difficult. Using data based on previously committed crimes contributes to overcoming this difficulty. In this thesis study, an original model is proposed to classify criminal activities, using the Doc2Vec structure, which can produce numerical representations of texts regardless of their length, and a stacking ensemble model containing 8 different artificial learning models. Unlike the literature, the model processes the attributes as text rather than categorically and converts them into vectors. The proposed model was tested using an online distributed competition dataset called San Francisco Crime Classification, which includes crimes committed over 12 years. While an accuracy value of 99.28% was obtained for the 15 crime categories with the highest crime records, the precision, recall and f-measure were 99.18%, 99.38% and 99.20% respectively. With cross validation (k=10), 99.8% success was achieved with a standard deviation value of 0.001. These performance values are higher than all studies in the literature using the categorical feature structure. The results obtained showed that converting crime activity reports containing text-based features into processable vectors with natural language processing techniques such as Doc2Vec, instead of using them categorically in model training, can directly contribute to classification performance and enabled the emergence of a more efficient model thanks to less pre-processing.
Benzer Tezler
- Özel güvenlik sistemlerinin yükseköğretim kurumlarına sağladığı faydalar üzerine bir araştırma
A research on the benefits of private security systems to higher education institutions
BEYTULLAH ÖZEL
Yüksek Lisans
Türkçe
2023
Yönetim Bilişim SistemleriKaramanoğlu Mehmetbey ÜniversitesiYönetim Bilişim Sistemleri Ana Bilim Dalı
PROF. DR. SERKAN ADA
- Ceza infaz kurumlarındaki mahkumlarda algılanan sosyal desteğin kurumdaki uyum ve ruhsal durum ile ilişkisinin incelenmesi
Examination of the relationship between the social support as perceived by the inmates, the mental status and institutional adjustment in correctional facilities
ASBURÇE RAVANOĞLU
Yüksek Lisans
Türkçe
2018
PsikolojiIşık ÜniversitesiKlinik Psikoloji Ana Bilim Dalı
DR. ÖĞR. ÜYESİ RUKİYE HAYRAN
- Suriyeli mültecilerin Türkiye medyasındaki sınıfsal temsili
Class representation of Syrian refugees in Turkish media
FERAY ARTAR
Doktora
Türkçe
2019
GazetecilikAnkara ÜniversitesiSosyoloji Ana Bilim Dalı
PROF. DR. MÜZEYYEN AYTÜL KASAPOĞLU
- Akademik etik ve akademik liyakat hakkında akademisyen görüşleri
Academician views on academic ethics and academic merit
MERVE OKAN
Yüksek Lisans
Türkçe
2021
Eğitim ve ÖğretimEskişehir Osmangazi ÜniversitesiYükseköğretimin Yönetimi ve Politikası Ana Bilim Dalı
DOÇ. DR. İLKNUR ŞENTÜRK
- Recep Peker'in siyasal sosyal ve ekonomik görüşleri
Başlık çevirisi yok
LÜTFİYE İLDAN
Doktora
Türkçe
1989
Siyasal BilimlerAnkara ÜniversitesiKamu Yönetimi ve Siyaset Bilimi Ana Bilim Dalı
PROF. DR. BÜLENT DAVER