Geri Dön

Suç kategori tespiti için istifleme topluluğu modeli kullanan sistem tasarımı

A design of crime category detection framework using stacking ensemble model

  1. Tez No: 905850
  2. Yazar: BURAK DÜLGEROĞLU
  3. Danışmanlar: DOÇ. DR. RECEP SİNAN ARSLAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Mühendislik Bilimleri, Engineering Sciences
  6. Anahtar Kelimeler: Suç tahmini, Kriminoloji, Doc2Vec, İstifleme Topluluğu Modeli, Crime prediction, Criminology, Doc2Vec, Stacking Ensemble Model
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Kayseri Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Hesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 85

Özet

Suç, toplum açısından yasal olarak zararlı olarak tanımlanan bir eylemi ifade eder ve bu eylemlerin önlenmesi için suç türünün anlaşılması büyük bir öneme sahiptir. Ancak suç, herhangi bir zamanda ve yerde ortaya çıkabilir, bu da suçun tahmin edilebilirliğini zorlaştırabilir. Daha önce işlenmiş suçlara dayalı olarak oluşturulan verilerin kullanılması bu zorluğun aşılmasına katkı sağlamaktadır. Bu tez çalışmasında suç faaliyetlerini sınıflandırmak için uzunluğundan bağımsız olarak metinlerin sayısal temsilini üretebilen Doc2Vec yapısı ve 8 farklı yapay öğrenme modelini içeren bir istifleme topluluğu modelinin kullanıldığı özgün bir model önerilmiştir. Model literatürden farklı olarak öznitelikleri kategorik olarak değil metin olarak işlemekte ve vektör haline dönüştürmektedir. Önerilen model 12 yıl boyunca işlenen suçları içeren, San Francisco Suç Sınıflandırması isimli çevrimiçi dağıtımlı bir yarışma veriseti kullanılarak test edilmiştir. En yüksek suç kaydının olduğu 15 suç kategorisi için %99,28 doğruluk değeri elde edilirken, kesinlik, geri çağırma ve f-skoru sırasıyla %99,18; %99,38 ve %99,20 olmuştur. Çapraz doğrulama (k=10) ile 0,001 standart sapma değeri ile %99,8 başarım yakalanmıştır. Bu performans değerleri kategorik özellik yapısının kullanıldığı literatürdeki tüm çalışmalardan yüksektir. Elde edilen sonuçlar metin tabanlı özellikler barındıran suç faaliyet raporlarının kategorik olarak model eğitimlerinde kullanılması yerine Doc2Vec gibi doğal dil işleme teknikleri ile işlenebilir vektörlere dönüştürülmesinin sınıflandırma performansına doğrudan katkı sunabildiğini göstermiş ve daha az ön işlem sayesinde daha verimli bir modelin ortaya çıkmasını sağlamıştır.

Özet (Çeviri)

Crime refers to an action that is legally defined as harmful to society, and understanding the type of crime is of great importance in order to prevent these actions. However, crime can occur at any time and place, making crime predictability difficult. Using data based on previously committed crimes contributes to overcoming this difficulty. In this thesis study, an original model is proposed to classify criminal activities, using the Doc2Vec structure, which can produce numerical representations of texts regardless of their length, and a stacking ensemble model containing 8 different artificial learning models. Unlike the literature, the model processes the attributes as text rather than categorically and converts them into vectors. The proposed model was tested using an online distributed competition dataset called San Francisco Crime Classification, which includes crimes committed over 12 years. While an accuracy value of 99.28% was obtained for the 15 crime categories with the highest crime records, the precision, recall and f-measure were 99.18%, 99.38% and 99.20% respectively. With cross validation (k=10), 99.8% success was achieved with a standard deviation value of 0.001. These performance values are higher than all studies in the literature using the categorical feature structure. The results obtained showed that converting crime activity reports containing text-based features into processable vectors with natural language processing techniques such as Doc2Vec, instead of using them categorically in model training, can directly contribute to classification performance and enabled the emergence of a more efficient model thanks to less pre-processing.

Benzer Tezler

  1. Özel güvenlik sistemlerinin yükseköğretim kurumlarına sağladığı faydalar üzerine bir araştırma

    A research on the benefits of private security systems to higher education institutions

    BEYTULLAH ÖZEL

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Yönetim Bilişim SistemleriKaramanoğlu Mehmetbey Üniversitesi

    Yönetim Bilişim Sistemleri Ana Bilim Dalı

    PROF. DR. SERKAN ADA

  2. Ceza infaz kurumlarındaki mahkumlarda algılanan sosyal desteğin kurumdaki uyum ve ruhsal durum ile ilişkisinin incelenmesi

    Examination of the relationship between the social support as perceived by the inmates, the mental status and institutional adjustment in correctional facilities

    ASBURÇE RAVANOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    PsikolojiIşık Üniversitesi

    Klinik Psikoloji Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ RUKİYE HAYRAN

  3. Suriyeli mültecilerin Türkiye medyasındaki sınıfsal temsili

    Class representation of Syrian refugees in Turkish media

    FERAY ARTAR

    Doktora

    Türkçe

    Türkçe

    2019

    GazetecilikAnkara Üniversitesi

    Sosyoloji Ana Bilim Dalı

    PROF. DR. MÜZEYYEN AYTÜL KASAPOĞLU

  4. Akademik etik ve akademik liyakat hakkında akademisyen görüşleri

    Academician views on academic ethics and academic merit

    MERVE OKAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Eğitim ve ÖğretimEskişehir Osmangazi Üniversitesi

    Yükseköğretimin Yönetimi ve Politikası Ana Bilim Dalı

    DOÇ. DR. İLKNUR ŞENTÜRK

  5. Recep Peker'in siyasal sosyal ve ekonomik görüşleri

    Başlık çevirisi yok

    LÜTFİYE İLDAN

    Doktora

    Türkçe

    Türkçe

    1989

    Siyasal BilimlerAnkara Üniversitesi

    Kamu Yönetimi ve Siyaset Bilimi Ana Bilim Dalı

    PROF. DR. BÜLENT DAVER