Text classification of court of cassation decisions with machine learning
Makine öğrenmesi ile yargıtay kararlarının metin sınıflandırılması
- Tez No: 892144
- Danışmanlar: DOÇ. DR. HALE ILGAZ
- Tez Türü: Yüksek Lisans
- Konular: Bilim ve Teknoloji, Science and Technology
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: İngilizce
- Üniversite: Ankara Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Yapay Zeka Teknolojileri Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 90
Özet
Metin sınıflandırma, doğal dil işleme alanının bir alt dalıdır ve yargı kararlarının otomatik bir şekilde sınıflandırılmasını sağlayarak hukuk alanında çalışan kişilere büyük bir kolaylık sağlama potansiyeli vardır. Bu çalışmada, çeşitli makine öğrenmesi algoritmaları ile İcra ve İflas kanundaki tanımlı suçlara ilişkin Yargıtay kararları sınıflandırılmıştır. Öncelikle Yargıtayın internet sitesi üzerinden belirlenen suçlara ilişkin kararlar toplanmış ve bir veri seti oluşturulmuştur. Veri setinin etiketlenmesinden sonra ön işleme aşaması ile kararlar makine öğrenmesi algoritmalarının kullanabileceği forma dönüştürülmüştür. Değerlendirme sonucunda Karar Ağacı ve Rastgele orman modelleri en iyi performansı göstermişlerdir. En zayıf performans gösteren Naive Bayes algoritması olmuştur. Ancak bu modelin 0.805 F1 skoruna ulaştığı düşünüldüğünde genel olarak modellerin iyi performans sergilediği sonucuna varılabilir. Elde edilen sonuçlar göstermektedir ki veri setinde bulunan kararlarda benzer ifadelerin sık tekrarlaması ve veri setinin küçük olması geleneksel makine öğrenmesi yöntemlerinin etkin bir şekilde çalışmasını sağlamaktadır.
Özet (Çeviri)
Text classification is a sub-field of the field of natural language processing and has the potential to provide great convenience to those working in the field of law by providing automatic classification of judicial decisions. In this study, the Court of Cassation decisions regarding the crimes defined in the Enforcement and Bankruptcy law were classified with various machine learning algorithms. First of all, the decisions regarding the determined crimes were collected on the website of the Court of Cassation and a dataset was created. After labeling the dataset, the decisions were transformed into a form that machine learning algorithms can use with the preprocessing stage. As a result of the evaluation, Decision Tree and Random Forest models showed the best performance. The poorest performing algorithm was the Naive Bayes algorithm. However, considering that this model reached an F1 score of 0.805, it can be concluded that the models generally performed well. The results obtained show that the frequent repetition of similar expressions in the dataset and the small size of the dataset make traditional machine learning methods efficient.
Benzer Tezler
- Osmanlı Devleti'nde modernleşme dönemi (1879-1924) dava belgelerinin düzenlenme biçimi
The redaction of case documents during the modernization period (1879-1924) in the Ottoman Empire
AYŞE ŞEN
Yüksek Lisans
Türkçe
2023
HukukGalatasaray ÜniversitesiKamu Hukuku Ana Bilim Dalı
DR. ÖĞR. ÜYESİ FATMA GÜL KARAGÖZ
- Kambiyo senetlerinde def'iler
Defences on bills of exchange
MUSTAFA YASİR AKTEKE
Yüksek Lisans
Türkçe
2017
HukukYıldırım Beyazıt ÜniversitesiÖzel Hukuk Ana Bilim Dalı
PROF. DR. HAYRİ BOZGEYİK
- 1451 Numaralı Hopa Şer?iyye Sicil Defteri: İnceleme-metin
Hopa the Registered Islamic Court Records Numbered 1451: Study-text
KADER KAYA
Yüksek Lisans
Türkçe
2011
TarihMarmara ÜniversitesiTürk Tarihi Ana Bilim Dalı
YRD. DOÇ. DR. MEHMET TAŞTEMİR
- 40 No.lu Amasya şeriye sicilinin kaynak değeri ve konu tasnifi
Source value and subject classification of Amasya court registery No. 40
NEŞE İNAK
- Avrupa insan hakları mahkemesi yargı kararlarının tahmin edilmesi
Predicting the judgments of the european court of human rights
NAGİHAN ÜNAL
Yüksek Lisans
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiAdli Bilişim Ana Bilim Dalı
DOÇ. DR. OKTAY YILDIZ