1 numaralı Erzurum Ahkâm Defterinin (m.1742–1749) metin madenciliği tekniğiyle değerlendirilmesi
Evaluation of Erzurum Ahkâm Defter (m.1742–1749) numbered 1 with the text mining technique
- Tez No: 772371
- Danışmanlar: PROF. DR. İSHAK KESKİN
- Tez Türü: Yüksek Lisans
- Konular: Bilgi ve Belge Yönetimi, Information and Records Management
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: Türkçe
- Üniversite: İstanbul Üniversitesi
- Enstitü: Sosyal Bilimler Enstitüsü
- Ana Bilim Dalı: Bilgi ve Belge Yönetimi Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 157
Özet
Teknolojik gelişmelere bağlı olarak büyük miktarda veri oluşmaya başlamıştır. Söz konusu veriler veri madenciliği ve metin madenciliği yöntemleri kullanılarak analiz edilebilmekte ve ayrıca bu verilerden faydalı bilgiler çıkarılabilmektedir. Veri madenciliği yapılandırılmış veriler üzerinde uygulanırken metin madenciliği yarı yapılandırılmış ya da yapılandırılmamış veriler üzerinde uygulanmaktadır. Arşivlere ya da veri tabanlarına bakıldığında buralarda depolanan veri miktarının çok yüksek olduğu görülebilir. Bu bağlamda Osmanlı arşiv belgeleri de önemli bir veri kaynağı olarak kabul edilebilir. Bu verilerin çoğu yapılandırılmamış ya da yarı yapılandırılmış metinsel veri formundadır. Büyük miktardaki metinsel verilerin manuel olarak düzenlenmesi, analiz edilmesi ve dolayısıyla faydalı bilgilerin elde edilmesi oldukça zor ve zaman alıcı bir işlemdir. Bu çalışmada, 1 Numaralı Erzurum Ahkâm Defterinin içerisinde bulunan metinsel hüküm verileri, metin madenciliği yöntemleri uygulanarak, otomatik bir şekilde konularına göre sınıflandırılmıştır. Sınıflandırma işleminde Decision Tree, Support Vector Machine, Gradient Boosted Trees, Random Forest ve K Nearest Neighbor algoritmaları kullanılmıştır. Kullanılan doküman frekansı, ikili ağırlıklandırma, terim frekansı, ters doküman frekansı ve ters sınıf frekansı ağırlıklandırma yöntemlerine göre algoritmaların sınıflandırma başarıları değerlendirilmiştir. En başarılı sonuç %0,812 doğruluk oranıyla ters doküman frekansı ağırlıklandırma yöntemi kullanılarak Gradient Boosted ağaçları algoritmasıyla elde edilmiştir. Oluşturulan sınıflandırma modelinin geliştirilebilmesi ve Osmanlı arşiv belgeleri üzerinde uygulanacak metin madenciliği uygulamaları için önerilerde bulunulmuştur.
Özet (Çeviri)
Depending on the technological developments, a large amount of data has begun to be formed. The data in question can be analyzed using data mining and text mining methods, and useful information can also be extracted from these data. While data mining is applied on structured data, text mining is applied on semi-structured or unstructured data. When we look at the archives or databases, it can be seen that the amount of data stored in them is very high. In this context, Ottoman archival documents can also be considered as an important data source. Most of this data is in the form of unstructured or semi-structured textual data. The process of manually arranging and analyzing large amounts of textual data, and therefore obtaining useful information, is a rather difficult and time-consuming process. In this study, the textual judgment data contained in the Erzurum Ahkâm Defter numbered 1 were automatically classified according to their subjects by applying text mining methods. Decision Tree, Support Vector Machine, Gradient Boosted Trees, Random Forest and K Nearest Neighbor algorithms were used in the classification process. The classification achievements of the algorithms were evaluated according to the document frequency, binary weighting, term frequency, inverse document frequency and inverse class frequency weighting methods used. The most successful result was obtained from the Gradient Boosted trees algorithm according to the inverse document frequency weighting method with an accuracy rate of %0,812. Suggestions were made for the development of the classification model created and for the text mining applications to be applied on the Ottoman archive documents.
Benzer Tezler
- 1 numaralı ve 1155-1162/1742-1749 tarihli Erzurum Ahkâm Defteri'nin transkripsiyonu ve değerlendirilmesi (sayfa 1?65)
Dated 1155 H. /1742 M. and numbered 1 the transcription and evaluation of Erzurum Ahkâm Defters (page 1?65)
MUHİTTİN KUL
- Erzurum Vilâyeti 1 numaralı ve 1155-1162/1742-1749 tarihli Ahkâm Defteri'nin transkripsiyonu ve değerlendirilmesi (sayfa 65-130)
The transcription and evaluation of Erzurum Ahkâm Defter dated 1155-1162/1742-1749 and numbered 1 (page 65-130)
HİKMET ÇİÇEK
- 1 numaralı Erzurum Ahkâm Defterinin transkripsiyonu ve değerlendirilmesi (S.212-293)
Transcryption and evaluation of Erzurum Ahkâm Defter with number 1 (P. 212-293)
NAZMİYE GÜL KANTAROĞLU
- 1 numaralı Erzurum Ahkâm Defterinin transkripsiyonu ve değerlendirilmesi (s.131-212)
Erzurum Ahkâm Defters numbered 1 transcryption andevaluation (131-212)
FEYZANUR SUSAM
- Erzurum Vilayeti 10 numaralı (Hicri 1224 tarihli) Ahkâm Defteri'nin transkripsiyonu ve değerlendirilmesi (S.1-30)
Transcription and evaluation of the Judgement Registers of Erzurum Province No. 10 and Dated 1224 Hijri (P.1-30)
ABDULKADİR GÜZELTEPE
Yüksek Lisans
Türkçe
2023
DinKafkas ÜniversitesiTemel İslam Bilimleri Ana Bilim Dalı
DOÇ. DR. BÜNYAMİN ÇALIK