Metin madenciliğinde kategorik değişkenler için benzetim katsayılarının kullanılması üzerine bir çalışma
A study on the use of simulation coefficients for categorical variables in text mining
- Tez No: 572943
- Danışmanlar: PROF. DR. LEVENT ŞENYAY
- Tez Türü: Yüksek Lisans
- Konular: Ekonometri, İşletme, Econometrics, Business Administration
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: Türkçe
- Üniversite: Dokuz Eylül Üniversitesi
- Enstitü: Sosyal Bilimler Enstitüsü
- Ana Bilim Dalı: Ekonometri Ana Bilim Dalı
- Bilim Dalı: Ekonometri Bilim Dalı
- Sayfa Sayısı: 108
Özet
Metinlerin sayısal ortamlara aktarılması teknolojik gelişmeler yardımı ile kolaylaşmıştır. Metinlere ulaşılabilmesi ve metinlerden anlamlı bilgilerin elde edilebilmesi için metin madenciliği tekniklerinin uygulanması gerekmektedir. Metin madenciliği, yapısal formda bulunmayan verilerden doğal dil işleme disiplini ile birlikte metin üzerinden istatistiksel sonuçları elde etmeyi amaçlamaktadır. Bu çalışma kapsamında, 4 farklı yazarın 6 farklı eseri üzerinde metin madenciliği teknikleri ve benzerlik-uzaklık ölçüleri kullanılarak R programı yardımıyla yazar tanıma ve metin sınıflandırma başarısı elde edilmeye çalışılmıştır. Yazarların eserleri ile ilgili sayısal veriler çıkartılarak bu sayısal veriler ile arasında Öklid uzaklığı hesaplanmış olup K-NN algoritması yardımıyla metin sınıflandırma yapılmıştır. Yazarı belli olmayan bir eserin elde edilen verilerden hareket ile hangi metin kümesine ait olduğu tespit edilmeye çalışılmıştır.
Özet (Çeviri)
The transfer of texts into digital environments is facilitated by technological developments. Text mining techniques should be applied in order to reach the texts and to obtain meaningful information from the texts. Text mining aims to obtain statistical results over the text along with the natural language processing discipline from data that is not found in the structure form. Within the scope of this study, by using the text mining techniques and similarity-distance measurements on 6 different works of 4 different authors, the success of author recognition and text classification with the help of R program has been tried to be achieved. The numerical data related to the authors' works were extracted and the Euclidean distance was calculated between these numerical data and the text classification was done by using the K-NN algorithm. It has been tried to determine which text set belongs to a given work, based on the data obtained.
Benzer Tezler
- Understanding twitter users' behaviour by social network analysis during disasters
Afet durumunda twıtter kullanıcılarının sosyal ağ analizi ile davranışını anlama
GÖZDE MERVE DEMİRCİ
Yüksek Lisans
İngilizce
2020
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. ŞULE ITIR SATOĞLU
DOÇ. DR. GÜLÜSTAN DOĞAN
- Özellik tabanlı görüş madenciliğinde yapay zeka teknikleri kullanarak görüş hedefi çıkarımı ve kategori tespiti
Opinion target extraction and category detection using artificial intelligence techniques in aspect-based opinion mining
KÜRŞAT MUSTAFA KARAOĞLAN
Doktora
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. OĞUZ FINDIK
- Dengesiz veri setlerinde sınıflandırma problemlerinin çözümünde melez yöntem uygulaması
Hybrid method application to solve classification problems in imbalanced datasets
MESTAN ŞAHİN PİR
Yüksek Lisans
Türkçe
2022
Endüstri ve Endüstri MühendisliğiBursa Uludağ ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. DUYGU YILMAZ EROĞLU
- Büyük veri analizi yöntemleri ve yazılım teknolojileriyle metin madenciliği
Text mining using big data analysis methods and tools
EVREN PALA
Yüksek Lisans
Türkçe
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHava Harp Okulu KomutanlığıBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. GÜRAY YILMAZ
- Türkçe sosyal medya içeriklerinin analizi için sanal asistan tasarımı
Virtual assistant design for analysis of Turkish social media contents
MELTEM UZAVCI
Yüksek Lisans
Türkçe
2022
Bilim ve TeknolojiSakarya ÜniversitesiYönetim Bilişim Sistemleri Ana Bilim Dalı
DOÇ. DR. HALİL İBRAHİM CEBECİ