Metinsel veri madenciliğinde bilgisayarlı çeviriciler
Machine translator in the textual data mining
- Tez No: 312162
- Danışmanlar: DOÇ. DR. CEMAL KÖSE
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2012
- Dil: Türkçe
- Üniversite: Karadeniz Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 82
Özet
Bu çalışmada, metinsel veri sınıflandırmada bilgisayarlı çeviricilerin etkisi değişik sınıflandırma yöntemleri kullanılarak incelenmiştir. Geliştirilen sistem ilk olarak orijinal dildeki metini analiz edip sınıflandırmakta ve daha sonra aynı metini bilgisayarlı çeviriciler kullanarak hedef dile çevirmekte ve çevrilen metini orijinal dildeki gibi aynen analiz ederek sınıflandırmaktadır. Daha sonra, metinsel veri sınıflandırmada bilgisayarlı çeviricilerin etkisini ölçmek için elde edilen sonuçlar karşılaştırılmıştır.Bu çalışmada, kullanılan sınıflandırma yöntemi performansları da ölçülmüş ve karşılaştırılmıştır. Elde edilen sonuçlara göre Multinomial Naive Bayes yöntemi en başarılı yöntemdir. Yine, aynı belgenin farklı dillere çevrilmiş sınıflandırma sonuçları dikkate alındığında, bilgisayarlı çeviricilerin metinsel veri sınıflandırmada oldukça az bir etkisi olduğu görülmüştür. Bu sonuçlar bilgisayarlı çeviricilerin bir dil temel alınarak farklı dillerde veri madenciliğinin oldukça etkin bir şekilde yapılabileceğini göstermektedir.
Özet (Çeviri)
In this study, we evaluate the efficiency of Machine Translators on the Web-based texts classification, by classification Original texts into predefined categories and then translating them into other language with machine translator for accomplish classification operation with the same categories and assess the results in two situations. In addition to this, the effect of machine translators in the textual data classification is examined by using supervised classification methods. The developed system first analyzes and classifies an input text in one language, and then analyzes and classifies the same text in another language generated by machine translators from the input text. The obtained results are compared to measure the effect of the translators in textual data classification. The performances of the classification method used in this study are also measured and compared. The obtained results show that Multinomial Naïve Bayes method is the most successful method, and that the machine translation has quite a small effect on the attained classification accuracy.
Benzer Tezler
- Veri madenciliğinde bulanık mantık uygulaması
A fuzzy logic application in data mining
EYÜP SIRAMKAYA
Yüksek Lisans
Türkçe
2006
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. AHMET ARSLAN
- Veri madenciliğinde bir metin madenciliği uygulaması
A text mining application in data mining
HARUN BAYER
Yüksek Lisans
Türkçe
2011
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBeykent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. GÖKHAN SİLAHTAROĞLU
- Veri analitiğinin ekonomik etkileri: İnternet yayıncılığında metin tabanlı öneri motoru örneği
Economic effects of data analytics: Text based recommendation engine example in internet publishing
AHMET TEZCAN TEKİN
Yüksek Lisans
Türkçe
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesiİşletme Mühendisliği Ana Bilim Dalı
PROF. DR. NEDİME LERZAN ÖZKALE
DOÇ. DR. BAŞAR ÖZTAYŞİ
- Bilgisayar tabanlı metin işlemede en uzun eşleşme algoritmasının karşılaştırmalı analizi
Comparative analysis of the long match algorithm in computer based text processing
MEHMET BALCI
Yüksek Lisans
Türkçe
2010
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk ÜniversitesiElektronik ve Bilgisayar Sistemleri Eğitimi Ana Bilim Dalı
YRD. DOÇ. DR. RIDVAN SARAÇOĞLU
- Genetik algoritma ve K-en yakın komşu kullanarak metin belgelerinin sınıflandırılması
Classification of text documents using genetic algorithm and K-nearest neighbors
PARISA LARIBI
Yüksek Lisans
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolVan Yüzüncü Yıl ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. RIDVAN SARAÇOĞLU