Geri Dön

Metinsel veri madenciliğinde bilgisayarlı çeviriciler

Machine translator in the textual data mining

  1. Tez No: 312162
  2. Yazar: LEİLA ROUKA
  3. Danışmanlar: DOÇ. DR. CEMAL KÖSE
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2012
  8. Dil: Türkçe
  9. Üniversite: Karadeniz Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 82

Özet

Bu çalışmada, metinsel veri sınıflandırmada bilgisayarlı çeviricilerin etkisi değişik sınıflandırma yöntemleri kullanılarak incelenmiştir. Geliştirilen sistem ilk olarak orijinal dildeki metini analiz edip sınıflandırmakta ve daha sonra aynı metini bilgisayarlı çeviriciler kullanarak hedef dile çevirmekte ve çevrilen metini orijinal dildeki gibi aynen analiz ederek sınıflandırmaktadır. Daha sonra, metinsel veri sınıflandırmada bilgisayarlı çeviricilerin etkisini ölçmek için elde edilen sonuçlar karşılaştırılmıştır.Bu çalışmada, kullanılan sınıflandırma yöntemi performansları da ölçülmüş ve karşılaştırılmıştır. Elde edilen sonuçlara göre Multinomial Naive Bayes yöntemi en başarılı yöntemdir. Yine, aynı belgenin farklı dillere çevrilmiş sınıflandırma sonuçları dikkate alındığında, bilgisayarlı çeviricilerin metinsel veri sınıflandırmada oldukça az bir etkisi olduğu görülmüştür. Bu sonuçlar bilgisayarlı çeviricilerin bir dil temel alınarak farklı dillerde veri madenciliğinin oldukça etkin bir şekilde yapılabileceğini göstermektedir.

Özet (Çeviri)

In this study, we evaluate the efficiency of Machine Translators on the Web-based texts classification, by classification Original texts into predefined categories and then translating them into other language with machine translator for accomplish classification operation with the same categories and assess the results in two situations. In addition to this, the effect of machine translators in the textual data classification is examined by using supervised classification methods. The developed system first analyzes and classifies an input text in one language, and then analyzes and classifies the same text in another language generated by machine translators from the input text. The obtained results are compared to measure the effect of the translators in textual data classification. The performances of the classification method used in this study are also measured and compared. The obtained results show that Multinomial Naïve Bayes method is the most successful method, and that the machine translation has quite a small effect on the attained classification accuracy.

Benzer Tezler

  1. Veri madenciliğinde bulanık mantık uygulaması

    A fuzzy logic application in data mining

    EYÜP SIRAMKAYA

    Yüksek Lisans

    Türkçe

    Türkçe

    2006

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. AHMET ARSLAN

  2. Veri madenciliğinde bir metin madenciliği uygulaması

    A text mining application in data mining

    HARUN BAYER

    Yüksek Lisans

    Türkçe

    Türkçe

    2011

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBeykent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. GÖKHAN SİLAHTAROĞLU

  3. Veri analitiğinin ekonomik etkileri: İnternet yayıncılığında metin tabanlı öneri motoru örneği

    Economic effects of data analytics: Text based recommendation engine example in internet publishing

    AHMET TEZCAN TEKİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    İşletme Mühendisliği Ana Bilim Dalı

    PROF. DR. NEDİME LERZAN ÖZKALE

    DOÇ. DR. BAŞAR ÖZTAYŞİ

  4. Bilgisayar tabanlı metin işlemede en uzun eşleşme algoritmasının karşılaştırmalı analizi

    Comparative analysis of the long match algorithm in computer based text processing

    MEHMET BALCI

    Yüksek Lisans

    Türkçe

    Türkçe

    2010

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk Üniversitesi

    Elektronik ve Bilgisayar Sistemleri Eğitimi Ana Bilim Dalı

    YRD. DOÇ. DR. RIDVAN SARAÇOĞLU

  5. Genetik algoritma ve K-en yakın komşu kullanarak metin belgelerinin sınıflandırılması

    Classification of text documents using genetic algorithm and K-nearest neighbors

    PARISA LARIBI

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolVan Yüzüncü Yıl Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. RIDVAN SARAÇOĞLU