Geri Dön

İngilizce dokümanlarda tema ve alt kavramların tespiti

Topic and sub-topics detection in english documents

  1. Tez No: 527115
  2. Yazar: SENA ÖGTELİK
  3. Danışmanlar: DR. ÖĞR. ÜYESİ METİN TURAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: Türkçe
  9. Üniversite: İstanbul Ticaret Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 59

Özet

Metin sınıflandırma, belgelerin özelliklerine göre birbirinden ayırt edilmesi için yapılan çalışmadır. Bu sınıflandırmalar belgelerin konusunu, belgenin yazarını veya belgenin yazarının cinsiyetini belirleme gibi alanlarda yapılabilir. Belgenin konusu, metinin içerdiği kelimeler ile temsil edilebilir veya kelimelerin anlamsal özellikleri yardımıyla tespit edilebilir. Metinin içerdiği kelimeler ile doğrudan belgenin konusunu temsil etmek yerine, kelimelerin metin içinde kullanıldığı anlama göre çıkarım yapılarak, kelimelerin temsil ettiği konunun tespiti yapılabilir. Yapılan sınıflandırma çalışmasında kelimelerin temsil ettiği konular eğitim setleri kullanılarak tespit edilmiş, deneme metinleri içerisinde geçen kelimelerin ağırlıklarına göre ise sınıflandırma yapılmıştır. Dokümanlarda tema ve alt kavram tespiti konusunda bir model önerilmiş ve deneysel bulgular değerlendirilmiştir. Dokümanlarda tema ve alt kavramların tespiti için kullanılabilecek anlamlı sözcüklerin belirlenmesi amacıyla Helmholtz prensibi temelli Gestalt teorisi kullanılmıştır. Bu sözcüklerin girdi olduğu bir Yapay Sinir Ağı (YSA) modeli oluşturulmuş, eğitim dokümanları (140 adet) ile bu ağ eğitilmiştir. Eğitim ve sınama doküman veri seti spor ve eğitim temalarında olup, toplam 14 alt kavram seçilmiştir. YSA'nın çıktısı tema ve alt-kavram bilgilerini vermektedir. 70 adet sınama dokümanı ile farklı sayıda (5, 10, 20) anlamlı kelime seçilerek deneyler yapılmış, başarı oranının konularda yaklaşık olarak % 95, alt kavramlarda ise % 80 olduğu gözlemlenmiştir.

Özet (Çeviri)

Text classification is a study to distinguish between documents according to their characteristics. Such classifications may be made in areas such as the issue of documents, the author of the document or the gender of the author of the document. The subject of the document can be represented by the words contained in the text, or it can be determined with the help of the semantic features of the words. Instead of representing the subject directly with the words contained in the text, the subject represented by the words can be determined by making inferences according to the meaning of the words used in the text. The subjects represented by the words in the classification study were determined using training sets and the classification was made according to the weights of the words in the test texts. In the documents, a model of topic and sub topic detection is proposed in the documents and experimental findings are evaluated. The Gestalt theory based on the Helmholtz principle was used in the documents to determine the meaningful words that could be used to determine concepts and sub topic. An Artificial Neural Network (ANN) model was established in which these words were entered, and this network was trained with number of 140 training documents. The training and testing document dataset is about the sports and training topics and 14 sub-topics have been selected. The output of ANN gives the topic and sub topic information. Experiments were executed with 70 test documents with different numbers of (5, 10, 20) words. It was observed that the success rate was approximately 95 % in the topic and 80 % in the sub topic.

Benzer Tezler

  1. Current status of industry 4.0 transformation and impact of industry 4.0 on engineering work in Turkish white goods industry

    Endüstri 4.0 dönüşümünün Türkiye beyaz eşya sektöründeki mevcut durumu ve mühendislik işi üzerindeki etkisi

    KÜBRA ŞİMŞEK DEMİRBAĞ

    Doktora

    İngilizce

    İngilizce

    2020

    Bilim ve Teknolojiİstanbul Teknik Üniversitesi

    İşletme Mühendisliği Ana Bilim Dalı

    DOÇ. DR. NİHAN YILDIRIM

  2. Communication interculturelle dans l'enseignement de langue etrangere : Analyse des opinions des enseignants à travers les exemples de la France et de la Turquie

    Yabancı dil öğretiminde kültürlerarası iletişim : Fransa ve Türkiye örneklerinde öğretmen görüşleri incelemesi

    GİZEM KÖŞKER

    Doktora

    Fransızca

    Fransızca

    2017

    Eğitim ve ÖğretimAnadolu Üniversitesi

    Yabancı Diller Eğitimi Ana Bilim Dalı

    PROF. DR. GÜLNİHAL GÜLMEZ

  3. Okul geliştirme yaklaşımları ve uygulama süreçlerinin değerlendirilmesi

    Evaluation of school improvement approaches and implementation processes

    SEYFETTİN ABDURREZZAK

    Doktora

    Türkçe

    Türkçe

    2021

    Eğitim ve Öğretimİnönü Üniversitesi

    Eğitim Bilimleri Ana Bilim Dalı

    PROF. DR. MEHMET ÜSTÜNER

  4. 1973-2017 yılları arasındaki 9. sınıf İngilizce öğretim programlarının incelenmesi

    Analyzing the 9th grade English curriculums between 1973 and 2017

    NUR GEL

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Eğitim ve ÖğretimDüzce Üniversitesi

    Eğitim Bilimleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ASLIHAN KUYUMCU VARDAR

  5. Theme supervised nonnegative matrix factorization for topic modeling

    Konu modelleme için tema denetimli negatif olmayan matris ayrıştırması

    BURAK SUYUNU

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. TUNGA GÜNGÖR