Geri Dön

İnternet tabanlı Türkçe metinler için otomatik özetleme tekniği

Automatic summary technique for internet based Turkish texts

  1. Tez No: 611878
  2. Yazar: CEM ÖZKAN
  3. Danışmanlar: DR. ÖĞR. ÜYESİ VOLKAN TUNALI
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: Türkçe
  9. Üniversite: Maltepe Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 62

Özet

Günümüzde internet ve sosyal medya kullanımı giderek daha da yaygınlaşmaktadır. Dolayısıyla üretilen Türkçe içerik de doğru orantılı olarak artmakta ve Türkçe veri madenciliği alanında çalışmalar yapılmasını bir gereklilik haline getirmektedir. Türkçe metinleri işlerken sağlıklı bir sonuç elde edebilmek için kelime kelime çözümleme yapılması gerekmektedir. Bu oldukça zahmetli bir süreçtir, çünkü sondan eklemeli bir dil olan Türkçedeki kelimeleri işleyebilmek için önce etimolojik ve/veya morfolojik bir ayıklama yapmak, kelimeleri köklerine, eklerine ayrımak ve ardından işleme tabii tutmak gerekmektedir. Bu tez çalışmasında, Türkçe metinleri ayıklama (extraction) yöntemi ile özetlemek için farklı bir yaklaşım önerilmiş, Türkçe kelimeleri işlerken kök ve ek ayıklaması yapmak yerine, kelimeleri harf harf karşılaştırarak, uyuşan harfler ve bu harflerin kelime içindeki konumlarına göre sağlıklı bir sonuca ulaşılmaya çalışılmıştır. Çalışma sonucunda elde edilen çıktılar, sağlama yapabilmek amacıyla gerçek bir insan tarafından çıkarılan özetlerle karşılaştırılmış ve buna göre bir değerlendirmede bulunulmuştur.

Özet (Çeviri)

Today, the use of internet and social media is becoming more and more widespread. Therefore, the Turkish content produced increases in direct proportion and makes it necessary to carry out studies in the field of Turkish data mining. In order to obtain a healthy result when processing Turkish texts, word to word analysis is required. This is a very troublesome process because in order to be able to process the words in Turkish, which is a suffix language, it is necessary to make an etymological and/or morphological sorting, to separate the words to their roots and suffixes and then to process them. In this thesis, a different approach is tried to summarize the Turkish texts by extraction method. Instead of making root and suffix extraction while processing Turkish words, it is tried to reach a healthy result according to the matching letters and their positions in the word by comparing them letter by letter. The results obtained from the study are compared with the abstracts prepared by a real person in order to provide checks and an evaluation is made accordingly.

Benzer Tezler

  1. Türkçe metinlerde duygu analizi

    Sentiment analysis in Turkish texts

    CUMALİ TÜRKMENOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ

  2. Türkçe sözcük anlam belirsizliği giderme

    Word sense disambiguation for Turkish

    BAHAR İLGEN

    Doktora

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. EŞREF ADALI

    YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ

  3. Videolarda geçen konuşmaların metne dönüştürülmesi ve zaman tabanlı indekslenmesi amacıyla bir uygulama geliştirilmesi

    Developing an application for converting the conversations in videos into text and time-based indexing

    OĞUZHAN MERT KİRAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Mühendislik BilimleriKonya Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MUSTAFA SERVET KIRAN

  4. Event extraction from Turkish Trade Registry Gazette

    Türkiye Ticaret Sicili Gazetesi'nden olay çıkarımı

    İREM NUR DEMİRTAŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. GÜLŞEN ERYİĞİT

  5. Multi-view short-text classification using knowledge bases

    Bilgi tabanı kullanarak çok görüntülü kısa metin sınıflandırma

    MERT ÇALIŞAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. CEMAL OKAN ŞAKAR