Geri Dön

Metin ön işleme fazının makine öğrenmesinde sınıflandırmaya etkileri

Effects of text preprocessing phase on classification in machine learning

  1. Tez No: 885338
  2. Yazar: ESME GÜL TOPRAK
  3. Danışmanlar: DOÇ. DR. ÜLVİYE HACIZADE
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Haliç Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 78

Özet

Elektronik cihazların ulaşılabilirliği arttıkça veri üretmek de bir o kadar kolay hale gelmiştir. Dolayısıyla her alandan veri toplanmakta ve gün geçtikçe veri miktarı artmaktadır. Üretilen bu büyük verinin büyük oranını da metin verileri oluşturmaktadır. Verilerin anlamlı hale gelmesi için veri madenciliği alanında çalışmalar hızla devam etmektedir. Bu durum yapay zekâ çalışmalarında önemli yere sahip olan metin verisinin işlenmesi konusuna büyük önem kazandırmıştır. Bu çalışmada yapay zekâ çalışmalarının önemli bir alanı olan metin işleme konusunu kapsamaktadır. İstanbul Büyükşehir Belediyesi, Halkla İlişkiler Müdürlüğünün yönetiminde olan 153 Beyaz Masa çağrı merkezi vatandaşın talep, şikayet ve teşekkürlerini farklı kanallardan alır ve bu bilgileri uygulama üzerinden çağrı metni açarak ilgili birime çözüm sağlaması amacıyla yönlendirir. Halkla İlişkiler Müdürlüğü yaklaşık bin kişilik çağrı merkezi çalışanıyla, aylık ortalama 500.000 çağrıyı çözüme ulaştırmak için çalışmaktadır. Çalışmamızda bu veri kümesi kullanıldı. Metin veri kümesi bir dizi ön işleme adımlarından geçirildi, ardından klasik TF-IDF kelime vektör gösterim modeli ile vektörize edildi. Sonrasında makine öğrenme algoritmalarından Naive Bayes, Destek Vektör Makineleri, Karar Ağacı ve Rasgele Orman algoritmaları kullanarak etiketli verimiz ile sınıflandırma işlemi gerçekleştirildi. Metin ön işleme işlemelerinin otomatik sınıflandırma doğruluğuna etkisi incelendi ve bulgular paylaşıldı.

Özet (Çeviri)

As the availability of electronic devices increases, it has become easier to produce data. Therefore, data is collected from every field and the amount of data increases day by day. The majority of this big data produced consists of text data. Studies in the field of data mining continue rapidly to make the data meaningful. This situation has given great importance to the processing of text data, which has an important place in artificial intelligence studies. This study covers the subject of text processing, which is an important area of artificial intelligence studies. 153 White Desk call center, which is under the management of the Public Relations Directorate of Istanbul Metropolitan Municipality, receives citizens' requests, complaints and thanks from different channels and directs this information to the relevant unit to provide a solution by opening the call text through the application. The Public Relations Directorate works to resolve an average of 500,000 calls per month with its 800 call center employees. This dataset was used in our study. The text dataset was passed through a series of preprocessing steps, then vectorized with the classic TF-IDF word vector representation model. Afterwards, classification was performed with our labeled data using Naive Bayes, Support Vector Machines, Decision Tree, Random Forest, one of the machine learning algorithms. The effect of text preprocessing on automatic classification accuracy was examined.

Benzer Tezler

  1. Production and mechanical behavior of particulate reinforced aluminium matrix composites

    Parçacık takviyeli alüminyum esaslı kompozitlerin üretimi ve mekanik davranışı

    METİN YILMAZ

    Doktora

    İngilizce

    İngilizce

    1997

    Makine MühendisliğiBoğaziçi Üniversitesi

    PROF. DR. SABRİ ALTINTAŞ

  2. Tekne konstrüksiyonunda kullanılabilecek ferrosement yapının mekanik davranışı ve en uygun malzeme bileşenlerinin belirlenmesi

    Die Bestimmung der optimalen materialzusammensetzung und das mechanische verhalten des fur den bootsbau geeigneten ferrocements

    HALUK KAYA

    Doktora

    Türkçe

    Türkçe

    1986

    Gemi Mühendisliğiİstanbul Teknik Üniversitesi

    PROF. DR. TEOMAN ÖZALP

  3. Barter ticaret işlemleri ve muhasebeleştirilmesi

    Başlık çevirisi yok

    MUHAMMET SIRRI ŞİMŞEK

    Yüksek Lisans

    Türkçe

    Türkçe

    1997

    İşletmeİstanbul Üniversitesi

    Yönetimde Muhasebe ve Finansal Kontrol Bilim Dalı

    PROF. DR. AHMET GÖKSEL YÜCEL

  4. İnşaat sözleşmelerinde hak talebi yönetimi: Kamu projeleri için öneri model

    Claim management in construction contracts: Proposed model for public construction projects

    İSMAİL CENGİZ YILMAZ

    Doktora

    Türkçe

    Türkçe

    2013

    Mimarlıkİstanbul Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    PROF. DR. HÜSEYİN ATİLLA DİKBAŞ

  5. Nikel esaslı süper alaşımlara kimyasal buhar biriktirme yöntemi ile alüminit tabaka kaplanması

    Chemical vapor aluminizing of nickel base superalloys

    AHMET ARDA İNCEYER

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Mühendislik BilimleriGebze Teknik Üniversitesi

    Malzeme Bilimi ve Mühendisliği Ana Bilim Dalı

    PROF. DR. METİN USTA

    DOÇ. DR. HAVVA KAZDAL ZEYTİN