Metin ön işleme fazının makine öğrenmesinde sınıflandırmaya etkileri
Effects of text preprocessing phase on classification in machine learning
- Tez No: 885338
- Danışmanlar: DOÇ. DR. ÜLVİYE HACIZADE
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Haliç Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 78
Özet
Elektronik cihazların ulaşılabilirliği arttıkça veri üretmek de bir o kadar kolay hale gelmiştir. Dolayısıyla her alandan veri toplanmakta ve gün geçtikçe veri miktarı artmaktadır. Üretilen bu büyük verinin büyük oranını da metin verileri oluşturmaktadır. Verilerin anlamlı hale gelmesi için veri madenciliği alanında çalışmalar hızla devam etmektedir. Bu durum yapay zekâ çalışmalarında önemli yere sahip olan metin verisinin işlenmesi konusuna büyük önem kazandırmıştır. Bu çalışmada yapay zekâ çalışmalarının önemli bir alanı olan metin işleme konusunu kapsamaktadır. İstanbul Büyükşehir Belediyesi, Halkla İlişkiler Müdürlüğünün yönetiminde olan 153 Beyaz Masa çağrı merkezi vatandaşın talep, şikayet ve teşekkürlerini farklı kanallardan alır ve bu bilgileri uygulama üzerinden çağrı metni açarak ilgili birime çözüm sağlaması amacıyla yönlendirir. Halkla İlişkiler Müdürlüğü yaklaşık bin kişilik çağrı merkezi çalışanıyla, aylık ortalama 500.000 çağrıyı çözüme ulaştırmak için çalışmaktadır. Çalışmamızda bu veri kümesi kullanıldı. Metin veri kümesi bir dizi ön işleme adımlarından geçirildi, ardından klasik TF-IDF kelime vektör gösterim modeli ile vektörize edildi. Sonrasında makine öğrenme algoritmalarından Naive Bayes, Destek Vektör Makineleri, Karar Ağacı ve Rasgele Orman algoritmaları kullanarak etiketli verimiz ile sınıflandırma işlemi gerçekleştirildi. Metin ön işleme işlemelerinin otomatik sınıflandırma doğruluğuna etkisi incelendi ve bulgular paylaşıldı.
Özet (Çeviri)
As the availability of electronic devices increases, it has become easier to produce data. Therefore, data is collected from every field and the amount of data increases day by day. The majority of this big data produced consists of text data. Studies in the field of data mining continue rapidly to make the data meaningful. This situation has given great importance to the processing of text data, which has an important place in artificial intelligence studies. This study covers the subject of text processing, which is an important area of artificial intelligence studies. 153 White Desk call center, which is under the management of the Public Relations Directorate of Istanbul Metropolitan Municipality, receives citizens' requests, complaints and thanks from different channels and directs this information to the relevant unit to provide a solution by opening the call text through the application. The Public Relations Directorate works to resolve an average of 500,000 calls per month with its 800 call center employees. This dataset was used in our study. The text dataset was passed through a series of preprocessing steps, then vectorized with the classic TF-IDF word vector representation model. Afterwards, classification was performed with our labeled data using Naive Bayes, Support Vector Machines, Decision Tree, Random Forest, one of the machine learning algorithms. The effect of text preprocessing on automatic classification accuracy was examined.
Benzer Tezler
- Production and mechanical behavior of particulate reinforced aluminium matrix composites
Parçacık takviyeli alüminyum esaslı kompozitlerin üretimi ve mekanik davranışı
METİN YILMAZ
- Tekne konstrüksiyonunda kullanılabilecek ferrosement yapının mekanik davranışı ve en uygun malzeme bileşenlerinin belirlenmesi
Die Bestimmung der optimalen materialzusammensetzung und das mechanische verhalten des fur den bootsbau geeigneten ferrocements
HALUK KAYA
- Barter ticaret işlemleri ve muhasebeleştirilmesi
Başlık çevirisi yok
MUHAMMET SIRRI ŞİMŞEK
Yüksek Lisans
Türkçe
1997
İşletmeİstanbul ÜniversitesiYönetimde Muhasebe ve Finansal Kontrol Bilim Dalı
PROF. DR. AHMET GÖKSEL YÜCEL
- İnşaat sözleşmelerinde hak talebi yönetimi: Kamu projeleri için öneri model
Claim management in construction contracts: Proposed model for public construction projects
İSMAİL CENGİZ YILMAZ
Doktora
Türkçe
2013
Mimarlıkİstanbul Teknik ÜniversitesiMimarlık Ana Bilim Dalı
PROF. DR. HÜSEYİN ATİLLA DİKBAŞ
- Nikel esaslı süper alaşımlara kimyasal buhar biriktirme yöntemi ile alüminit tabaka kaplanması
Chemical vapor aluminizing of nickel base superalloys
AHMET ARDA İNCEYER
Yüksek Lisans
Türkçe
2021
Mühendislik BilimleriGebze Teknik ÜniversitesiMalzeme Bilimi ve Mühendisliği Ana Bilim Dalı
PROF. DR. METİN USTA
DOÇ. DR. HAVVA KAZDAL ZEYTİN