Data mining on text data and related applications
Metin verileri üzerinde veri madenciliği ve uygulamaları
- Tez No: 306860
- Danışmanlar: PROF. DR. EFENDİ NASİBOĞLU
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2011
- Dil: İngilizce
- Üniversite: Dokuz Eylül Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Bölümü
- Bilim Dalı: İstatistik Ana Bilim Dalı
- Sayfa Sayısı: 136
Özet
Çok büyük miktarda depolanmış metinsel veri vardır ve hızlı bir şekilde büyüyerek veritabanı, veri ambarı gibi depolama araçlarına depolanmaya devam edilmektedir. Bu nedenle, ihtiyaç duyulan bilgiye ulaşmak yavaş ve zor bir hal almaktadır. Bu durumdan dolayı, kullanıcılar güçlü bir analiz aracına ihtiyaç duymuştur. Veri madenciliğinin bir dalı olan metin madenciliği, bu problemi ele almak için geliştirilmiş ve hızla geliştirilmekte olan bir araçtır.Metin madenciliği ?Doğal Dil İşleme, Bilgi Çıkarımı, İstatistik ve Veri Madenciliği? olan alanların birleşiminden oluşmuştur. Bu çalışmada, sözü geçen alanlar detaylı bir şekilde açıklanmış ve bu alanların hangi kısımlarının metin madenciliğinde kullanıldığından bahsedilmiştir.Metin madenciliği alanının kullanıldığı birçok uygulama mevcuttur. Bu tezde, uygulamalar yüzeysel olarak bahsedilmiş fakat otomatik metin özetleme detaya inilmiştir. Metin madenciliği alanında en çok kullanılan uygulamalardan birisi otomatik metin özetlemedir. İhtiyaç duyulan bilgi hızlı bir şekilde ulaşılmalıdır fakat bilgiye ulaşıldıktan sonra, kullanıcı ilgilenilen bilgi için tüm dokümanı okumalıdır. Otomatik metin özetleme görevi bu problemi ele alır ve kullanıcılara zaman kısıtı için özet oluşturur.Bu çalışmada otomatik metin özetleme görevi detaylı bir şekilde anlatılmış ve birkaç algoritmadan bahsedilmiştir. Son olarak bu algoritmalardan biri kullanılarak bir program kodlanmış ve on Türkçe haber metninin özeti çıkarılarak analiz edilmiştir.
Özet (Çeviri)
There is extremely large amount of textual information stored and fast growingly continued to be stored into many storage tools such as database and data warehouse. Thus, reaching needed information is getting slow and hard. Because of this situation, a robust analyzing tool is needed to users. Text mining, which is a branch of data mining, is developed and is still fastly developing tool to handle this problem.Text mining is multidisciplinary that those are ?Natural Language Processing, Information retrieval, Statistics and Data Mining?. In this study, those areas are defined in detail and what parts of those areas are used in text mining.There are many applications that text mining tool is used. In this thesis those are mentioned slightly but automatic text summarization. One of the most used applications in text mining area is automatic text summarization. Needed information has to be reached fastly but after information reached, user must read whole document for interested information. Automatic text summarization task handles this problem and generates a summary of documents to users for time consuming.In this study automatic text summarization task is explained in details and a couple of algorithms are mentioned. Finally, a software coded by using one of those algorithms and then ten Turkish news articles are summarized analyzed by the software.
Benzer Tezler
- Dinamik sosyal ağlarda akan ve çok boyutlu veri üzerinden analiz ve tahmin yapılması
Analysis and prediction in sparse and high dimensional data with using dynamic social networks
ONUR CAN SERT
Doktora
Türkçe
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTOBB Ekonomi ve Teknoloji ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. TANSEL ÖZYER
- Mining metabolic networks and biomedical literature
Başlık çevirisi yok
ALİ ÇAKMAK
Doktora
İngilizce
2009
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolCase Western Reserve UniversityDR. GÜLTEKİN ÖZSOYOĞLU
- Bir otomotiv firmasında konu modelleme yaklaşımı kullanılarak çalışan önerilerinin değerlendirilmesi
Evaluation of employee suggestions by using topic modeling approach in an automotive company
MİNE BOZAN
Yüksek Lisans
Türkçe
2022
Endüstri ve Endüstri MühendisliğiBursa Teknik ÜniversitesiAkıllı Sistemler Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ KORAY ALTUN
- Müzik üst-veri tahmini için türkçe şarkı sözü madenciliği
Turkish lyrics mining for music meta-data estimation
BAŞAR KIRMACI
Yüksek Lisans
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBaşkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. HASAN OĞUL
- Türk hukukunda makine öğrenmesine dayalı yapay zekada verinin hukuka uygun şekilde kullanılması
Lawful use of data in machine learning-based artificial intelligence under the Turkish law
OSMAN GAZİ GÜÇLÜTÜRK
Doktora
Türkçe
2021
HukukGalatasaray ÜniversitesiÖzel Hukuk Ana Bilim Dalı
DOÇ. DR. FÜLÜRYA YUSUFOĞLU BİLGİN