Metadata mining using similarity matrixes for improved knowledge data discovery
Benzerlik matrislerini kullanarak, veri yapısı araştırma ve daha gelişmiş bilgi verisi keşfetme
- Tez No: 126578
- Danışmanlar: DR. MELİH KIRLIDAĞ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2002
- Dil: İngilizce
- Üniversite: Marmara Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 75
Özet
ÖZET METADATA MINING USING SIMILARITY MATRIXES FOR IMPROVED KNOWLEDGE DATA DISCOVERY Bugünü ortamında, bir çok şirket kendi iç işlerinde, mümkün olan her alanda bilgisayar temelli sistemleri kullanmaya çalışıyorlar. Bu da bir çok değişik uygulamada, sistemde ve de donanımda biriken dijital veriye ve bilgiye sebep oluyor. Yine bugünün iş dünyasında rekabet avantajını yaratmak ve koruyabilmek neredeyse her şey. Bu tip işletmelere yaratılabilecek en büyük kaynak ve fayda bu biriken kritik, kesin ve zamanı belirli veriden, rekabet avantajına dönebilecek istihbarat sağlamak olacaktır. Bu sebeptendir ki bir çok işletme kendi içlerinde bu verileri incelemek ve birleştirmek için departmanlar kurmaktadır. İlk amaç bu dağınık ve kpouk veri kaynaklarını tek bir parça haline toplamaktır ki buna“Data Warehouse”denilmektedir. İkinci amaç ise bu oluşan tek parça veri grubunu şirketin avantajı olabilecek yararlı kalıplan bulabilmek amacı ile incelemektir ki buna da“Data Mining”denilmektedir. Tezde bu dağınık verilerin tek bir veri tabanında birleştirilmesi için sorumlu olan kişilerin, değişik veri kaynaklarının iç detaylarım bilememe durumunda bu işi otomatik olarak yapacak bir metot geliştirdik. Algoritmamız değişik veri kaynaklarını tarayarak araştırarak ve de karşılaştırarak eğer varsa aralarındaki benzerlikleri bulmaktadır. Ayrıca eğer karşılıklı tablolarda aynı elemanlar varsa bunları birleştirme öncesi uyarmaktadır. Bu işlemleri gerçekleştirmek için bir yazı benzerlik algoritması ve de benzerlikleri notlandırdığımız ve karşılıklı kıyaslamalar yaptığımız matrisleri kullandık. Sonuç olarak deneylerimizi yaptığımız örnek verilerimiz ile başarılı sonuçlar aldık. Şubat 2002 öymen Gür
Özet (Çeviri)
ABSTRACT METADATA MINING USING SIMILARITY MATRIXES FOR IMPROVED KNOWLEDGE DATA DISCOVERY In today's environment, many corporations are currently using computer- based systems in nearly all of their process, where it is applicable. This results in digital information, which is collected and formed in different systems, applications and hardware. Creating and holding a competitive advantage is what it is all about in today's business world. There is no more valuable resource to a business than intelligence. Critical, accurate and timely information can be directly converted into competitive advantage. Many business are trying to build IT departments in order to gather and merge these different data sources into one single entity that is called data warehouse and using skills and techniques, called data niining, to analyze the this new whole database to find some patterns mat will help to realize valuable advantages for the company in the market. In the thesis, we developed a automated way to merge the different data sources into one single database structure in order to help the data warehouse analyst, which do not know the details of the different applications inside a organization. Our algorithm scans, searches, compares two or more data sources with each other, and finds out the link in-between them, if there is any relation between them. In addition, it checks if there are same entities in the opposing tables. We used similarity matrixes and a text similarity algorithm to compare the remote data sources. As a result, we had successful results from our case study using our own algorithm. February 2002 Öymen GÜR
Benzer Tezler
- Trigram özellik veri seti kullanılarak sınıflandırma yöntemleriyle dil tanıma
Language identification with classification methods using trigram feature data set
ŞENGÜL BAYRAK
Yüksek Lisans
Türkçe
2011
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHaliç ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. HİDAYET TAKÇI
PROF. DR. MÜBARİZ EMİNLİ
- Sosyal medya lokasyon analizi
Social media location analysis
YAHYA ALALI
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. NİLÜFER YURTAY
- Yetişkinlerin hayat boyu öğrenmeye katılımlarının veri madenciliği teknikleri kullanılarak incelenmesi
Investigation of adults' participation in lifelong learning by using data mining techniques
CANAN PAKSOY
Yüksek Lisans
Türkçe
2022
Eğitim ve ÖğretimBartın ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SEMA SULAK GÜZEY
- Hastane bilgi yönetim sistem verilerine veri madenciliği ile işlerlik kazandırılması için bir adım : K-ortalama algoritmasında uygun parametre seçimi
A step towards the functionality of hospital information managment system data using data mining techniqees : Selection of appropriate parameters for K- means
MERYEM YILDIZLI
Doktora
Türkçe
2018
BiyoistatistikÇukurova ÜniversitesiBiyoistatistik Ana Bilim Dalı
PROF. DR. ZELİHA NAZAN ALPARSLAN
- Spatiotemporal data mining for situation awareness in microblogs
Mikrobloglarda durum farkındalığı için lokasyon ve zaman tabanlı veri madenciliği
ÖZER ÖZDİKİŞ
Doktora
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. PINAR KARAGÖZ
PROF. DR. MEHMET HALİT SEYFULLAH OĞUZTÜZÜN