Improving the performance of similarity joins using graphics processing unit
Benzerlik birleşimlerinin performansının grafik işleme birimi kullanılarak arttırılması
- Tez No: 317906
- Danışmanlar: DOÇ. DR. HAKAN FERHATOSMANOĞLU, PROF. DR. CEVDET AYKANAT
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Mühendislik Bilimleri, Computer Engineering and Computer Science and Control, Engineering Sciences
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2012
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 74
Özet
Benzerlik birleşimi, veri madenciliğinin önemli işlemlerindendir ve çeşitli alanlardan birçok uygulamada kullanılmaktadır. Bir benzerlik birleşimi işleci bir ya da iki veri noktası kümesi alır ve veri uzayında birbirleri arasındaki uzaklık belirli bir eşik değeri, epsilon, arasında olan veri noktası ikililerini çıktı olarak verir. Baz alınan iç içe geçmiş döngü algoritması bütün veri nesneleri arası uzaklık hesabı yapar. İç içe geçmiş döngü algoritması için çok fazla sorgu zamanı tutan, büyük veri kümeleri dikkate alındığında, böyle bir operasyonu hızlandırmak daha da önemli olmaktadır. Günümüz grafik işlemcilerinin, genel amaçlı paralel hesaplama mimarisinin de (CUDA) katkısıyla, hesaplama kapasiteleri birçok araştırmaya ön ayak olmaktadır. Bu motivasyonla, iki tane Grafik İşleme Birimi (GİB) tabanlı benzerlik birleşimi algoritması önermekteyiz. İlk olarak, genel amaçlı GİB programlamanın avantajlarından faydalanmak için, GİB'in kendine özgü özelliklerine uygun olan, geliştirilmiş iç içe geçmiş döngü algoritması (GPU-INLJ) önermekteyiz. Ayrıca herhangi bir birleşim ikilisi kaybına yol açmadan, her bölümün birbirinden bağımsız olarak benzerlik birleşimini sağlamayı garanti eden, bölümleme tabanlı benzerlik birleşimi algoritması (KMEANS-JOIN) önerilmektedir. Deneylerimiz büyük performans kazancı ve algoritmamızın büyük veri kümelerine uygunluğunu göstermektedir.
Özet (Çeviri)
The similarity join is an important operation in data mining and it is used in many applications from varying domains. A similarity join operator takes one or two sets of data points and outputs pairs of points whose distances in the data space is within a certain threshold value, epsilon. The baseline nested loop approach computes the distances between all pairs of objects. When considering large set of objects which yield too long query time for nested loop paradigm, accelerating such operator becomes more important. The computing capability of recent GPUs with the help of a general purpose parallel computing architecture (CUDA) has attracted many researches. With this motivation, we propose two similarity join algorithms for Graphics Processing Unit (GPU). To exploit the advantages of general purpose GPU computing, we first propose an improved nested loop join algorithm (GPU-INLJ) for the specific environment of GPU. Also we present a partitioning-based join algorithm (KMEANS-JOIN) that guarantees each partition can be joined independently without missing any join pair. Our experiments demonstrate massive performance gains and the suitability of our algorithms for large datasets.
Benzer Tezler
- Metadata-based and peronalized WEB querying
Metadataya dayalı ve kişiselleştirilmiş WEB sorgulaması
SELMA AYŞE ÖZEL
Doktora
İngilizce
2004
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF.DR. ÖZGÜR ULUSOY
- Ayarlı sıvı sönümleyicilerin betonarme binaların deprem performansına etkisinin incelenmesi
Investigation of the effect of tuned liquid dampers on earthquake performance of reinforced concrete buildings
BİRKAN DAĞ
Yüksek Lisans
Türkçe
2022
İnşaat Mühendisliğiİstanbul Teknik Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
PROF. DR. MUSTAFA GENÇOĞLU
DR. ÖĞR. ÜYESİ MUZAFFER BÖREKÇİ
- Pasternak türü zemine oturan kirişlerin zeminden ayrılma probleminin SAP2000 yazılımı ile çözümü
Solution of lift-off problem of beams on pasternak type subgrade by using SAP2000
AHMET ÇAĞATAY TAHAOĞLU
Yüksek Lisans
Türkçe
2017
İnşaat Mühendisliğiİstanbul Teknik Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
PROF. DR. ENGİN ORAKDÖĞEN
- Resilient design of CLT buildings against fire and earthquake
Çok katlı CLT binaların yangın ve depreme karşı direnç esaslı tasarımı
ÖMER ASIM ŞİŞMAN
Yüksek Lisans
İngilizce
2022
Deprem Mühendisliğiİstanbul Teknik Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÖMER TUĞRUL TURAN
PROF. DR. ARIO CECCOTTI
- Hizmet sektöründe toplam kalite yönetimi
Başlık çevirisi yok
HÜNKAR ŞERİF
Yüksek Lisans
Türkçe
1998
İşletmeMarmara ÜniversitesiBankacılık Ana Bilim Dalı
PROF. DR. İ. METE DOĞRUER