Geri Dön

Improving the performance of similarity joins using graphics processing unit

Benzerlik birleşimlerinin performansının grafik işleme birimi kullanılarak arttırılması

  1. Tez No: 317906
  2. Yazar: ZEYNEP KORKMAZ
  3. Danışmanlar: DOÇ. DR. HAKAN FERHATOSMANOĞLU, PROF. DR. CEVDET AYKANAT
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Mühendislik Bilimleri, Computer Engineering and Computer Science and Control, Engineering Sciences
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2012
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 74

Özet

Benzerlik birleşimi, veri madenciliğinin önemli işlemlerindendir ve çeşitli alanlardan birçok uygulamada kullanılmaktadır. Bir benzerlik birleşimi işleci bir ya da iki veri noktası kümesi alır ve veri uzayında birbirleri arasındaki uzaklık belirli bir eşik değeri, epsilon, arasında olan veri noktası ikililerini çıktı olarak verir. Baz alınan iç içe geçmiş döngü algoritması bütün veri nesneleri arası uzaklık hesabı yapar. İç içe geçmiş döngü algoritması için çok fazla sorgu zamanı tutan, büyük veri kümeleri dikkate alındığında, böyle bir operasyonu hızlandırmak daha da önemli olmaktadır. Günümüz grafik işlemcilerinin, genel amaçlı paralel hesaplama mimarisinin de (CUDA) katkısıyla, hesaplama kapasiteleri birçok araştırmaya ön ayak olmaktadır. Bu motivasyonla, iki tane Grafik İşleme Birimi (GİB) tabanlı benzerlik birleşimi algoritması önermekteyiz. İlk olarak, genel amaçlı GİB programlamanın avantajlarından faydalanmak için, GİB'in kendine özgü özelliklerine uygun olan, geliştirilmiş iç içe geçmiş döngü algoritması (GPU-INLJ) önermekteyiz. Ayrıca herhangi bir birleşim ikilisi kaybına yol açmadan, her bölümün birbirinden bağımsız olarak benzerlik birleşimini sağlamayı garanti eden, bölümleme tabanlı benzerlik birleşimi algoritması (KMEANS-JOIN) önerilmektedir. Deneylerimiz büyük performans kazancı ve algoritmamızın büyük veri kümelerine uygunluğunu göstermektedir.

Özet (Çeviri)

The similarity join is an important operation in data mining and it is used in many applications from varying domains. A similarity join operator takes one or two sets of data points and outputs pairs of points whose distances in the data space is within a certain threshold value, epsilon. The baseline nested loop approach computes the distances between all pairs of objects. When considering large set of objects which yield too long query time for nested loop paradigm, accelerating such operator becomes more important. The computing capability of recent GPUs with the help of a general purpose parallel computing architecture (CUDA) has attracted many researches. With this motivation, we propose two similarity join algorithms for Graphics Processing Unit (GPU). To exploit the advantages of general purpose GPU computing, we first propose an improved nested loop join algorithm (GPU-INLJ) for the specific environment of GPU. Also we present a partitioning-based join algorithm (KMEANS-JOIN) that guarantees each partition can be joined independently without missing any join pair. Our experiments demonstrate massive performance gains and the suitability of our algorithms for large datasets.

Benzer Tezler

  1. Metadata-based and peronalized WEB querying

    Metadataya dayalı ve kişiselleştirilmiş WEB sorgulaması

    SELMA AYŞE ÖZEL

    Doktora

    İngilizce

    İngilizce

    2004

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF.DR. ÖZGÜR ULUSOY

  2. Ayarlı sıvı sönümleyicilerin betonarme binaların deprem performansına etkisinin incelenmesi

    Investigation of the effect of tuned liquid dampers on earthquake performance of reinforced concrete buildings

    BİRKAN DAĞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    İnşaat Mühendisliğiİstanbul Teknik Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    PROF. DR. MUSTAFA GENÇOĞLU

    DR. ÖĞR. ÜYESİ MUZAFFER BÖREKÇİ

  3. Pasternak türü zemine oturan kirişlerin zeminden ayrılma probleminin SAP2000 yazılımı ile çözümü

    Solution of lift-off problem of beams on pasternak type subgrade by using SAP2000

    AHMET ÇAĞATAY TAHAOĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    İnşaat Mühendisliğiİstanbul Teknik Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    PROF. DR. ENGİN ORAKDÖĞEN

  4. Resilient design of CLT buildings against fire and earthquake

    Çok katlı CLT binaların yangın ve depreme karşı direnç esaslı tasarımı

    ÖMER ASIM ŞİŞMAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Deprem Mühendisliğiİstanbul Teknik Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖMER TUĞRUL TURAN

    PROF. DR. ARIO CECCOTTI

  5. Hizmet sektöründe toplam kalite yönetimi

    Başlık çevirisi yok

    HÜNKAR ŞERİF

    Yüksek Lisans

    Türkçe

    Türkçe

    1998

    İşletmeMarmara Üniversitesi

    Bankacılık Ana Bilim Dalı

    PROF. DR. İ. METE DOĞRUER