Data compression and reconstruction in process engineering applications
Proses mühendisliği uygulamalı veri sıkıştırma ve yeniden oluşturma
- Tez No: 325595
- Danışmanlar: PROF. DR. UĞUR AKMAN
- Tez Türü: Yüksek Lisans
- Konular: Kimya Mühendisliği, Chemical Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2012
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Kimya Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 256
Özet
Sensor teknolojisindeki son gelişmeler sayesinde büyük miktarlarda proses verisi toplanabilmektedir. Fakat bu durum, veri arşivlemeyi kolaylaştırmak için yapılan veri sıkıştırma işlemine duyulan ihtiyacı arttırmıştır. Bunun sonucu olarak, verilerin daha az yer kaplaması ve veri toplayan ve işleyen düğümler arasındaki iletimi hızlandırmak için proses izleme, sistem tanımlama ve hata saptama gibi birçok alanda proses verisi sıkıştırma ve bu veriyi yeniden oluşturma teknikleri önem kazanmıştır. Bu tez çalışmasının ana amacı, orijinal veri setlerinin temel özelliklerini koruyarak yüksek derecelerde sıkıştırma oranları elde edebilmek ve bunun yanında gürültülü verilerden kurtulabilmektir. Bu amaçla, süzgeçleme işlemindeki eşik seviyesi ayarlanarak parçalı kümelemeyle yaklaşımlama, bir ve iki boyutlu ayrık kosinüs dönüşümü ve bir ve iki boyutlu ayrık dalgacık dönüşümü tekniklerinin verimlilikleri değerlendirilmiştir. Bu çalışmada, birbirinden farklı özellikleri olan PortSimHigh, PortSimLow, SELDI-TOF MS ve TEP veri setleri kullanılmıştır. Bahsi geçen sıkıştırma teknikleri, değişik eşik seviyeleri kullanılarak sıkıştırma oranı, yeniden oluşturma hata normu, % göreli global hata ve % göreli maksimum hata değerleri baz alınarak karşılaştırılmıştır. Ayrık kosinüs ve dalgacık dönüşümü metotları ile %90'dan küçük eşik seviyeleri kullanıldığında yüksek sıkıştırma oranlarının elde edilemediği fakat yüksek eşik seviyelerinde daha iyi sıkıştırma oranları karşılığında veriyi yeniden oluşturma kalitesinin kötüleştiği sonucuna varılmıştır. Ayrıca, sıkıştırma tekniklerinin verimliliğinin büyük oranla kullanılan veri setlerinin özelliklerine bağlı olduğu anlaşılmıştır. Ayrık kosinüs dönüşümü metodu rastgele eğilimleri olan düzgün veri setleri için tercih edilirken, ayrık dalgacık dönüşümü metodu çok fazla tepe noktası olan gürültülü veri setleri için daha uygundur. Üstelik, kolonları arasında ilişiği olan çok değişkenli veri setleri için iki boyutlu ayrık kosinüs ve dalgacık dönüşümü metotlarını kullanmak daha kazanımlıdır.
Özet (Çeviri)
Recent improvements in sensor technology have resulted in huge amount of measured process data along with the increasing need for compression prior to storage. Hence, efficient process data compression and reconstruction techniques gain importance in various tasks such as process monitoring, system identification, and fault detection to save storage space and facilitate data transmission between a data collecting node and a data processing node. Main purpose of this thesis work is to be able to achieve the highest degree of compression and de-noising while preserving the key features of the original data upon retrieval and decompression. With this aim, the employed are the most appropriate dimensionality reduction technique among Piecewise Aggregate Approximation (PAA), One Dimensional and Two Dimensional Discrete Cosine Transform (1D-DCT and 2D-DCT) and One Dimensional and Two Dimensional Discrete Wavelet Transform (1D-DWT and 2D-DWT) by adjusting the threshold parameter in filtering. The data sets used are PortSimHigh, PortSimLow, SELDI-TOF MS and TEP. These techniques are evaluated in terms of compression ratio, reconstruction error norm, % relative global error and % relative maximum error for different ?-% thresholding levels. It is concluded that high compression levels cannot be generated with thresholding percentile values less than 90% in both DCT and DWT methods whereas the quality of reconstruction deteriorates at higher threshold levels in return for better compression. Furthermore, it is revealed that the efficacy of the compression methods strongly depends on the data characteristics. DCT is suitable for smooth data sets with random trends whereas DWT is preferred for the noisy data sets with high peak content. 2D-DCT and 2D-DWT are favored for the multivariable data sets with highly correlated columns.
Benzer Tezler
- Sayısal görüntülerin alt band kodlanması
Subband coding of digital images
SIDIK DÜNDAR
Yüksek Lisans
Türkçe
1995
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiY.DOÇ.DR. M. ERTUĞRUL ÇELEBİ
- Alt band ayrıştırmasıyla görüntü kodlama
Başlık çevirisi yok
BURÇİN AÇAN
Yüksek Lisans
Türkçe
1998
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DOÇ. DR. MELİH PAZARCI
- Zaman-frekans analizinde yeni dönüşümler ve uygulama alanları
New transforms in time-frequency analysis and their applications
YAZGAN ERER
Yüksek Lisans
Türkçe
1993
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiPROF.DR. AHMET H. KAYRAN
- Markov ve Gibbs rastlantı alan modelleri ile doku sentezleme ve sınıflandırma
Texture synthesis and classification using Markov and Gibbs random field models
ERDOĞAN CAMCIOĞLU
Yüksek Lisans
Türkçe
1990
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiPROF. DR. ERDAL PANAYIRCI
- Rastgele markov alanları ve hücresel sinir ağları ile görüntü işleme
Image processing with markow random fields and cellular neural networks
MAHMUT ŞAMİL SAĞIROĞLU
Yüksek Lisans
Türkçe
2001
Elektrik ve Elektronik Mühendisliğiİstanbul ÜniversitesiElektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. OSMAN NURİ UÇAN