Olasılıksal sembolik motif tanıma
Probabilistic symbolic pattern recognition
- Tez No: 787358
- Danışmanlar: PROF. DR. EYLEM DENİZ HOWE
- Tez Türü: Doktora
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: Türkçe
- Üniversite: Mimar Sinan Güzel Sanatlar Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: İstatistik Bilim Dalı
- Sayfa Sayısı: 91
Özet
Yapay Zeka (YZ) hayatımızın her alanında yer bulmaya başlayan bir kavram olarak son yılların en popüler terimlerinden birisi haline gelmiştir. Özünde, insan beyninin kavrama ve yorumlama fonksiyonlarını yürütebilecek makinaların yaratılması olarak daha çok robotik alanı ile ilgilidir. Ancak, uygulamada, makine öğrenmesi ve derin öğrenme destekli istatistiksel karar verme yöntemlerinin bir uzantısı olarak biraz da yanlış bir şekilde bilimsel literatüre yerleşmiştir. Dolayısı ile, makine örenmesi temelli herhangi bir sınıflandırma ya da regresyon probleminin YZ olarak adlandırıldığı sayısız bilimsel çalışmaya rastlamak mümkündür. Bu çalışmada da YZ terimi, makina örenmesi, derin öğrenme ve istatistiksel modellemeyi kapsayan bir disiplini işaret edecek şekilde kullanılmıştır. Tıp bilimi, YZ'nın en yaygın kullanıldığı bir alan olarak öne çıkmaktadır. Bunda, biyomedikal mühendisliği ve bilgisayar teknolojilerindeki ilerlemeler ve makina öğrenmesi alanında ortaya atıla sayısız yeni algoritmaların katkısı büyüktür. Biyomedikal alandaki gelişmeler sayesinde insan fizyolojisini temsil eden daha fazla saha, yüksek frekans ve çözünürlükte ve daha uzun süreli veri üretmenin yolu açılmaktadır. Bu teknolojileri takiben oluşan daha yüksek hacimdeki verinin saklaması ve işlenmesi konusunda bilgisayar teknolojileri de sürekli gelişmektedir. Örneğin kan basıncını saniyede 2000 örnek (2000 Hz) alarak raporlayan bir yatak başı monitörü, tek bir hasta ve sadece kan basıncı için, sadece bir günde 172.600.000 veri üretmektedir. Dolayısı ile, son yirmi yılda, elektronik hasta kayıtlarında saklanabilen verini hacmi gigabayt seviyelerinden petabayt seviyelerine çıkmıştır. Buna rağmen, birçok hastanede, yatak başı monitörlerde üretilen veri saklanamamakta ver her 48 saate bir silinmektedir. Bu tür verilerin özetlenerek, temsili değişkenlerin saklandığı veri tabanları bir şekilde çözüm olabilmektedir. Hastanelerde üretilen yüksek hacimli verilerin depolanmasını dışında analizi de oldukça zorludur. Çünkü, elektronik hasta kayıtlarında derlenen veriler genellikle geleneksel parametrik istatistiksel yöntemlerin varsayımlarını sağlamayacak şekilde doğrusal ve normal olmayan, yüksek korelasyonlu, eksik ve yüksek oranda gürültü içeren türdendir. Bu tür verilerin analizlerinden doğan ihtiyacı karşılamak üzere son yıllarda makine öğrenmesi alanında birçok yeni algoritma geliştirilmiştir. Ancak, makine örenmesi algoritmaları, doğrudan ham veri ile çalışan derin öğrenme yöntemleri dışında, bu tür boylamsal verileri temsilen değişkenlerin çıkarılmasını gerektirir. Bu aşamada, sinyal işleme yöntemleri yüksek frekanslı boylamsal verilerden değişken çıkarılması için sıklıkla kullanılmaktadır ve bu alandaki literatürde hızla gelişmektedir. Yüksek frekanslı boylamsal verilerden temsili değişken çıkarılması için geliştirilmiş yeni algoritmalardan birisi, Olasılıksal Sembolik Motif Tanıma (OSMT) yöntemidir. OSMT yöntemi, boylamsal verilerin zaman içerisindeki değişimlerini olasılıksal modellerinin elde edilmesi ve bu olasılıksal modeller arasındaki uzaklıkların kullanılarak birden fazla serinin birbirlerine benzerliklerini karakterize eden değişkenler elde edilmesine dayanmaktadır. Bu çalışmanın amacı, OSMT yöntemini Türkçe literatüre kazandırmak ve kardiyovasküler hastalıkların tahmini üzerine uygulamasını göstermektir.
Özet (Çeviri)
Artificial Intelligence is the buzz word of the century and finding an application in almost everywhere in our life. Simply, the goal of AI is to create machines that can do what human does there it is more relevant to robotics. However, the term 'AI' is interchangeably used to refer machine and deep learning. As a result, there are numerous publications in the literature where AI is used for machine learning based predictive models. In this study, we have used AI referring to a domain including machine learning and statistical modeling. Medicine is one of the area of science where AI is most frequently used. This is partially because of the advancements in the biomedical and computer science as well as the methodological advancements in machine learning. Advancements in biomedical engineering technologies result in medical devices that can generate very large data representing human physiology at higher resolution and higher sampling frequency. For example, a bedside monitor measuring blood pressure at 2000Hz would generate 172,600,000 data points per patient, per day. Considering several other physiological data, several patients with years of data, the amount of data generated at a single hospital converges to petabytes. Yet, unfortunately, such rich data from bedside monitors typically purged every 48 hours in most institutions due to the challenges in streaming and storing such data. Thus, there are still need for more efficient ways of utilizing such rich data. Besides the challenges in storing large volumes of data in healthcare systems, it is also challenging to analyze such high volume data. This is because the data in electronic health records (EHR) are typically with high correlation and include large number of missing data as well as error. Further, there are several different types of the data modalities in EHR such as tabular format structured data, image data, text data, signal date, genomic data etc. explaining complex biological mechanism. It is very challenging to apply parametric statistical methods directly on such data. Recently, machine learning methods have emerged as an alternative solution to analyze data EHR data as nonlinear models with few assumptions about data. However, classical machine learning models, except the deep learning models typically allowing working with raw data, require extracting features representing the raw unstructured data such as signal, image, or text. These features are then used as predictors in machine learning models. When processing raw streaming physiologic data, signal processing algorithms are frequently used to extract features. Commonly used such methods are Fourier Transformation, Sample Entropy, Wavelet Transformation. On the other hand, despite deep learning models such as convolutional neural networks, directly can be used to predict or classify an outcome, they are also used as a way of extracting features. In this study, we introduce a novel signal processing method, Probabilistic Symbolic Pattern Recognition (PSPR), to analyze longitudinal data points. We propose PSPR as a way of analysis of any kind of longitudinal or time series data where the data points does not need to be numerical as long as they are of a member of a finite set. The numerical series and time series, in this definition, are a subset of the domains that PSPR can be implemented. We designed PSPR to learn pattern transition behavior of given symbolic series to predict the future behavior or to compare the behavior of multiple series to carry out clustering and classification tasks. We specifically aimed to implement PSPR method on electrocardiogram (ECG) data to classify and predict risk for cardiovascular diseases. This study introduces PSPR methods and showed its efficiency in extracting features from ECG data. PSPR can be implemented and tested on analysis of any kind of symbolic series beyond medicine.
Benzer Tezler
- Person name recognition in Turkish financial texts by using local grammar approach
Türçe finans metinlerinde yerel dilbilgisi yaklaşımı kullanarak kişi ismi tanıma
ÖZKAN BAYRAKTAR
Yüksek Lisans
İngilizce
2007
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilişim Sistemleri Ana Bilim Dalı
DR. TUĞBA TAŞKAYA TEMİZEL
PROF. DR. NAZİFE BAYKAL
- Resimli hikâye kitaplarının akıl yürütme becerileri yönünden incelenmesi ve çocukların kitap okuma sürecindeki akıl yürütmeye ilişkin ifadeleri
Examination of picture story books used in pre-school education institutions in terms of reasoning skills and revealing children's expressions of reasonings in book
ZEKİYE AYBÜKE EFE
Yüksek Lisans
Türkçe
2023
Eğitim ve ÖğretimAydın Adnan Menderes ÜniversitesiTemel Eğitim Ana Bilim Dalı
DR. ÖĞR. ÜYESİ NİSA BAŞARA BAYDİLEK
- Isolation of action execution failures for cognitive robots
Bilişsel robotlar için eylem yürütme hatalarının tanısı
DOĞAN ALTAN
Yüksek Lisans
İngilizce
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. SANEM SARIEL TALAY
- Multimodal sensing for manipulation failure detection
Etkileşim hatası sezme için çok kipli algılama
ARDA İNCEOĞLU
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. SANEM SARIEL
- Analyzing symbolic violence phenomenon in schools
Okullarda sembolik şiddet olgusunun çözümlenmesi
TUĞBA KONAL MEMİŞ
Yüksek Lisans
İngilizce
2023
Eğitim ve ÖğretimYıldız Teknik ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
DOÇ. DR. MİTHAT KORUMAZ