Protein/amino asit dizilimlerinin yapay zeka ile değerlendirilmesinde yeni yaklaşımların geliştirilmesi
Development of new approaches to evaluate protein/amino acid sequences with artificial intelligence
- Tez No: 734683
- Danışmanlar: PROF. DR. İBRAHİM TÜRKOĞLU
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Biyoistatistik, Computer Engineering and Computer Science and Control, Biostatistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: Türkçe
- Üniversite: Fırat Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Yazılım Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Yazılım Mühendisliği Bilim Dalı
- Sayfa Sayısı: 168
Özet
Biyoenformatik alanında protein veya amino asit üzerine gerçekleştirilen çalışmalar ve araştırmalar, proteinlerin yapılarının anlaşılabilmesi ve proteinlerin hücresel aktivitelerdeki rollerinin belirlenmesi açısından büyük bir önem arz etmektedir. Yapılan araştırmalar incelendiğinde, protein fonksiyonlarının belirlenmesi, proteinler arasındaki etkileşimlerin tahmin edilmesi, protein ikincil yapılarının bulunması, protein ailelerinin sınıflandırılması, kodlayan ve kodlamayan mRNA'ların belirlenmesi, viral-konak etkileşimlerinin tahmin edilmesi ve ilaç-hedef etkileşimlerinin tespit edilmesi ile ilgili çalışmaların aktif bir şekilde yürütüldüğü gözlemlenmiştir. Tez çalışmasında, söz konusu araştırma alanlarına yönelik yapay zeka tabanlı yeni analiz yaklaşımları geliştirilmiştir. Bu çerçevede, protein dizilimlerini sayısallaştırmak için algoritmik-tabanlı yeni bir kategorisel yaklaşım geliştirilmiştir. Algoritmik-tabanlı yaklaşım kapsamında, üç farklı protein sayısallaştırma yöntemi önerilmiştir. Bu doğrultuda, önerilen protein dizilimlerini sayısallaştırma yöntemleri: • Protein dizilimlerini sayısallaştırmak için AVL ağacı tabanlı protein sayısallaştırma yöntemi önerilmiş ve bu yöntemin başarımı COVID-19 hastalığına neden olan SARS-CoV-2 virüsünün proteinleri arasındaki etkileşimleri üzerinde test edilmiştir. Bu yöntem, içeriğinde bulunan ikili arama ağaç yapısı nedeniyle algoritmik-tabanlı kategoride değerlendirilmiştir. • Entropi hesaplamasına dayanan protein sayısallaştırma yöntemi önerilmiş ve viral genomlar üzerindeki protein-protein etkileşimlerini belirlemek için kullanılmıştır. Bu yöntemde ise Shannon entropisi kullanılması nedeniyle algoritmik-tabanlı kategoride değerlendirilmiştir. • Hem Fibonacci sayılarını hem de hash tablosunu içeren (FIBHASH) protein sayısallaştırma yöntemi önerilmiş ve bu yöntemin başarımı, protein ailelerini belirlemek için değerlendirilmiştir. Bu yöntem, Fibonacci sayılarını ve hash tablosunu içeren hibrit bir yöntemdir. Hash tablosu veri yapıları ve algoritma analizinde sıklıkla kullanıldığı için, FIBHASH yöntemi algoritmik-tabanlı yöntem olarak değerlendirilmiştir. • Önerilen protein sayısallaştırma yöntemleri SARS-CoV-2 virüsü ve konak hücreleri arasındaki etkileşimleri tahmin etmek için kullanılmış ve hem önerilen protein sayısallaştırma yöntemlerinin hem de literatürde en çok kullanılan yöntemlerin karşılaştırılması yapılmıştır. Önerilen protein sayısallaştırma yöntemleriyle elde edilen yapay zekâ değerlendirme başarımları, protein analizi alanlarında yapılacak olan yeni çalışmalar için ümit verici olmuştur.
Özet (Çeviri)
Studies and research on protein or amino acids in the field of bioinformatics are of great importance in terms of understanding the structures of proteins and determining the roles of proteins in cellular activities. When the researches are examined, it is observed that studies related to determining protein functions, predicting interactions between proteins, finding protein secondary structures, classifying protein families, identifying coding and non-coding mRNAs, predicting viral-host interactions and detecting drug-target interactions have been actively conducted. In the thesis, new artificial intelligence-based analysis approaches have been developed for these research areas. In this framework, a new algorithmic-based categorical approach has been developed to map protein sequences. As part of the algorithmic-based approach, three different protein mapping methods have been proposed. Accordingly, the proposed methods of quantifying protein sequences are: • An AVL-based protein mapping method has been proposed to convert protein sequences, and the success of this method has been tested on interactions between proteins of the SARS-CoV-2 virus that causes COVID-19 disease. This method has been evaluated in the algorithmic-based category due to the binary search tree structure it contains. • In another study, entropy-based protein mapping method has been proposed and used to identify protein-protein interactions on viral genomes. Since Shannon entropy is used in this method, it is evaluated in the algorithmic-based category. • Another protein mapping method (FIBHASH), which includes both Fibonacci numbers and hash tables, has been developed and the performance of this method has been evaluated in determining protein families. This method is a hybrid method that includes Fibonacci numbers and hash table. Since the hash table is frequently used in data structures and algorithm analysis, the FIBHASH method is considered an algorithmic-based method. • The proposed protein mapping methods were used to predict the interactions between SARS-CoV-2 virus and host cells, and both the proposed protein mapping methods and the state of art methods in the literature were compared. The successes of artificial intelligence obtained with the proposed protein mapping methods have been promising for new studies in the fields of protein analysis.
Benzer Tezler
- Artificial intelligence based methods for the solution of protein folding problem by using coarse-grained lattice and off-lattice models
Protein katlanma probleminin çözümü için kaba-taneli kafes ve kafes-dışı modelleri kullanan yapay zeka tabanlı yöntemler
BERAT DOĞAN
Doktora
İngilizce
2015
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. TAMER ÖLMEZ
- Sortaz A enzimine karşı inhibitör peptitlerin geliştirilmesi
Developing of inhibitor peptides against sortase A enzyme
MÜCAHİDE KÖKSAL
Yüksek Lisans
Türkçe
2017
Gıda MühendisliğiHacettepe ÜniversitesiGıda Mühendisliği Ana Bilim Dalı
YRD. DOÇ. FAHRİYE CEYDA DUDAK ŞEKER
- Secondary structure prediction of hemeglobin by using combined neural networks
Birleştirilmiş yapay sinir ağları kullanılarak hemoglobinin ikincil yapısının tahmin edilmesi
İREM ERSÖZ
Yüksek Lisans
İngilizce
2003
Elektrik ve Elektronik MühendisliğiÇukurova ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. TURGAY İBRİKÇİ
- Veri madenciliği teknikleri kullanılarak gen regülasyonunun incelenmesi
An investigation of gene regulation via data mining techniques
MEHMET CİHAN ŞAHİNGİL
Doktora
Türkçe
2019
Elektrik ve Elektronik MühendisliğiHacettepe ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ YAKUP SABRİ ÖZKAZANÇ
- Protein fold classification and motif retrieval methods by using the primary and secondary structures
Primer ve sekonder yapılar kullanılarak proteinlerin fold düzeyinde sınıflandırılması ve motif çıkarımı
ÖZLEM POLAT
Doktora
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. ZÜMRAY DOKUR ÖLMEZ