Application of automatic mutation-gene pair extraction to diseases
Mutasyon-gen çiftlerinin otomatik olarak tanımlanmasının hastalıklara uygulanması
- Tez No: 223781
- Danışmanlar: DOÇ.DR. OSMAN UĞUR SEZERMAN, PROF.DR. KEMAL OFLAZER
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Biyomühendislik, Computer Engineering and Computer Science and Control, Bioengineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2007
- Dil: İngilizce
- Üniversite: Sabancı Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Belirtilmemiş.
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 63
Özet
Günümüzde, akdeniz anemisi gibi birçok kalıtsal hastalığın genlerde olan mutasyonlar sonucu ortaya çıktığı bilinmektedir. Bu hastalıkların ilerlemelerinin ve hatta ortaya çıkmalarının engellenmesini sağlayacak yöntemlerin bulunması konusunda mutasyonlar ve bu mutasyonların gerçekleştiği genlerin bilgisi büyük önem taşımaktadır. Hastalıklara ilişkin mutasyon ve gen bilgilerine herkese açık veri bankalarından ve biyomedikal literatür kaynaklarından erişmek mümkündür. Yalnız, bu kaynaklardan ilgili bilgilerin elde edilmesi iki sebepten ötürü problemli olabilir. İlk olarak bilgilerin elle girildiği veri bankaları genellikle eksik ve güncel olmayan bilgiler içermektedirler. İkinci olarak çok büyük miktarda biyomedikal dökümanı okumak oldukça zaman almaktadır. Bu yüzden ilgili bilgileri erişime açık mevcut kaynaklardan otomatik olarak çıkartacak sistemlere ihtiyaç vardır. Bu tezde, istenilen bir hastalık için MEDLINE özetlerinden mutasyongen çiftlerini otomatik olarak çıkartan MuGeX isimli sistemin tasarımı ve uygulanması sunulmaktadır. MuGeX sistemi temel olarak üç işlem gerçekleştirmektedir. İlk işlem, özetlerde geçen mutasyonların örüntü eşleştirme yönteminin bir makine öğrenimi algoritması ile birlikte kullanılması yolu ile tanımlanmasıdır. İkinci işlem, gen isimlerinin sözlük kullanımına dayanan bir metod ile tanımlanmasıdır. Sonuncu işlem ise mutasyonlar ve genler arasında yakınlık göz önünde bulundurularak ilişkilerin kurulmasıdır. Gerçekleştirilmiş olan deneylerin sonuçları gösteriyorki MuGeX deney özetlerinde mevcut olan mutasyonların %85.9'unu %95.9 doğruluk oranı ile bulmaktadır. Mutasyongen çiftlerinin tanımlanması işlemi için Alzheimer hastalığına odaklandık. Gözlemlediğimiz üzere MuGeX Alzheimer hastalığına ilişkin mutasyongen çiflerinin getirilmesinde %88.9'luk bir doğruluk oranına sahiptir.
Özet (Çeviri)
Nowadays, it is known that several inherited genetic diseases? such as sickle cell anemia, are caused by mutations in genes. In order to find ways to prevent and even better to circumvent occurrence of these diseases, knowledge of mutations and the genes on which the mutations occur is of crucial importance. Information on disease related mutations and genes can be accessed through publicly available databases or biomedical literature sources. However, acquiring relevant information from such resources can be problematic because of two reasons. Firstly manually created databases are usually incomplete and not up to date. Secondly reading through vast amount of publicly available biomedical documents is very time consuming. Therefore, there is a need for systems that are capable of extracting relevant information from publicly available resources in an automated fashion. This thesis presents the design and implementation of a system, MuGeX, that automatically extracts mutationgene pairs from MEDLINE abstracts for a given disease. MuGeX performs mainly three tasks. First task is identification of mutations, applying pattern matching in conjunction with a machine learning algorithm. The second task is identification of gene names utilizing a dictionarybased method. The final task is building relations between genes and mutations based on proximity measures. Results of experiments indicate that MuGeX identifies 85.9% of mutations that are on experiment corpus at 95.9% precision. For mutationgene pair extraction, we focused on Alzheimer?s disease. We observed that 88.9% of mutationgene pairs retrieved by MuGeX for Alzheimer?s disease are correct.
Benzer Tezler
- Üç boyutlu palet yükleme probleminin metasezgisel çözüm yaklaşımı ile bir otomotiv fabrikasında uygulaması
The application of the three-dimensional pallet loading problem in an automotive factory with a metaheuristic solution approach
MERVE SİMGE USUK
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. İHSAN HAKAN SELVİ
- Computational approaches to study drug resistance mechanisms
İlaç direnç mekanizmaları için işlemsel yaklaşımlar
ZOYA KHALID
Doktora
İngilizce
2017
BiyolojiSabancı ÜniversitesiMoleküler Biyoloji-Genetik ve Biyomühendislik Ana Bilim Dalı
Prof. Dr. İSMAİL ÇAKMAK
- Molecular characterization of phenylethanol resistance in Saccharomyces cerevisiae
Feniletanol direncinin Saccharomyces cerevısıae'de moleküler karakterizasyonu
CAN HOLYAVKİN
Doktora
İngilizce
2023
Biyoteknolojiİstanbul Teknik ÜniversitesiMoleküler Biyoloji-Genetik ve Biyoteknoloji Ana Bilim Dalı
PROF. DR. ZEYNEP PETEK ÇAKAR
- Organik asidürilerin tanısında kapiler elektroforez temassız iletkenlik dedektörü uygulamaları: Kemometrik deney tasarımı ile metot optimizasyonu
Capillary electrophoresis with contacless conductivity detection applications for determination of organic acidurias: Method optimization using chemometric experimental design
SİRUN ÖZÇELİK
- Karbazol substıtüye 3,4-dihydropyrimidin-2(1h)-tion türevi bileşiklerin sentezi
Synthesis of carbazol substituted 3,4-dihydropyrimidine-2(1h)-thione deri̇vati̇ves
FATİH KIRBAYIR