Geri Dön

Pamuk (Gossypium L.) genomlarında mikrosatellit DNA tipleri ve dağılımları

Types and distributions of microsatellite DNA in the Cotton (Gossypium l.) genome

  1. Tez No: 921891
  2. Yazar: DAMLA AKMAN
  3. Danışmanlar: PROF. DR. MEHMET KARACA
  4. Tez Türü: Yüksek Lisans
  5. Konular: Biyoteknoloji, Biotechnology
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: Akdeniz Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Tarla Bitkileri Ana Bilim Dalı
  12. Bilim Dalı: Tarla Bitkileri Bilim Dalı
  13. Sayfa Sayısı: 173

Özet

Hızla gelişen tekstil sektörünün en önemli doğal hammaddesi olan pamuk (Gossypium L.) üretiminin dünya nüfusunun artmasıyla birlikte artması ve insanların çeşitli ihtiyaçlarını karşılaması ve diğerleriyle birlikte istihdam olanağı yaratması gerekmektedir. Pamuk dünyada Hindistan, Çin, ABD'nin de ilk sıralarda yer aldığı yaklaşık 80 ülkede yetiştiriciliği yapılmaktadır. Pamuk lifleri tekstil için ana kaynak olarak kullanılırken, tohumu yağı için kullanılmakta ve küspesi de proteince zengin hayvan yemi olarak kullanıldığından ülkemiz ve dünyada önemli bir endüstri bitkisidir. Organizmalar genomları çerçevesinde yaşamlarını idame ettiklerinden dolayı genomun yapısı ve işlevi insanoğlunun dikkatini çekme nedeni genomların yapısı ile fonksiyonlarının ilişkili olmalarından kaynaklanmaktadır. Günümüzde özellikle son 10 15 yıllık dönemde Yeni Nesil Dizileme (NGS) teknolojileri yardımıyla çok sayıda genom dizilenmekte (“sequencing”) veya tekrar dizileme (“resequencing”) yapılabilmektedir. Pamuk genomu da bu dizilemelerden faydalanmıştır. Bu çalışmanın ana amacı kültürü yapılan tetraploit Upland pamuğun (Gossypium hirsutum L.) ve Upland pamuğun oluşumunda ata olan iki diploit pamuğun temsilcileri olan (G. arboreum L. ve G. raimondii L.) Oryantal (Asya) ve Peru pamuklarının bütün genom dizileri kullanılarak mikrosatellit (SSR) DNA'nın tipleri ve dağılımının türlerin genomları, kromozomları, 5' ve 3' UTR bölgeleri, upstream, downstream, ekson, intron ve intergen dizilerinde ortaya konulması, mikrosatellitlerin fonksiyonu konularında daha fazla bilgi edinmek için selüloz ve selüloz sentaz benzeri genlerinin mikrosatellit analizlerinin yapılması, filogenetik çalışmalar ve nihayetinde de mikrosatellit DNA'nın protein kodlama potansiyelleri üzerine bilgi edinmek amacıyla bu çalışma yürütülmüştür. Çalışmada allotetraploit bir tür olan ve yaygın olarak Upland pamuk olarak adlandırılan G. hirsutum, diploit türler olan ve Oryantal (Asya/Ağaç) pamuk olarak adlandırılan G. arboreum, Peru pamuğu olarak bilinen G. raimondii, ve bu türlerin bütün genom dizilerine ait referans dizileri kullanılmıştır. Bütün genom dizileri ve genom bilgilerini içeren dosyalar GenBank veri tabanından FASTA, GFF ve GTF formatında indirilmiş olup mikrosatellit içerikleri, genomsal dağılımları ve tipleri PERL tabanlı GMATA ve farklı linux tabanlı yazılım programları yardımları ile ortaya konulmuştur. GFF/GTF verileri kullanılarak selüloz sentaz genlerinin konumsal bilgileri AWK, SED ve GREP skriptleri yardımıyla belirlenmiştir. Analizlerde 3 pamuk türünün genomlarının, alt genomlarının, kromozomlarının mikrosatellit içerikleri ve tekrar sayılarının da türlerde farklı olduğu bulunmuştur. Tri-, tetra-, penta- ve hekza-nükleotitlerin G. hirsutum da daha yüksek iken; di-nükleotit tekrarların ise G. arboreum ve G. raimondii de daha yüksek olduğu tespit edilmiştir. Di nükleotitler arasında G. arboreum'un mikrosatellitleri G. raimondii'den daha fazla olduğu sonucuna varılmıştır. Üç türün her kromozomunda mikrosatellit sayıları değişiklik göstermekte olup en yüksek değerler Oryantal pamukta bulunmuştur. Üç pamuk türünün gen (genik) ve genler arası (intergenik) SSR sıklığı karşılaştırıldığında genik-SSR yönünden en fazla sıklığa sahip olan Peru pamuğu bulunmuş ve bunu Upland pamuğu ve Oryantal pamuğu takip etmiştir. Genler arası SSR yönünden ise en yüksek sıklığa sahip olan Oryantal pamuğu olup bunu Peru pamuğu ve Upland pamuğu takip etmiştir. Her bir pamuk kromozomunda farklı SSR tiplerinin sıklığı ve dağılımı incelendiğinde SSR lokuslarının sıklığı kromozom boyutuyla ilişkili olmadığı belirlenmiştir. Üç pamuk türünün SSR yoğunluklarının farklı olduğu ortaya konmuştur. G. hirsutum'da genik-SSR ve intergenik SSR daha fazla iken; G. raimondii'de genik ve intergenik SSR sayısının daha az olduğu sonucuna varılmıştır. Bu çalışma mikrosatellitlerin gen elementlerinin önemli bir bileşeni olduğunu doğrulamıştır. Oryantal pamuk (A genom) ve Upland pamukta (AD genom) tri-nükleotit tekrarları kodlama bölgelerinde daha yaygın olurken; Peru pamukta di-nükleotit tekrarlarının daha fazla olduğu sonucuna ulaşılmıştır. Mikrosatellit dizilerin üç farklı okuma çerçevesinde kodladıkları amino asitler belirlendi ve SSR dizilerinden tri nükleotit ve penta-nükleotitlerin mono-peptit veya di-peptit tekrarlı amino asitleri kodladığı, di-nükleotit tekrarların ise di-peptit amino asitleri kodladığı belirlenirken, tetra- ve penta-nükleotit tekrarların tetra- ve penta-peptit tekrarlı amino asitleri sentezledikleri belirlenmiştir. Canlılar aleminin en önemli polisakkariti olan selülozu sentezleyen selüloz ve selüloz sentaz benzeri genler mikrosatellit içerenler ve içermeyenler olarak gruplandırıldı ve mikrosatellit içeren selüloz ve selüloz sentaz benzeri genleri içerdikleri mikrosatellitlerin onların fonksiyonları ve filogenetik pozisyonları yönünden etkili oldukları sonucuna varılmıştır. Mikrosatellitlerin verici diploit genomlardaki sayıları ile tetraploit genomdaki sayıları karşılaştırıldığında evrim sürecinde bir kısım mikrosatellitlerin kayıp olduğu ancak bazı yeni mikrosatellitlerin ise de novo oluştuğu tespit edilmiştir. Çalışmanın diğer bir sonucu olarak NGS tabanlı referans genom bilgileri kullanılarak herhangi bir organizmanın tüm mikrosatellit türlerini tanımlamak ve genik ile intergenik mikrosatellitleri tür içerisinde veya türler arası karşılaştırmaların mümkün olduğu görülmüştür. Bu sayede gen, gen bölgelerine özgü fonksiyonel mikrosatellit (SSR) markırlarının elde edilebileceği bu tez çalışmasıyla teyit edilebilmiştir.

Özet (Çeviri)

Production of Cotton (Gossypium L.), which is the most important natural raw material of the rapidly developing textile industry, needs to increase with the increase in the world population and should meet the various needs of people and create employment opportunities with its other by-products. Cotton is grown in approximately 80 countries in the world, including India, China and the USA. While cotton fibers are used as the main source for textiles, its seeds are used for its oil and its cake is used as protein-rich animal feed, so it is an important industrial plant in our country and in the world. Since organisms survive within the framework of their genomes, the structure and function of the genome attract human attention because the structure and functions of genomes are related. Nowadays, especially in the last 10-15 years, many genomes have been sequenced or resequenced with the help of Next Generation Sequencing (NGS) technologies. The cotton genome also benefited from these sequencings. The main objective of this study was to use the whole genome sequences of cultured tetraploid Upland cotton (Gossypium hirsutum L.) and Oriental (Asian) and Peruvian cottons, representatives of the two diploid cottons (G. arboreum L. and G. herbaceum L.) that are the ancestors of Upland cotton. This study was carried out to obtain information regarding the types and distribution of microsatellite (SSR) DNA in species genomes, chromosomes, 5' UTR, 3' UTR, Gene, Upstream, Downstream, Exon, Intron and Intergene sequences. Furthermore, microsatellite analysis of cellulose and cellulose synthase-like genes to obtain more information on the function of microsatellites, phylogenetic studies and protein coding of microsatellite DNA were studied. In the study, reference sequences constructed using whole genome sequences of G. hirsutum, which is an allotetraploid species and commonly called Upland cotton, G. arboreum, which is a diploid species and called Oriental (Asian/Tree) cotton, and G. raimondii, known as Peruvian cotton, were used. Whole genome sequences and files containing genome information were downloaded from the GenBank database in FASTA, GFF and GTF formats, and their microsatellite contents, genomic distributions and types of microsatellites were revealed using PERL-based GMATA and Linux-based software programs. Using GFF/GTF data, positional information of cellulose synthase genes was determined with the help of AWK, SED and GREP scripts. In this study, it was found that the microsatellite contents and repeat types of the genomes, sub-genomes and chromosomes of 3 cotton species were different among the species. It was determined that tri-, tetra-, penta- and hexa-nucleotides were higher in G. hirsutum, while di-nucleotide repeats were higher in G. arboreum and G. raimondii. It was concluded that G. arboreum had more microsatellites than G. raimondii among di nucleotides. Microsatellite numbers vary in each chromosome of the three species. Among species, the highest number of microsatellite values were found in Oriental cotton. When the genic and intergenic SSR frequencies of three cotton species were compared, Peruvian cotton was found to have the highest frequency in terms of genic SSR (SSRs within 5' UTR, 3' UTR, gene, upstream, downstream and exon), followed by Upland cotton and Oriental cotton. In terms of intergenic SSR, Oriental cotton had the highest frequency, followed by Peruvian cotton and Upland cotton. When the frequency and distribution of different SSR types in each cotton chromosome were examined, it was determined that the frequency of SSR loci was not related to chromosome size. It has been revealed that the SSR densities of the three cotton types are different. It was concluded that while genic-SSR and intergenic SSR were more in G. hirsutum, genic and intergenic SSR were less in G. raimondii. This study confirmed that microsatellites are important components of gene elements. In Oriental cotton (A genome) and Upland cotton (AD genome), tri-nucleotide repeats awere more common in coding regions; It was concluded that di-nucleotide repeats were higher in Peruvian cotton. The amino acids encoded by microsatellite sequences in three different reading frames were determined and the amino acid sequences they encoded were identified. It was determined that tri-nucleotide and penta nucleotides code for mono-peptide or di-peptide repeated amino acids, dinucleotide repeats code for di-peptide amino acids, while tetra- and penta-nucleotide repeats code for tetra-peptide amino acids. Cellulose and cellulose synthesis-like genes that synthesize cellulose, the most important polysaccharide of the living kingdom, were grouped as those containing microsatellites and those not containing microsatellites, and it was concluded that microsatellites with cellulose and cellulose synthesis-like genes existed, and they were effective in terms of the functions and phylogenetic positions of the microsatellites they contain. When the numbers of microsatellites in the donor diploid genomes were compared with the numbers in the tetraploid genome, it was determined that some microsatellites were probably lost during the evolution process, but some new microsatellites were formed. In this study, it was also found that by using NGS reference genome information, it is possible to identify all microsatellite types of any organism and compare genic and intergenic microsatellites within and between genomes. In this way, it has been confirmed in this thesis that functional microsatellite (SSR) markers specific to genes and gene regions can be obtained.

Benzer Tezler

  1. Türkiye'de tescillenmiş bazı ticari pamuk çeşitlerinin moleküler karakterizasyonu üzerine bir araştırma

    A study on the molecular characterization of some commercial cotton varieties registered in Turkey

    ADNAN AYDIN

    Doktora

    Türkçe

    Türkçe

    2018

    BiyoteknolojiAkdeniz Üniversitesi

    Tarla Bitkileri Ana Bilim Dalı

    PROF. DR. MEHMET KARACA

  2. Pamukta lif uzamasıyla ilgili genlerin polimorfizmi

    Polimorfizm of the genes relatedto cottonfiber elongation

    GÜLAY ZÜLKADİR

    Yüksek Lisans

    Türkçe

    Türkçe

    2011

    BiyomühendislikKahramanmaraş Sütçü İmam Üniversitesi

    DOÇ. DR. YÜKSEL BÖLEK

  3. Gelişen pamuk tohumlarında mikroRNA'ların tanımlanması, karakterizasyonu ve gossipol içermeyen pamuklarla ifadelerinin karşılaştırılması

    Identification and characterization of microRNAs in developing cotton seeds and comparisation of its expressions with non-gossypol cottons

    LÜTFİ TUTAR

    Doktora

    Türkçe

    Türkçe

    2016

    BiyolojiKahramanmaraş Sütçü İmam Üniversitesi

    Biyoloji Ana Bilim Dalı

    PROF. DR. ŞENGÜL KARAMAN

    PROF. DR. YÜKSEL BÖLEK

  4. Pamuk (Gossypıum L.) kromozom substitüsyon hatlarının mikrosatellit markırları kullanılarak belirlenmesi

    Identification of cotton (Gossypium L.) chromosome substitution lines microsatellite markers

    ADNAN AYDIN

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    BiyoteknolojiAkdeniz Üniversitesi

    Tarla Bitkileri Ana Bilim Dalı

    DOÇ. DR. MEHMET KARACA

  5. Pamukta (Gossypium L.) epiallellerin tespitinde kullanılabilecek GS-KUP markırlarının geliştirilmesi

    Development of GS-RLP markers for detection of epialleles in cotton (Gossypium L. )

    AYŞE SAĞIR

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    BiyoteknolojiAkdeniz Üniversitesi

    Tarla Bitkileri Ana Bilim Dalı

    PROF. DR. MEHMET KARACA