GENETİK İSTATİSTİK
Canlılarda kalıtım ve değişim olgusunu inceleyen genetik bilimi çeşitli bilimsel inceleme yaklaşımları içinde olmuştur. Bu yaklaşımları; soy çözümlemesi (pedigree) içeren taransmisyon genetiği, kromozom incelemeleri içeren sitogenetik, genomik, proteomiks ve biyoinformatik alanlarını da kapsayan moleküler genetik çözümleme, ve populasyon genetiği olarak sıralayabiliriz. Moleküler genetik, gen fonksiyonlarının moleküler ve biyokimyasal çözümlemeleri yoluyla gen terapisine olanak sağlayarak tıp, tarım ve biyoetik alanlarında bilgiye ve yaşam süreçlerine çok geniş açılımlı önemli katkılarda bulunmuştur.
Bir molekülün genetik malzeme olarak kullanılabilmesi için kopyalama, genetik bilgi depolama, bilgi ifade etme ve mutasyon yoluyla değişim karakteristiklerine sahip olması gerekmektedir. Genden proteine bilgi akışı:DNA (depolanmış bilgi), mRNA-tRNA-rRNA-Ribosom (kopyalanmış ve tertip edilmiş bilgi) ve Protein(aktif ürün) sıra düzeni içinde gerçekleşmektedir. Genetik verilerin bilgiye dönüştürülmesi gayretinde bu sıra düzeninin dikkate alınması gereklidir.
Bu anlayış içerisinde, gen ve protein düzeyinden, yaşam olguları ve süreçleri düzeyine geçişin betimsel ve sebeb-sonuç etkileşimi dahil tüm yönleri ile anlaşılması genetik istatistik yöntemleri ile olanaklı hale gelmiştir.
2.Genetik Çözümleme ve İstatistik
Genetik bilimi ondokuzuncu yüzyılda fenotiplerin sürekli ve dereceli değişimi ile kendini gösteren canlı özelliklerinin (traits) incelenmesi ile ilgilenmiş, yirminci yüzyılda toplamsal alellerin sürekli değişimin temelini oluşturduğunu göstererek çeşitli polijenic özelliklerin bulunması için büyük sayılarda organizma populasyonlarının araştırılmasını önermiştir. Kalıtımsallığın fenotipik değişkenliğe (VP) genetik katkının ölçüsünü oluşturduğu bulunarak, genetik değişkenlik (VG), çevresel değişkenlik (VE), etkileşimli değişkenlik (VGE) bileşenlerinin tayini ve ölçümü ortaya konulmuş, gözlenmesi zor olan genotipleri ve genotipik değişimi fenotipler ve fenotipik değişim ile açıklama önem kazanmıştır. Sonuç olarak, yirmibirinci yüzyıla gelindiğinde genetik yapılardaki antijenlerin (alellerin) insan ve diğer canlı toplumlarında kronik hastalıklar dahil olmak üzere pek çok olguyla ilişkisinin karakterize edilmesi başarılmıştır. Niceliksel özellikler loci'si (QTL) olarak adlandırılan genlerin genom boyunca haritalandırılması ve DNA dizinlemesi bu karakterizasyonun temelini oluşturmaktadır.
Populasyon ve alt-populasyonlar düzeyinde yapılan genetik çalışmalarda alel çokluklarının hesaplanması ve Hardy-Weinberg Kanunu uzantısında homozigot ve heterozigot çokluklarının, doğal seçim, mutasyon, göç, genetik sürüklenme ve rasgele olmayan çiftleşme durumları altında incelenmesi, ilişki (association), bağlantı (linkage), ayrım(segregation), haplotip çözümlemesi gibi konular olasılık ve istatistik modellerinin yardımıyla gerçekleştirilmektedir.
2.1.İstatistik Model
İstatistik çözümlemenin ana hatları olasılık modeli, nedensellik ve yapısal model, ve istatistik sonuç çıkarımından oluşur. Genetik çalışmalarda olduğu gibi, bütün bilimsel çalışmalarda hedef (ilgilenilen) populasyondaki bir özellik X değişkeni veya özellikler X=(X1, ......, Xm) vektör değişkeni ile ifade edilir ki bunların gözlenen değerleri x ve x ile gösterilir. Bu değişkenlerin gözlenen değerlerinin Aj veya Ajk, j= 1,....j, k=1,.....m, gibi değer alt kümelerinden birine veya bunların kesişim/bileşim kümesine düşmesi durumu (rasgele) olay veya olgu gerçekleşmesi olarak ifade edilir. Söz konusu olayların/olguların olasılıkları X'in olasılık dağılım fonksiyonu F(x,θ) veya X'in çok değişkenli olasılık dağılımı F(x,θ) kullanılarak açıklanır. Burada θ ve θ dağılımların parametreleridir.
İstatistik çözümlemede F(.), θ, θ 'nin kestirimi modelleme ve sonuç çıkarımına ait tüm yaklaşımların esasını oluşturur. Örneğin, allel çokluklarının bulunması ve çokluklara ait olasılıksal hesaplar F(.), ondan türetilen olasılık fonksiyonları f(.) ve θ, θ parametrelerinin tayinine yöneliktir. İlişki ve korelasyon ölçümleri, nedensellik yapısını irdeleyen genelleştirilmiş doğrusal modeller ve bunun içinde yer alan logit, probit gibi diğer modeller, zaman dinamiğini çözümlemeye içselleştiren stokastik modeller tümüyle dağılım fonksiyonları ve onların parametrelerine ait bilgileri kullanmak durumundadır (Silvey (1975), Steel ve Torrie (1980)).
Parametre kestirimi güven aralığı kestirimi ve hipotez testlerinde, doğru ve geçerli deney tasarımı veya örnekleme planları yoluyla gözlenen x ve x değerlerinin fonksiyonu olan yeterli istatistiklerin kullanılması gereklidir. Hipotez testi oluşturmada, boş ve alternatif hipotez kurgusu, test istatistiği tayini ve onun olasılık dağılımı, testin önem derecesi, ve hata payları toleransı konularında kuram ve yöntem bilgisi eksiklikleri mutlaka yanlış ve yanlı sonuçlara yol açar.
Bir diğer önemli husus x, x değişkenlerinin tipleridir. Değişkenler aldıkları değerlerin ara, oran, sıra veya nitelik değerleri olmasına bağlı olarak sınıflara ayrılır. Kullanılacak istatistik yöntemi ve yaklaşımlar, pek çok uygulayıcının bilinci dışında, değişken tiplerine göre farklılıklar gösterir.
2.2.Genetik Çözümleme
Genetik çalışmalarda veriye erişme, veri analizi ve doğru, güvenilir, geçerli sonuç çıkarım bilgisine ulaşma istatistik kuram ve yöntemlerine dayalı olarak gelişim göstermektedir (Elston, Olson ve Palmer (2002), Klug ve Cummings (2003)). Tam bir liste halinde olmamakla birlikte, genetik çözümleme konuları ile istatistik yöntemler ilintisi aşağıda gösterilmiştir:
Genetik Çözümleme İstatistik Yöntem
Bağlantı, Seçim, Mutasyon ve Kombinatorik, Olasılık Dağılımı
Seçim Dengesi, Hardy-Weinberg Kestirimi, Uyum İyiliği Testleri
Eşitliği
Gen Sayımı, Alel Çokluğu, Sayma Teknikleri, En Çok
Ayrım Çözümlemesi, Skorlama Olabilirlik (ML), LR ve EM Kestirim Yöntemleri, Bayesci Çözümleme, Odds Oranı
Genotip Çoklukları, Durum-Kontrol Hipotez Testleri, LR,
İlişki Testleri, Geçis/Eşitsizlik Sınıflandırılmış Veri Analizi, Çok
Testleri Boyutlu ve Değişkenli Olasılık
Dağılım Modelleri, Lojistik
Regresyon
Akrabalık ve Hüviyet Katsayıları, Rasgele Cisimler ve Haritalar
Genotip Tahminleri, Nicelik Varyans-Kovaryans Çözümlemesi
Özellikleri, Risk Oranları
Bağlantı Çözümlemesi
Düzenleme (Array) ve Faktörleme, ML, Çok Değişkenli Analiz
Polijenik Modelleme, QTL Haritalama Faktör Analizi
Hastalık ve Marker Loci Haritalaması, Grafik Kuramı, MCMC, Markov İlişki Çözümlemesi Süreçleri, Hastings-Metropolis
Yöntemi,Ardışık Olasılık Oran Testleri
Moleküler Filojeni, Radyasyon Stokastik Süreç Modelleri, ML,
Hibrid Haritalama Bayesci Kestirim
Rekombinasyon Modellemesi, Yenileme Süreçleri, Poisson Chiasma Sıra (Sequence) Çözümlemesi Süreçleri, Dinamik Programlama,
Paralel Süreçleme, Yayılma ve Dallanma Süreçleri
3.HLA Sistemi
İnsanda beyaz kan hücrelerindeki antijenik sistemlerin pek çok türünün saptanmasıyla İnsan Lökosit Antijen (HLA) sistemi geliştirilmiştir. HLA ve hastalıklar arasındaki ilişkilerin anlaşılması için genetik seçim, göç ve bağlantı ile insan evrimi etkileşimi arasındaki bağıntı HLA verileri kullanılarak saptanmaya çalışılmıştır (Thomson (1981), Cavalli-Sforza, Menozzi ve Piazza (1994)).
Aile ve somatik hücre hibrid incelemeleri bileşiminde HLA sistemi insanda kromozom 6'nın kısa kolu üzerinde haritalanmıştır. HLA bölgesinde bulunan antijenler 3 loci'de çoklu aleller ile kontrol edilmektedir. Bu aleller HLA-A, HLA-B, HLA-C olarak tanımlanmıştır. Diğer bir locus HLA-D olup bunun karışık limfosit kültürü (MLC) tepkisini kontrol ettiği saptanmıştır (Thomson, 1981). Bağışıklıkla ilişkili DR antijeni de HLA bölgesinde yer almaktadır. HLA sisteminin incelenmesi, doku transplantasyonlarında verici ve alıcıların antijenlerinin uyum saptaması için büyük önem taşımaktadır.
HLA ve hastalıklar arasındaki ilişkinin ölçümünde göreli risk ve delta istatistikleri kullanılmaktadır. Ayrıca bağlantı (linkage) incelemeleri hastalıkların haplotip ilişkilerini tespit etmek için uygulanmaktadır (Zachary (1995), Thomson (1981)).
Hastalıklar ve HLA ilintisine ilişkin çalışmalar populasyon ve aile çalışmaları olmak üzere iki yaklaşım içinde yapılmaktadır. Aile çalışmaları, HLA çok polimorfik bir sistem olduğundan, ancak ailesel toplulaşma olan durumlarda bilgi içeriği yüksek sonuçlar vermektedir. Populasyon çalışmalarında HLA fenotipleri birbiriyle bağlantısız kontrol bireyleri üzerinde gözlenerek kullanılmaktadır. Her iki durumda da istatistiki anlamda populasyon heterojenliği, kontrol yeterliliği, bağlantı eşitsizliği gibi unsurlara özel önem verilmesi gerekmektedir.
Yararlanılan Kaynaklar
Cavalli-Sforza, L.L., P. Menozzi, A.Piazza (1994). The History and Geography of Human Genes, Princeton University Press
Elston, R., J. Olson, L. Palmer (2002). Biostatistical Genetics and Genetic Epidemiology. Wiley
Klug, W.S., M.R. Cummings (2003). Genetics; A Molecular Perspective. Prentice Hall, Pearson Education Inc.
Silvey, S.D. (1975). Statistical Inference. Halsted Press
Steel, R.G.D., J.H.Torrie (1985). Principles and Procedures of Statistics; A Biometrical Approach. Mc Graw Hill
Thomson, G.(1981). A review of theoretical aspects of HLA and disease association. Theoretical Population Biology, 20, 168-208
Zachary, A.A. (1995). Statistical analysis of genetic data, ASHI Quarterly, 4-7
Genetik
-
İnsanlarda Kaç Kromozom Vardır?
-
Sık görülen mikrodelesyon sendromları nelerdir?
-
Bilim insanları kromozomları nasıl inceler?
-
Arkea'da Kromozomlar ve DNA Replikasyonu
-
DNA Onarım Mekanizmaları Nelerdir?
-
DNA hasarına neden olan etkenler nelerdir?
-
XYY Süper Erkek Sendromu - JACOB’S, Sendromu
-
Bitki doku kültürü çalışmaları ile haploid bitkiler elde edilebilir
-
Gram pozitif bakterilerden genomik DNA izolasyon protokolü
-
E. coli bakterisinden genomik DNA izolasyon protokolü
-
DNA’nın Keşfi
-
İnsan Genom Projesi Nedir ? Amaçları Nelerdir ?
-
Genomik mikrodizilimlerle ikilenme teşhisi yöntemi
-
Gen duplikasyonu ve amplifikasyonu nedir?
-
DNA ile RNA Arasndaki Farklar ve Benzerlikler Nelerdir