Determination of protein-protein binding sites using machine learning tools


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Boğaziçi Üniversitesi, FEN BİLİMLERİ ENSTİTÜSÜ, FEN BİLİMLERİ ENSTİTÜSÜ, Türkiye

Tezin Onay Tarihi: 2008

Tezin Dili: İngilizce

Öğrenci: FİDAN SÜMBÜL

Danışman: TÜRKAN HALİLOĞLU

Açık Arşiv Koleksiyonu: AVESİS Açık Erişim Koleksiyonu

Özet:

Protein-protein etkileşimi bir çok biyolojik işlemlerde önemli rol oynamaktadır. Bu nedenle etkileşi belirleyen özelliklerin anlaşılması gerek proteinin foksiyonunun belirlenmesi gerekse o proteindeki önemli amino asitlerin belirlenmesi açısından oldukça önemlidir. Proteinler yüzeydeki aminoa citleri aracılığı ile etkileşime geçerler ancak proteini bütün yüzeyi bağlanmaya elverişli değildir. Yüzeyde bulunan bazı bölgeler, yüzeyin geri kalan kısmından farklı bir takip özelliklee sahip olduğu için, protein sadece bu bölgesi aracılığı ile etkileşime girebilmektedir. Bu çalışmada, öncelikle bağlanma yüzeyindeki amino asitleri yüzeyin geri kalan kısmından ayıran özellikler araştırılıp, daha sonra bu özellikler muhtemel bağlanma amino asitlerinin makine öğrenmesi ile tahmininde kullanıldı. Söz konusu özellikler; aminoa sitlerin bulunma sıklıkları, hidrofobisitileri, yan zincirlerinin yüklülük durumu ve yüklü ise yükünün ne olduğu, evrim boyunca korunması, yüzey alanı, hareketliliği ve amino asitlerin salınımlarının birbirleri ile olan korelasyonu. Bu özellikler proteinin üç bölgesi; etkileşim yüzeyi, yüzeyin geri kalan kısmı ve proteinin çekirdeği, açısından incelendiğinde görüldü ki, bazı amino asitler yüzeyde veya çekirdekte olmayı tercih ederken bazıları ise bağlanma bölgesinin dışında kalan yüzeyi tercih etmekteler. Öte yandan etkileşim bölgesindeki amino asitler, yüzeyin geri kalan kısmına göre daha hidrofobik ve evrim boyunca daha çok korunmuş amino asitlerden oluşmakta. Protein kompleksleri 4 gruba ayrılarak homojen ve heterojen kompleksler birbirleri ile ve geçici ve zorunlu kompleksler de kendi aralarında karşılaştırıldı. Daha sonra incelenen bu özellikler kullanılarak birer makine öğrenmesi metodu olan destek vektör makinesi ve çoklu kernel öğrenmesi metodları ile muhtemel bağlanma amino asitleri tahmin edilmeye çalışıldı. Destek vektör makinesi ile mevcut koşullarda ulaşılan maximum doğruluk %81.3 olarak gerçekleşirken çoklu kernel öğrenmesi ile görüldü ki, nihayi sonuca en çok etki eden özellikler, amino asit tipi, korunumu, yüzey alanı ve protein içerisinde sözkonusu amino asitin bulunduğu yer, gerek hızlı gerekse yavaş modlarda amino asitlerin salınımları arasındaki korelasyon ve sözkonusu amino asitin yakın çevresindeki amino asitlerin ne oldugu bilgisi olduğu görüldü