Genetik Kaynaklı Hastalıklara Yapay Zeka Yaklaşımı
20.04.2022 / Yayınlar

Hacettepe Üniversitesi, Bilgisayar Mühendisliği Bölümü öğretim üyesi Doç. Dr. Tunca Doğan ve çalışma ortakları bu çalışmada, doğal dil işleme alanında önemli gelişmelere neden olan derin öğrenme tabanlı dil modellerinin, proteinlerin amino asit dizilerinin bir metinde yer alan cümleler, aynı proteinlerin moleküler işlevlerinin ise bu cümlelerin anlamları şeklinde değerlendirildiği bir yaklaşım çerçevesinde kullanılmasını inceledi.

Amino asit dizi örüntüleri içerisinde saklı olan karmaşık işlevsel bilgi, büyük ölçekli ve denetimsiz (veya kendi kendini denetleyen) derin öğrenme modelleri tarafından otomatik olarak öğrenilmektedir (Unsal vd., 2022).

Yazarlar, en önemli bulgularını "her biri milyarlarca parametre içerebilen bu derin protein dil modellerinin sadece protein dizi verisini kullanarak karmaşık biyolojik mekanizmaları başarıyla öğrenebilmesi" olarak değerlendirdi. Ayrıca, yazarlar bu sonuçların, yine dizi verisini girdi olarak kullanan ve son derece yüksek performansla 3-boyutlu protein monomer yapı tahminleri oluşturan Deepmind-AlphaFold2 ve RoseTTAFold gibi yöntemlerin bulgularıyla tutarlı olduğunu bildirdi. Gelecekte, sağlık alanında yeni kişiselleştirilmiş tedavi seçenekleri geliştirme çalışmaları kapsamında, bu tip yapay zeka modellerinin genetik kaynaklı hastalıkların moleküler analizinde ve bunları spesifik olarak hedefleyecek yeni ilaçların keşfinde kullanılmasının amaçlandığı aktarıldı.

Ayrıntılı bilgi için çalışmanın çevrimiçi pdf formatındaki tam versiyonuna şu bağlantıdan erişilebilir: https://rdcu.be/cJAKN

Unsal, S., Atas, H., Albayrak, M., Turhan, K., Acar, A. C., & Doğan, T. (2022). Learning Functional Properties of Proteins with Language Models. Nature Machine Intelligence, 4, 227–245 [DOI:10.1038/s42256-022-00457-9].