Prédiction de structure secondaire d'ARNS avec pseudo-noeuds et de ses motifs structuraux grâce à la programmation entière

Loyer, Gabriel (2023). « Prédiction de structure secondaire d'ARNS avec pseudo-noeuds et de ses motifs structuraux grâce à la programmation entière » Mémoire. Montréal (Québec, Canada), Université du Québec à Montréal, Maîtrise en informatique.

Fichier(s) associé(s) à ce document :
[img]
Prévisualisation
PDF
Télécharger (1MB)

Résumé

La prédiction d’une structure secondaire d’ARN contenant des pseudo-noeuds reste un défi dans les modèles thermodynamiques. L’énergie des motifs 3D locaux rejoignant les tiges canoniques est approximée. De plus, même si les interactions de pseudo-noeuds sont nombreuses et importantes, elles sont souvent ignorées en raison de la complexité supplémentaire et de la précision réduite en utilisant des approches de programmation dynamique standard pour calculer la structure la plus stable. Parallèlement, il est devenu de plus en plus évident ces dernières années que les motifs structurels dans les boucles, composés d’interactions non canoniques, sont essentiels pour la forme finale de la molécule permettant ses multiples fonctions. Notre capacité à prédire des structures 3D précises est également limitée lorsqu’il s’agit de l’organisation du grand réseau complexe d’interactions qui se forment à l’intérieur de ces boucles. Le logiciel RNA-MoIP (RNA Motifs over Integer Programming) a précédemment été développé pour concilier la structure secondaire de l’ARN et les informations sur les motifs 3D locaux disponibles dans les bases de données. J’ai approfondi notre modèle afin de prédire simultanément les paires de bases canoniques (incluant des pseudo-noeuds) à partir des matrices de probabilité des paires de bases. L’utilisation de décompositions de structures contenant des pseudo-noeuds en de multiples structures sans pseudo-noeud permet d’utiliser un modèle thermodynamique pour approximer les probabilités de paires générales, qui est ensuite guidé par l’insertion de motifs. J’ai également ajouté la possibilité de donner une prédiction de structure secondaire sans avoir besoin d’une structure de base comme référence en entrée. La prédiction est ensuite raffinée par itérations, avec la structure prédite comme contrainte, jusqu’à ce que la convergence soit atteinte. J’ai ensuite évalué notre nouvelle méthode sur une base non redondante de toutes les structures d’ARN de moins de 150 nucléotides. Je montre que la prédiction conjointe de la structure des paires de bases canoniques et des motifs conservés locaux (i) améliore le ratio des interactions bien prédites dans la structure secondaire qui contienne des pseudo-noeuds, et (ii) diminue le ratio de paires de bases erronées. Le code source du cadriciel ainsi que la base de données et les résultats sont disponibles sur le répertoire suivant : https://gitlab.info.uqam.ca/cbe/RNAMoIP. Un serveur web est également accessible sous l’adresse https://rnamoip.cbe.uqam.ca afin d’effectuer une prédiction sous une interface utilisateur.

Type: Mémoire accepté
Informations complémentaires: Fichier numérique reçu et enrichi en format PDF/A.
Directeur de thèse: Reinharz, Vladimir
Mots-clés ou Sujets: ARN / Structure / Prédiction / Programmation entière
Unité d'appartenance: Faculté des sciences > Département d'informatique
Déposé par: Service des bibliothèques
Date de dépôt: 05 déc. 2023 09:56
Dernière modification: 05 déc. 2023 09:56
Adresse URL : http://archipel.uqam.ca/id/eprint/17204

Statistiques

Voir les statistiques sur cinq ans...