Titre : | L'APPRENTISSAGE PAR RENFORCEMENT COMME OUTIL D'ALIGNEMENT DE SEQUENCES MULTIPLESMémoire de Master | Type de document : | thèse | Auteurs : | BOUSKRI MEHDI, Auteur | Année de publication : | 2020 | Langues : | Français (fre) | Mots-clés : | Bio-informatique Apprentissage par renforcement Alignement de séquences multiples Option 602 | Résumé : | L’alignement de séquences multiples (MSA) est prouvé qu’il s’agit d’un problème NP-Complet, ce qui implique que toutes les solutions informatiques sont des approximations à des solutions exactes. Bien que la solution exacte du problème de MSA peut être trouvée manuellement, mais c’est impossible pour un grand nombre de séquences. On a essayé dans ce projet d'imiter ce processus manuel en utilisant l’algorithme Actor-Critic with Experience Replay (ACER), un algorithme d'apprentissage par renforcement, qui a permis à un modèle entraîné d'atteindre des alignements optimaux égaux ou supérieurs aux alignements de ClustalW2 dans la plupart des cas, avec des dimensions supérieures aux alignements utilisés dans l'entraînement. On a pu créer une application bureau pour utiliser le modèle entraîné, mais elle est limitée à trois séquences d'ADN avec moins de cent nucléotides en raison de la diminution de performance et un long temps d'exécution dans les séquences d'ADN et de protéines de grande taille. En plus de la validation du fait que les algorithmes d'apprentissage par renforcement peuvent résoudre le problème de MSA sans l'aide d'autres algorithmes, les résultats de ce projet montrent aussi qu'il y a encore une marge d'amélioration dans l'interaction de l'algorithme avec les alignements afin d'obtenir une meilleure performance.
| Numéro (Thèse ou Mémoire) : | MM0112020 | Président : | AANNIZ TARIK | Directeur : | IBRAHIMI AZEDDINE |
L'APPRENTISSAGE PAR RENFORCEMENT COMME OUTIL D'ALIGNEMENT DE SEQUENCES MULTIPLESMémoire de Master [thèse] / BOUSKRI MEHDI, Auteur . - 2020. Langues : Français ( fre) Mots-clés : | Bio-informatique Apprentissage par renforcement Alignement de séquences multiples Option 602 | Résumé : | L’alignement de séquences multiples (MSA) est prouvé qu’il s’agit d’un problème NP-Complet, ce qui implique que toutes les solutions informatiques sont des approximations à des solutions exactes. Bien que la solution exacte du problème de MSA peut être trouvée manuellement, mais c’est impossible pour un grand nombre de séquences. On a essayé dans ce projet d'imiter ce processus manuel en utilisant l’algorithme Actor-Critic with Experience Replay (ACER), un algorithme d'apprentissage par renforcement, qui a permis à un modèle entraîné d'atteindre des alignements optimaux égaux ou supérieurs aux alignements de ClustalW2 dans la plupart des cas, avec des dimensions supérieures aux alignements utilisés dans l'entraînement. On a pu créer une application bureau pour utiliser le modèle entraîné, mais elle est limitée à trois séquences d'ADN avec moins de cent nucléotides en raison de la diminution de performance et un long temps d'exécution dans les séquences d'ADN et de protéines de grande taille. En plus de la validation du fait que les algorithmes d'apprentissage par renforcement peuvent résoudre le problème de MSA sans l'aide d'autres algorithmes, les résultats de ce projet montrent aussi qu'il y a encore une marge d'amélioration dans l'interaction de l'algorithme avec les alignements afin d'obtenir une meilleure performance.
| Numéro (Thèse ou Mémoire) : | MM0112020 | Président : | AANNIZ TARIK | Directeur : | IBRAHIMI AZEDDINE |
|