UNIX pour Biologistes : Maîtrisez UNIX et les analyses sur cluster pour la génomique
TYPE DE FORMATION : Inter-entreprise
Contexte
La formation Omic & NGS - Rennes - d'abord focalisée dans les années 2000 sur l'analyse des données à haut-débit issues des microarrays - est depuis plusieurs années centrée sur l'étude du transcriptome et de l'épigénome, au travers de modules focalisés sur le RNA-seq, le ChIP-seq, et sur l'interprétation biologique de listes de gènes d'intérêt, par le biais notamment de la construction de réseaux de gènes.
Cette formation annuelle à la carte se compose de 7 modules indépendants de 2 jours, vous permettant de construire de façon évolutive la formation la plus adaptée à vos besoins. 2 des 7 modules sont dédiés à l'initiation aux langages R et UNIX, permettant ainsi aux débutants d'acquérir les pré-requis nécessaires aux autres modules.
Objectifs
S'initier aux commandes de base indispensables pour la manipulation des gros fichiers générés par les nouvelles technologies de séquençage à haut débit.
Connaître les commandes permettant d'accéder à un serveur distant où se trouvent généralement les données d'intérêt.
Automatiser des traitements d'analyse et des notions avancées d'UNIX pour s'adapter aux différents environnements de travail
Programme
1. Initiation au système UNIX et aux principales commandes :
Le choix d'UNIX et ses particularités,
Principe de gestion de données,
Commandes essentielles à UNIX,
Traitements de fichiers : Savoir extraire ou supprimer des lignes ou des colonnes / Changer le format d'un fichier / Fusionner des données / Chercher des données dans un fichier / Rapide introduction à AWK.
2. Analyse sur un cluster de calcul :
Topologie d'un cluster,
Commandes essentielles,
Introduction à l'utilisation d'un cluster de calcul
3. Notions avancées d'UNIX :
Qu'est-ce qu'un SHELL ?
Notion de variables d'environnement,
Gestion des processus.
4. Automatisation :
Introduction aux scripts UNIX,
Les boucles de traitements,
Analyse massive sur un cluster.
Responsable(s)
Sandrine Lagarrigue
Frédéric Lecerf
Public concerné
Acteurs de la recherche et R&D (ingénieurs, techniciens, chercheurs, cliniciens, post-doctorants, doctorants, stagiaires...) des secteurs académique ou privé.
Toute personne souhaitant faire ses premiers pas dans le domaine ici abordé.
Pré-requis
Aucun
Module obligatoire pour toute personne n'ayant pas les pré-requis nécessaires pour suivre les modules : "RNA-seq : Analyse bio-informatique sous UNIX" et "ChIP-seq" et "ATAC-seq : analyses bio-informatique et statistique"
Durée
2.0 jour(s) 14 heure(s)
Informations particulières
Tarifs préférentiels pour les académiques, nous consulter.