Formations

Gestion et manipulation de données OMICs

TYPE DE FORMATION : Inter-entreprise

Contexte

Depuis l’avènement des approches OMICs et NGS, le changement de volumes des données et les méthodes d’analyses imposent aux biologistes d’utiliser de plus en plus d’outils informatiques sur des clusters d’analyse. L’objectif de cette formation est de fournir les connaissances et pratiques nécessaires pour réaliser indépendamment ces analyses sur ces clusters (ou autres serveurs fonctionnant sous UNIX).

Objectifs

- Utiliser les outils systèmes natifs des clusters d’analyse

- Utiliser les systèmes de managements des clusters d’analyse (SLURM)

- Créer des scripts d’analyse ou de manipulation de données automatiquement

Programme

Cette formation, destinée aux biologistes de formation, apporte l’ensemble des connaissances pour être capable ensuite de gérer et manipuler de gros volumes de données. Dans les domaines OMICs, la plupart des analyses sont conduites sur des clusters de calcul, eux-mêmes fonctionnant sous UNIX. L’objectif principal de cette formation est de fournir l’ensemble des informations et connaissances sur l’utilisation de ces outils (cluster et systèmes UNIX) pour exposer la puissance de ces outils et surtout éviter les écueils auxquels sont confrontés les débutants.

Le premier chapitre détaille les principaux outils UNIX pour gérer des fichiers (copie, visionnage, extraction de lignes ou colonnes, etc.) ainsi que le principe de chaînage des opérations. Ensuite, le 2ème chapitre est consacré à l’utilisation d’un cluster de calcul (SLURM). Enfin, en dernier point, le dernier chapitre initie les apprenant(e)s à l’automatisation des tâches sous un environnement UNIX avec la réalisation de script pour effectuer des tâches automatiquement. A l’issue de la formation, les apprenant(e)s sont opérationnels pour travailler sous un environnement UNIX, connaissent le fonctionnement et l’utilisation d’un cluster de calcul, ont été initiés au développement de script d’automatisation (en BASH et AWK).

Moyens pédagogiques : l’ensemble de la formation est réalisé directement sur les serveurs d’enseignement et de formation avec un cluster privé de calcul.
+ support de cours, vadémécum UNIX.

Responsable(s)

Frédéric LECERF - Enseignant Chercheur

Public concerné

Tour public

Pré-requis

Aucun

Durée

2.0 jour(s) 14 heure(s)

Session(s)

Date à définir

Document non contractuel