PÔLE ANALYSE de DONNÉES

 

Formation

Ateliers Cluster

Prochaines séances: niveau 1 le lundi 13 janvier (9h-12h) et niveau 2 le mercredi 15 janvier (9h-12h)

PCIA organise une formation à l'utilisation du cluster de calcul composée de deux modules  :

Niveau 1:  Les bases de l'utilisation d'un cluster.

Ce module permet aux personnes sans aucune connaissance de l'utilisation d'un serveur Linux à distance d'effectuer les actions de base nécessaires à l'utilisation du cluster :

  • Se connecter au cluster avec un client SSH et y transférer ses fichiers
  • Utiliser les commandes UNIX de base
  • Éditer des fichiers texte et exécuter des scripts.

Niveau 2: Travailler avec le cluster PCIA.

Il s'adresse aux personnes ayant suivi le niveau 1 ainsi qu'à celles travaillant déjà sous Linux ou ayant déjà utilisé un autre calculateur Unix :

  • Description du cluster
  • Le gestionnaire de ressources SLURM
  • L'utilisation des modules

Ateliers Imagerie numérique

Prochaines séances: niveau 1 le jeudi 28 janvier 2021 (9h-12h et 14h-17h) et niveau 2 le vendredi 29 janvier 2021 (9h-12h et 14h-17h) en distanciel (avec Microsoft Teams)

  • Niveau 1:  Les bases de l'imagerie numérique.

Cette formation vise à familiariser les participants avec la manipulation et le traitement d'images numériques. Description théorique de l'information contenue dans une image numérique : notions de pixel, de résolution, de calibration, de contraste, description des différents formats... Améliorer la visualisation : notions d'histogramme, de seuillage, de fausses couleurs... Transformer les images : changement d'échelle, transformations géométriques, binarisation, conversion...

  • Niveau 2 : Utilisation avancée d'ImageJ.

Cette formation vise à présenter des fonctionnalités avancées du logiciel ImageJ pour l'analyse d'images numériques. Correction d'images : filtrage, rehaussement de contours... Mesures et analyses d'objets : quantification, gestion de régions d'intérêt Visualisation et gestion des piles d'images : images 3D (stacks), images multi-canaux (hyperstacks) Installation et utilisation des macros et des plugins.

Ateliers Génétique et Génomique

Les pools d'amplicons du SSM : conseils pour le démultiplexage et l'assemblage de ces séquences avec GENEIOUS
24 février 2021, 9h30 à 16h

Bien que plus large, cet atelier correspond plus particulièrement à l’analyse de données brutes produites dans le cadre des séquençages réguliers de « pools d’amplicons » proposés par le SSM (Service de Systématique Moléculaire, UMS 2700) et est piloté par Agnès Dettaï (MC, ISYEB)
Une première partie (10h-12h environ) présentera le séquençage, l'assemblage, et la vérification d'amplicons "tout-venant" : amplicons relativement courts de gènes mitochondriaux, nucléaires, etc.
La deuxième partie (à partir de 14h) se concentrera sur les mitogénomes et les séquences longues incluant plusieurs marqueurs, et leurs problèmes particuliers. En fonction de vos connaissances/ attentes, vous pouvez donc ne venir qu'à la demie-journée qui vous intéresse!
Prérequis : Aucun

 

Introduction aux données génomiques
29 mars 2021, 9h00-16h00

Cet atelier présente un aperçu théorique des technologies de séquençage à haut débit et leurs applications en génomiques. Métagénomique, transcriptomique, épigénétique, phylogénie, etc.
Prérequis: Aucun

 

Initiation à la plateforme d’analyse « GALAXY »

31 mars 2021, 9h00-16h00

GALAXY est une plateforme avec interface web intégrant de nombreux outils bioinformatiques, orientée vers la génomique (mais pas seulement !...). Elle permet de créer et de partager des procédures d'analyses à travers un environnement libre, assez intuitif et modulable.
Plus d'informations sur https://galaxyproject.org/
Les participants seront familiarisés avec l'environnement de travail GALAXY, ses principes et son fonctionnement. Ils seront capables de transférer leurs données, de lancer des outils d'analyses individuellement ainsi que de les organiser en "pipeline".
Prérequis: Aucun

 

Initiation à Linux et à la ligne de commande
6 avril 2021, 9h00-16h00

Cet atelier à pour but de vous familiariser avec l’environnement de travail LINUX et la ligne de commande (arborescence de fichier Linux, BASH, travail sur serveur distant…). Bien que cet atelier soit pertinent quel que soit votre domaine de travail, les exemples seront orientés vers l’analyse de données génomiques.
Prérequis: Aucun

 

Introduction aux analyses RAD-Seq

8 avril 2021, 9h00-16h00

L'approche RADseq est aujourd'hui un choix récurrent, aussi bien pour des études intra/péri-spécifiques que pour des études inter-spécifiques pour des temps de divergence raisonnables.
Cette journée a pour but de reprendre les bases théoriques de l'approche et de ses mises en œuvre possibles d'un point de vue expérimental. Les différents protocoles de génération de banques RAD seront abordés. En ce qui concerne l'analyse de données RAD, un bilan des différents pipelines sera réalisé et les participants seront amenés à appliquer les pipelines choisis sur des jeux de données qui leur seront fournis.
Prérequis: <<Initiation à Linux>> ou connaissances de Linux. Conseillé: <<Introduction aux données génomique>> ou connaissances basiques de RAD-Seq.

 

Programmation avec Python pour débutants
12-14 avril 2021, 9h00-16h00

Cet atelier présente les bases de la programmation avec Python, actuellement l’un des plus populaires langages de programmation. Expressions, variables, fonctions, instructions conditionnelles, opérations sur les séquences, listes, instructions répétitives, scripts, règles de bonnes pratiques.
Prérequis: Aucune

Ateliers Statistiques sous R

Les ateliers ont pour vocation de présenter pas à pas l’utilisation de statistiques avec le logiciel R. Chaque atelier se déroulera sur une journée maximum ou 1/2 journée et sont ouverts à tout le personnel du MNHN (chercheurs, IT, étudiants…). Ce sera l’occasion pour les participants d’échanger et d’apporter un cas concret.

Suite au contexte sanitaire, les ateliers seront effectués à distance via un lien Teams qui vous sera communiqué après inscription. Chaque session sera limitée à 10 participants maximum.

  • Atelier Initiation à R : session 1 le 2 février 2021 et session 2 le 3 février 2021
    Importation de données, variables, manipulation d'objets, graphiques ...
     
  • Atelier Statistiques descriptives sous R : prochaine session le 9 février 2021 (matin)
  • Indicateurs de position et de dispersion d’une série statistique
    Variable quantitative : description et représentation graphique
    Variable qualitative : description et représentation graphique
    Statistiques descriptives bivariées
    Quelques graphiques avec le package ggplot2
  • Atelier Initiation aux modèles mixtes et aux modèles linéaires généralisés : le 24 septembre 2020
    - Rappels
    - Modèles linéaires généralisés
    - Modèles linéaires mixtes
    - Modèles linéaires généralisés mixtes
  • Atelier Quelques tests statistiques sous R : le 11 mars 2021
    Principe du test statistique
    Quelques tests paramétriques (comparaison de moyennes : le test de Student, le test du khi2)
    Quelques tests non paramétriques (comparaison de médianes, test exact de Fisher)