PÔLE ANALYSE de DONNÉES

 

Formation

Ateliers Cluster

Prochaines séances: niveau 1 le lundi 13 janvier (9h-12h) et niveau 2 le mercredi 15 janvier (9h-12h)

PCIA organise une formation à l'utilisation du cluster de calcul composée de deux modules  :

Niveau 1:  Les bases de l'utilisation d'un cluster.

Ce module permet aux personnes sans aucune connaissance de l'utilisation d'un serveur Linux à distance d'effectuer les actions de base nécessaires à l'utilisation du cluster :

  • Se connecter au cluster avec un client SSH et y transférer ses fichiers
  • Utiliser les commandes UNIX de base
  • Éditer des fichiers texte et exécuter des scripts.

Niveau 2: Travailler avec le cluster PCIA.

Il s'adresse aux personnes ayant suivi le niveau 1 ainsi qu'à celles travaillant déjà sous Linux ou ayant déjà utilisé un autre calculateur Unix :

  • Description du cluster
  • Le gestionnaire de ressources SLURM
  • L'utilisation des modules

Ateliers Imagerie numérique

Prochaines séances: niveau 1 le jeudi 28 janvier 2021 (9h-12h et 14h-17h) et niveau 2 le vendredi 29 janvier 2021 (9h-12h et 14h-17h) en distanciel (avec Microsoft Teams)

  • Niveau 1:  Les bases de l'imagerie numérique.

Cette formation vise à familiariser les participants avec la manipulation et le traitement d'images numériques. Description théorique de l'information contenue dans une image numérique : notions de pixel, de résolution, de calibration, de contraste, description des différents formats... Améliorer la visualisation : notions d'histogramme, de seuillage, de fausses couleurs... Transformer les images : changement d'échelle, transformations géométriques, binarisation, conversion...

  • Niveau 2 : Utilisation avancée d'ImageJ.

Cette formation vise à présenter des fonctionnalités avancées du logiciel ImageJ pour l'analyse d'images numériques. Correction d'images : filtrage, rehaussement de contours... Mesures et analyses d'objets : quantification, gestion de régions d'intérêt Visualisation et gestion des piles d'images : images 3D (stacks), images multi-canaux (hyperstacks) Installation et utilisation des macros et des plugins.

Ateliers Génétique et Génomique

Introduction aux données génomiques

Date : 7/02/2022 (9h30-16h)

Modalités  : présentiel ou visio (En raison de la situation actuelle de la pandémie, le format de l'atelier vous sera communiqué avant l'atelier)

Description: Cet atelier présente un aperçu théorique des technologies de séquençage à haut débit, les types de données qui en résultent ainsi que leurs applications en génomiques, métagénomique, transcriptomique, épigénétique, phylogénie, etc.

Pré-requis: Aucun

Remarque : Ce cours sera donné en français ou en anglais. 

 

Les pools d'amplicons du SSM : conseils pour le démultiplexage et l'assemblage de ces séquences avec GENEIOUS

Date : 10/02/2022 (9h30-16h)

Modalités  : présentiel ou visio (En raison de la situation actuelle de la pandémie, le format de l'atelier vous sera communiqué avant l'atelier). Des licences GENEIOUS temporaires seront fournies.

Description: Bien que plus large, cet atelier correspond plus particulièrement à l’analyse de données brutes produites dans le cadre des séquençages réguliers de « pools d’amplicons » proposés par le SSM (Service de Systématique Moléculaire, UAR 2700) et est piloté par Agnès Dettaï (MC, ISYEB)
Une première partie (9h30h-12h environ) présentera le séquençage, l'assemblage, et la vérification d'amplicons "tout-venant" : amplicons relativement courts de gènes mitochondriaux, nucléaires, etc.
La deuxième partie (à partir de 13h30) se concentrera sur les mitogénomes et les séquences longues incluant plusieurs marqueurs, et leurs problèmes particuliers.
Si vous n'avez jamais participé aux pools amplicons, ceux-ci : 
- permettent une première approche des données NGS, avec possibilité de petites quantités de données et un coût très bas pour quelques tests (séquençage 10 PCRs de 1000pb = 12 euros)
- permettent de remplacer le séquençage Sanger dans de nombreux cas, pour un coût moindre (3-4 fois moindre)
- sont très efficaces pour des tests de marqueurs, d'amorces, de PCRs (possibilité de séquencer des produits de PCR faibles, multibandes...)
- permettent de séquencer des produits complexes (allèles divergents, mélange de 2-3 produits)
- permettent de séquencer directement des PCRs longues (séquençage d'un génome mitochondrial complet en 3 PCRs de 7000 pb par exemple; nous avons a votre disposition des protocoles pour réaliser celles-ci)
- ne nécessitent pas forcément de faire des PCRs spécifiques (cela peut être intéressant dans certains cas, mais il est tout à fait possible de séquencer la plupart de vos PCRs "habituelles"), à quelques exceptions près. 

Pré-requis: Aucun

 

Initiation à la plateforme d’analyse GALAXY

Date : 11/02/2022 (9h30-16h)

Modalités  : présentiel ou visio (En raison de la situation actuelle de la pandémie, le format de l'atelier vous sera communiqué avant l'atelier)

Description: GALAXY est une plateforme avec interface web intégrant de nombreux outils bioinformatiques, orientée vers la génomique (mais pas seulement !...). Elle permet de créer et de partager des procédures d'analyses à travers un environnement libre, assez intuitif et modulable.
Plus d'informations sur  https://galaxyproject.org/
Les participants seront familiarisés avec l'environnement de travail GALAXY, ses principes et son fonctionnement. Ils seront capables de transférer leurs données, de lancer des outils d'analyses individuellement ainsi que de les organiser en "pipeline".

Pré-requis: Aucun

 

Linux et la ligne de commande partie I

Date : 17/02/2022 (9h30-16h)

Modalités  : présentiel ou visio (En raison de la situation actuelle de la pandémie, le format de l'atelier vous sera communiqué avant l'atelier)

Description: Cet atelier a pour but d'introduire les concepts minimums pour travailler sous Linux. Il vous permettra de vous familiariser avec l’environnement de travail Linux et la ligne de commande (arborescence de fichier Linux, BASH, travail sur serveur distant…). 
Bien que la plupart des exercices soient basés sur des données biologiques, ce cours ne sera pas axé sur la manière d'analyser les données mais sur l'environnement de travail en général.

Pré-requis: Aucun

Remarque : Ce cours sera donné en français ou en anglais. 

 

Linux et la ligne de commande partie II

Date : 18/02/2022 (9h30-16h)

Modalités  : présentiel ou visio (En raison de la situation actuelle de la pandémie, le format de l'atelier vous sera communiqué avant l'atelier)

Description: L'objectif de ce cours est de faire de vous un utilisateur avancé de Linux. Ce cours couvrira plusieurs problèmes courants sur les systèmes unix : recherche de fichiers, filtrage, tri des résultats, remplacement de motifs et script. 

Pré-requis: Les participants doivent avoir une connaissance de base de Linux (équivalent au cours "Linux et la ligne de commande partie I").

Remarque : Ce cours sera donné en français ou en anglais. 

Introduction aux analyses RAD-Seq

Date : 22/02/2022 (9h30-16h)

Modalités  : présentiel ou visio (En raison de la situation actuelle de la pandémie, le format de l'atelier vous sera communiqué avant l'atelier)

Description: L'approche RADseq est un choix récurrent pour l'obtention de données génomiques comparatives quand on ne dispose pas de référence, aussi bien pour des études intra/péri-spécifiques que pour des études inter-spécifiques pour des temps de divergence raisonnables.
Cette journée a pour but de reprendre les bases théoriques de l'approche et de ses mises en œuvre possibles d'un point de vue expérimental. Les différents protocoles de génération de banques RAD seront abordés. En ce qui concerne l'analyse de données RAD, un bilan des différents pipelines sera réalisé et les participants seront amenés à appliquer les pipelines choisis sur des jeux de données qui leur seront fournis.

Pré-requis: Les participants doivent avoir une connaissance de base d'unix (équivalent au cours "Linux et la ligne de commande partie I").

 

Programmation avec Python

Date : 24-25/02/2022 (9h30-16h)

Modalités  : présentiel ou visio (En raison de la situation actuelle de la pandémie, le format de l'atelier vous sera communiqué avant l'atelier)

Description: Cet atelier présente les bases de la programmation avec Python, actuellement l’un des plus populaires langages de programmation. Expressions, variables, fonctions, instructions conditionnelles, opérations sur les séquences, listes, instructions répétitives, scripts et règles de bonnes pratiques seront abordés.

Pré-requis: Aucun

Ateliers Statistiques sous R

Les ateliers ont pour vocation de présenter pas à pas l’utilisation de statistiques avec le logiciel R. Chaque atelier se déroulera sur une journée maximum et sont ouverts à tout le personnel du MNHN (chercheurs, IT, étudiants…). Ce sera l’occasion pour les participants d’échanger et d’apporter un cas concret.

Suite au contexte sanitaire, les ateliers seront effectués à distance via un lien Teams qui vous sera communiqué après inscription.

  • Atelier Initiation à R : prochaines sessions le 23 février et le 15 mars 2022
    - Importation de données
    - Les variables
    - La manipulation d'objets
    - Les graphiques avec la fonction plot() et le package ggplot2
     
  • Atelier introduction au package tidyverse (NEW !) : prochaine session le 16 mars 2022
    - L'importation de données
    - La manipulation de données avec le package dplyr
    - Les graphiques avec le package ggplot2
     
  • Atelier Statistiques descriptives et visualisation de données sous R : prochaine session le 15 février 2022
    - Indicateurs de position et de dispersion d’une série statistique
    - Variable quantitative : description et représentation graphique
    - Variable qualitative : description et représentation graphique
    - Statistiques descriptives bivariées
    - Quelques graphiques avec le package ggplot2
    - Pour aller plus loin : l'analyse en composantes principales (ACP)
  • Atelier Quelques tests statistiques sous R : prochaine session le 16 février 2022
    - Principe du test statistique
    - Tester la normalité et l'homogénéité des variances
    - Quelques tests paramétriques
    - L'ANOVA à un facteur
    - Quelques tests non paramétriques
    - Introduction aux tests de permutation