Data Analytics avec Python

Prix

990.0 €

Durée

4j - 28h00

Data analytics est un terme pour exprimer les démarches d'analyse de données, afin d'être en mesure de prendre des décisions. Le langage Python dispose d'un écosystème permettant les traitements statistiques : de la construction de modèles d'analyse, à leur évaluation jusqu'à leur représentation.

Objectifs

Public concerné

Responsables Infocentre (datamining, marketing, qualité…), utilisateurs et gestionnaires métiers de bases de données.

Prérequis

Connaissances de base en Python. Connaissances de base en statistiques ou avoir suivi la formation "Statistiques, maîtriser les fondamentaux" (Réf. STA). Vérifiez que vous avez les prérequis nécessaires pour profiter pleinement de cette formation en faisant  ce test.

Programme

Introduction à la modélisation

Travaux pratiques

Installation de Python 3, d'Anaconda et de Jupiter Notebook.

Procédures d'évaluation de modèles

Travaux pratiques

Mise en place d'échantillonnage de jeux de donnes. Effectuer des tests d'évaluations sur plusieurs modèles fournis.

Les algorithmes supervisés

Travaux pratiques

Mise en œuvre des régressions et des classifications sur plusieurs types de données.

Les algorithmes non supervisés

Travaux pratiques

Traitements de clustering non supervisés sur plusieurs jeux de données.

Analyse en composantes

Travaux pratiques

Mise en œuvre de la diminution du nombre des variables et identification des facteurs sous-jacents des dimensions associées à une variabilité importante.

Analyse de données textuelles

Travaux pratiques

Explorer le contenu d'une base de textes en utilisant l'analyse sémantique latente.