Accueil>
Formations>
Data Science – Deep learning>
PYTHON Data Scientist avec Python

Résultats pour {phrase} ({results_count} de{results_count_total})

Displaying {results_count} results of {results_count_total}

Generic filters

Formation PYTHON Data Scientist avec Python

Domaine : Data Science – Deep learning

DURÉE
5 jour(s)

OBJECTIFS

Savoir mettre en place un DataLake et un DataMart en SQL ou big data, puis une stratégie de Machine Learning en Python afin de créer le modèle le plus satisfaisant possible en le mesurant et en affichant les résultats, le tout en utilisant des algorithmes performants.

Pré-requis

Maîtriser l’algorithmique, avoir une appétence pour les mathématiques. La connaissance de Python et des statistiques est un plus.

Participants

Développeur, chef de projets proche du développement, ingénieur scientifique sachant coder.

coût

Formation en cours collectif

Nous contacter pour une formation sur mesure ou en intra

programme

Télécharger le plan de cours

Consulter le plan de cours

LIEUx de formation

Notre centre de formation à Grenoble Notre centre de formation à Moirans Notre centre de formation à Sophia Antipolis

Sur votre site en formation intraEn classe distancielle

PROGRAMME DE FORMATION
PYTHON Data Scientist avec Python

Introduction aux Data Sciences

Qu'est-ce que Python ?
Qu'est que le Machine Learning ?
Apprentissage supervisÃ© vs non supervisÃ©
Les statistiques
La randomisation
La loi normale

Introduction Ã Python pour les Data Science

Les listes en intention
Les listes
Les tuples
Les dictionnaires
Les modules et packages
L'orientÃ© objet
Le module math
Les expressions lambda
Map, reduce et filter
Le module CSV
Les modules DB-API 2
Anaconda

Introduction aux DataLake, DataMart et DataWharehouse

Qu'est-ce qu'un DataLake ?
Les diffÃ©rents types de DataLake
Le Big Data
Qu'est-ce qu'un DataWharehouse ?
Qu'est qu'un DataMart ?
Mise en place d'un DataMart
Les fichiers
Les bases de donnÃ©es SQL
Les bases de donnÃ©es No-SQL

Python Package Installer

Utilisation de PIP
Installation de package PIP
PyPi

MatPlotLib

Utilisation de la bibliothÃ¨que scientifique de graphes MatPlotLib
Affichage de donnÃ©es dans un graphique 2D
Affichages de sous-graphes
Affichage de polynÃ´mes et de sinusoÃ¯dales

Machine Learning

Filtrage
Qu'est qu'un modÃ¨le et un dataset
Qu'est qu'une rÃ©gression
Les diffÃ©rents types de rÃ©gression
La rÃ©gression linÃ©aire
Gestion du risque et des erreurs
Quarter d'Ascombe
Trouver le bon modÃ¨le
La classification
Loi normale, variance et Ã©cart type
Apprentissage
Mesure de la performance
No Fee Lunch

La rÃ©gression linÃ©aire en Python

Programmer une rÃ©gression linÃ©aire en Python
Utilisation des expressions lambda et des listes en intention
Afficher la rÃ©gression avec MatPlotLib
L'erreur quadratique
La variance
Le risque

Le Big Data

Qu'est-ce que Apache Hadoop ?
Qu'est-ce que l'informatique distribuÃ© ?
Installation et configuration de Hadoop
HDFS
CrÃ©ation d'un datanode
CrÃ©ation d'un namenode distribuÃ©
Manipulation de HDFS
Hadoop comme DataLake
Map Reduce
Hive
Hadoop comme DataMart
Python HDFS

Les bases de donnÃ©es NoSql

Les bases de donnÃ©es structurÃ©es
SQL avec SQLite et Postgresql
Les bases de donnÃ©es non ACID
JSON
MongoDB
Cassandra, Redis, CouchDb
MongoDB sur HDFS
MongoDB comme DataMart
PyMongo

Numpy et SciPy

Les tableaux et les matrices
L'algÃ¨bre linÃ©aire avec Numpy
La rÃ©gression linÃ©aire SciPy
Le produit et la transposÃ©e
L'inversion de matrice
Les nombres complexes
L'algÃ¨bre complexe
Les transformÃ©es de Fourier
Numpy et Matplotlib

ScikitLearn

Le machine Learning avec SKLearn
La rÃ©gression linÃ©aire
La crÃ©ation du modÃ¨le
L'Ã©chantillonnage
La randomisation
L'apprentissage avec fit
La prÃ©diction du modÃ¨le
Les metrics
Choix du modÃ¨le
PreProcessing et Pipeline
RÃ©gressions non polynomiales

Nearest Neighbors

Algorithme des k plus proches voisins (k-NN)
ModÃ¨le de classification
K-NN avec SciKitLearn
Choix du meilleur k
SÃ©rialisation du modÃ¨le
Variance vs Erreurs
Autres modÃ¨les : SVN, Random Forest

Pandas

L'analyse des donnÃ©es avec Pandas
Les Series
Les DataFrames
La thÃ©orie ensembliste avec Pandas
L'importation des donnÃ©es CSV
L'importation de donnÃ©es SQL
L'importation de donnÃ©es MongoDB
Pandas et SKLearn

Le Clustering

Regroupement des donnÃ©es par clusterisation
Les clusters SKLearn avec k-means
Autres modÃ¨les de clusterisation : AffinityPropagation, MeanShift, ...
L'apprentissage semi-supervisÃ©

Jupyter

Python Yield

La programmation efficace en Python
Le gÃ©nÃ©rateurs et itÃ©rateurs
Le Yield return
Le Yield avec Db-API 2, Pandas et Sklearn

Le perceptron
Les rÃ©seaux neuronaux
Les rÃ©seaux neuronaux supervisÃ©s
Les rÃ©seaux neuronaux semi-supervisÃ©s
Les rÃ©seaux neuronaux par Hadoop Yarn
Les heuristiques
Le deep learning

dates des formations a grenoble

Formation sur mesure, nous contacter
Intra

dates des formations a SOPHIA ANTIPOLIS

Formation sur mesure, nous contacter
Intra

Cursus formation

Introduction à la Programmation Orientée Objet
PYTHON Perfectionnement
PYTHON Introduction au langage Python
Introduction à la Programmation Orientée Objet

Formations de la même thématique

IA : Machine Learning et Deep Learning avec Python

nos centres de formation

Meylan
3 salles de formation

Moirans
3 salles de formation

Sophia Antipolis
3 salles de formation

Formation PYTHON Data Scientist avec Python

Participants

coût

programme

PROGRAMME DE FORMATION PYTHON Data Scientist avec Python

PROGRAMME DE FORMATION
PYTHON Data Scientist avec Python