En ligne
Description
L'apprentissage automatique et l'intelligence artificielle (IA) sont partout! Si vous voulez savoir comment les entreprises extraient le sens et les idées de vastes ensembles de données, ce cours de science des données vous donnera les bases dont vous avez besoin. La science de données est une carrière enrichissante qui vous permet de résoudre certains des problèmes les plus intéressants du monde!
Objectifs
Avec ce cours, les participants comprendront les techniques utilisées par de vrais scientifiques des données et des praticiens de l’apprentissage automatique dans l’industrie de la technologie pour résoudre de vrais problèmes d’affaires, et les préparera à entrer dans cette carrière passionnante. Voici quelques éléments de contenu traités dans la formation :
- Introduction à la programmation avec Python et R
- Décrire et exécuter le processus de fouille de données
- Appliquer une technique descriptive
- Appliquer une technique prédictive
- Décrire et exécuter des algorithmes de Machine Learning supervisé
- Décrire et exécuter des algorithmes de Machine Learning non supervisé
- Projet intégrateur en approche d’apprentissage non supervisé
- Introduire des réseaux de neurones artificiels avec Tensorflow et Keras
Clientèle cible
Analystes et administrateurs de bases de données, analystes et consultants en informatique, programmeurs et développeurs, ingénieurs informaticiens, techniciens en informatique, ainsi que toute personne qui a des connaissances en informatique (algorithmiques, bases de données, statistiques).
Préalables
Un niveau de connaissance de base en langage SQL et en algorithmique.
Matériel requis
Un ordinateur ( Windows, Linux ou Mac ) de 8 gigaoctets de RAM
Que vais-je apprendre?
À l’issue du cours, les participants seront en mesure d’effectuer les tâches suivantes :
• Explorer des données avec R et Python
• Utiliser des pandas Data Frames pour résoudre des tâches complexes
• Nettoyer des données d'entrées pour supprimer les valeurs aberrantes
• Prétraiter des variables contenant des données manquantes
• Nettoyer et transformer les ensembles de données pour une construction réussie de modèles d'apprentissage automatique
• Manipuler et transformer des variables numériques pour extraire le pouvoir le plus prédictif
• Appliquer différentes techniques de transformations et de variables pour rendre les fonctionnalités plus prévisibles
• Utiliser matplotlib et seaborn, ggplot2 pour la visualisation de données
• Utiliser plotly pour des visualisations interactives
• Faire des prédictions à l'aide d'une régression linéaire, d'une régression polynomiale et d'une régression multivariée
• Classer les données en utilisant la mise en cluster K-Means, les machines à vecteurs de support (SVM), KNN, les arbres de décision, Naive Bayes et PCA
• Utiliser Spark (MLLib) pour l'analyse de données volumineuses (Big Data)
• Implémenter des algorithmes d'apprentissage automatique
• Utiliser train / test et la validation croisée K-Fold pour choisir et ajuster vos modèles Comprendre à quoi ressemble la détérioration de modèle
• Appliquer trois niveaux de maintenance de modèle pour empêcher la détérioration de modèle
• Introduire des réseaux de neurones artificiels avec Tensorflow et Keras
Qui va m'accompagner?
Amor Amani
Monsieur Amor Amami est un scientifique de données/ ingénieur Big Data comptant plus de 13 ans d'expérience dans les technologies de l'information. Il possède les certifications: MSCE (Data management and Analytics), MCSA Machine Learning and data science, CCA Hadoop Administration Certification, Analyzing and Visualizing Data with Microsoft Power BI certification.
Il est motivé par la conviction que les données peuvent être utilisées pour prendre de meilleures décisions. Il veut pouvoir faciliter aux gens la compréhension du code et l’utilisation efficace des données.
Ainsi, il se démarque à travers les multiples facettes d'un schéma décisionnel, telles que la gestion des processus d'affaires, la collecte d'information (ETL), le stockage des informations (DW, Data Lake avec Hadoop) et la restitution des informations (Visualisation, Reporting, Machine Learning, Deep Learning). Ses formations et ses expériences professionnelles lui ont permis de maîtriser le domaine Big data (Écosystème Hadoop, distribution Cloudera et Horton Works) et la science de données (machine Learning, Deep Learning, Tensorflow,H2O,..). Il a réalisé plusieurs projets où il a exploré diverses facettes d’internet des objets, Big data et de la science des données.
Par ailleurs, il a travaillé pour de grands comptes au Québec-Canada et ailleurs comme CGI, Montréal, Revenu Québec, Familiprix (siège social), Société Groupe Magasin Général, Compagnie des mines (CPG), Bureau de Poste.
Dates et inscription
Aucun groupe n'est disponible pour le moment.
Il n'y a pas de période d'inscription active en ce moment ? Les dates ne vous conviennent pas ?
Liste d'attenteInformez-vous sur les possibilités d'inscription
Il n'y a pas de période d'inscription active en ce moment ? Les dates ne vous conviennent pas ?
Politique d'annulation
Les frais d'inscription seront remboursés en totalité, à condition d'annulation par écrit au minimum 72 heures avant la tenue du cours. Aucun remboursement, qu'il soit total ou partiel, ne sera accordé en deçà de 72 heures avant le début du cours et une fois le cours débuté.
Soyez informé(e) de nos prochaines formations selon vos champs d’intérêt.
Vérifiez si vous êtes admissible au tarif de Services Québec
Modes d'enseignement
Si votre formation a lieu en ligne
Vous aurez besoin de :
- Ordinateur avec Windows ou MAC
- Connexion internet de type haute vitesse
- Micro (obligatoire)
- Caméra Web (recommandée)
Veuillez noter que les cours ne sont pas enregistrés.