Training

De BIGDATA
Aller à : navigation, rechercher


== Formation 

Introduction aux modèles statistiques scalables Modélisation, nouveaux paradigmes, écosystème “Big data” ==

Le cours se déroulera à l’IHP, le 5 décembre 2016 Salle 201(2 ième étage ) 11 rue Pierre et Marie Curie 75005 Paris. Accès : RER ligne B station : Luxembourg Bus : 21, 27, 38, 84, 85, 89

Formation proposée par le groupe DMA (Data Mining et Apprentissage) de la SFdS (Société Française de Statistique)


Cette formation est pour vous si …

Vous êtes un “data scientist” avec une expérience dans la modélisation des données, le data mining, l’apprentissage statistique, business intelligence, ou vous avez une expérience dans la chaîne de traitement traditionnel des données.

Vous êtes un ingénieur ayant une expérience dans les architectures et solutions Scala, Java, Python ou R et vous avez besoin d'intégrer les technologies évolutives dans l'architecture de votre entreprise

À la fin de cette formation, vous aurez une solide compréhension de:

Comment modéliser et développer des modèles statistiques scalables dans l'écosystème Big Data dans votre laboratoire ou en entreprise avec des outils qui vous permettront de se concentrer sur la phase modélisation Comment ingérer et traiter de multiples flux de données Comment construire une chaîne rigoureuse de traitement statistique de données massives


Formateurs Andy Petrella (@noootsab) is a mathematician turned into an entrepreneur in/with Data Science. Andy participated in many projects built on distributed technologies like spark, cassandra and mesos in various fields including Geospatial, IoT, Automotive and Smart cities projects. He is the creator of the Spark Notebook (https://github.com/andypetrella/spark-notebook), the only reactive and fully Scala notebook for Apache Spark. Xavier Tordoir and Andy founded Data Fellas (http://data-fellas.guru) building Adastik enabling Data-Driven Business by introducing agility and metalearning in data science processes. Andy is also member of program committee of the O’Reilly Strata, Scala eXchange and Data Science eXchange and Devoxx events.

Xavier Tordoir (@xtordoir) started his career as a researcher in experimental physics, focused on data processing. He took part in projects in finance, genomics, and software development for academic research, working on time series, prediction of biological molecular structures and interactions, and applied machine learning methodologies. He developed solutions to manage and process data distributed across data centers. Xavier founded and works at Data Fellas, a company dedicated to distributed computing and advanced analytics, leveraging Scala, Spark, and other distributed technologies.

Quelques références internationales de la formation http://www.oreilly.com/online-training/building-distributed-pipelines-for-data-science.html http://conferences.oreilly.com/strata/hadoop-big-data-eu/public/schedule/speaker/204775 http://cfp.devoxx.fr/2016/speaker/andy_petrella.html

Programme de la formation 9:00 Accueil café 9:30 - 11:00 : Introduction à Spark, Spark-Notebook, et l’écosystème Bigdata 11:00 - 12:00 : Apprentissage automatique local vs massivement distribué (scalable) 12-13h déjeuner 13:00 - 13:30 : Scala et Data Science 13:30 - 14:30 : De RDD à Dataset par DataFrame 14:30 - 15:30 : Streaming: du Micro Batching au Structured Stream 15:30 - 16:30 : Écrire un programme en apprentissage distribué 17h30 : Discussion clôture

Organisateurs Christophe Biernacki, Université Lille1 - INRIA Mustapha Lebbah, LIPN, Université Paris 13

Secretaire Tél : (33) 01 44 27 66 60 e-mail : servane.bianciardi@ihp.fr Site internet : http://www.sfds.asso.fr



Conditions La formation s’adresse uniquement aux membres de la SFdS. Les non membres de l’association doivent s’acquitter de leur adhésion pour l’année en cours pour pouvoir participer aux formations. Merci dans ce cas de prendre contact avec le secrétariat. Afin d'assurer une plus grande convivialité à la formation et de favoriser les échanges entre les participants, le nombre de places est limité à 20.

Droits d'inscription au cours Tarif entreprise  : 600 euros Tarif universitaire: 300 euros

Date limite d’inscription 15 octobre

Votre inscription ne sera définitive qu’à réception du règlement ou d’un bon de commande et la confirmation de celle-ci vous sera demandée le 1er jour de la formation.

Lien d’inscription

Les droits d'inscription au cours comprennent : - la participation à la formation - les documents électroniques - les pauses café - les repas du midi.

Annulation Le remboursement des droits d'inscription sera possible sur demande écrite transmise avant le 5 novembre 2016 et donnera lieu à une retenue de 50% pour frais. Aucun remboursement ne sera effectué après

Modalités de règlement Le règlement des droits d'inscription à la formation peut se faire par :

chèque bancaire ou chèque postal émis sur une banque française, libellé à l'ordre de : Société Française de Statistique

virement bancaire : Titulaire du compte : Domiciliation : SG Paris Saint Michel Code banque : 30003 ; Code guichet : 03085 N° de compte : 00037295058 ; Clé RIB : 01 Numéro d'enregistrement Formation Continue : La SFdS n’est pas assujettie à TVA Société Française de Statistique 11 75 53626 75