Stage - Apprentissage actif sur données transactionnelles F/H
Stage Châtillon (Hauts-de-Seine) Études / Statistiques / Data
Description de l'offre
about the role
Le contexte général du stage est l'utilisation de l'apprentissage actif sur des données transactionnelles. L'apprentissage actif [1] est un modèle d'apprentissage semi-supervisé où un oracle intervient au cours du processus. Plus précisément, contrairement au cadre classique où les données sont connues et imposées, en apprentissage actif, c'est l'algorithme d'apprentissage qui demande des informations pour des données précises. Dans le cadre du stage les exemples sont connus ce sont les étiquettes des exemples que peut demander l'oracle ; ceci afin d'améliorer les performances du classifieur.
Le stage consiste à répondre dans un premier temps à une question : dans le cas d'apprentissage actif sur des données transactionnelles, est-il préférable d'utiliser une méthode experte, une méthode « deep » ou une méthode itérative de construction de représentation à partir des données ?
Pour ce faire une étude « benchmark » sera menée sur des données transactionnelles publiquement disponibles ou propriétaires d'Orange. Ensuite suivant le temps passé et les conclusions obtenues l'équipe et/ou l'étudiant pourront étudier des pistes d'améliorations ou d'adaptation des méthodes existantes de la littérature. Par exemple l'utilisation de bandit manchots pour le choix de la méthode optimale.
[1] “Active Learning Literature Survey. : A Computer Sciences Technical Report”, Burr Settles, University of Wisconsin-Madison, 2009
about you
Vous êtes étudiant-e en Bac+ 5, Master Industriel (ou recherche) informatique et/ou statistiques ou école d'ingénieur.
Les connaissances en Python, pandas et Scikit-learn sont indispensables, la connaissance de Tensorflow ou PyTorch est préférable. (Julia/Flux et Scala/dl4j sont aussi acceptés).
Des connaissances minimales en statistiques, mathématiques et/ou apprentissage statistique sont indispensables.
Vous avez un intérêt pour les aspects applicatifs et théoriques du sujet.
Vous savez être autonome et rigoureux(se), votre curiosité et votre sens de la communication vous serviront au quotidien pour ce stage.
additional information
Venez découvrir le monde de l'innovation chez Orange au sein d'une équipe à taille humaine.
department
Au sein des Orange Labs et de la direction « Data Intelligence Enablers et Software Environment » (DIESE), le département « Data Intelligence et Algorithms» concentre l'expertise et le savoir-faire dans l'extraction de connaissances à partir des données.
Il fournit des outils et des algorithmes basés sur des techniques d'analyse prédictive.
Le département intervient en amont en explorant et développant de nouvelles techniques et de nouveaux cas d'usage nécessitant le traitement de données de tout type via ses activités de recherche. Il intervient également en support aux projets des différentes entités (filiales, métiers …).
contract
Internship
Duration : 6 months
Level : Master 2, Master 1