Offers “Orange”

Expires soon Orange

Post Doc Natural Language Generation NLG F/H

  • CDD
  • Châtillon (Hauts-de-Seine)
  • IT development

Job description

about the role

Votre rôle est d'effectuer un travail de post-doc sur : «Génération d'une réponse en langage naturel".

Contexte :

Nous travaillons sur l'interprétation de questions exprimées en langage naturel pour interroger une base de connaissances afin de répondre à ces questions :

·  Un module de NLU (compréhension du langage) analyse le langage naturel de la question.
·  La sortie structurée de cette analyse est passée en entrée d'un module de raisonnement qui interroge en SPARQL la base de connaissances. Le module de raisonnement peut être amené à faire plusieurs appels à la base et à combiner les réponses de la base.
·  La sortie du module de raisonnement sert de réponse à la question posée. C'est soit un littéral (une chaine de caractères, une date, une valeur numérique, un booléen), soit une liste d'identifiants d'entités (dans le référentiel Wikidata.org).
·  Il manque la génération en langue naturelle de la réponse produite.

Les modules existants sont actuellement mis au point sur le français mais aucun obstacle technique ne nous interdit de travailler sur d'autres langues, notamment l'anglais.

L'objectif du post-doc n'est pas uniquement de lever un verrou mais aussi de mobiliser les savoirs scientifiques existants pour bâtir une solution fonctionnelle.

Approche méthodologique-planning

Dans un premier temps, la personne fera l'état des lieux des solutions existantes, dans la littérature et identifiera les technologies ou solutions les plus intéressantes, notamment des solutions qui s'appuient sur des approches du Machine Learning y compris Deep Learning.

Dans un deuxième temps, il sera demandé à la personne de produire un logiciel de génération:

·  Il prendra en entrée, le texte de la question. Si nécessaire, ce logiciel pourrait exploiter la sortie structurée du module NLU pour cette question.
·  Il prendra aussi en entrée la sortie du module de raisonnement.
·  Il pourrait exploiter la base Wikidata pour trouver les noms des entités.

En fin de période, est attendu d'un rapport d'étude sur les méthodes et outils développés lors de cette étude et sur leur évaluation.

about you

Vous avez un diplôme d'ingénieur ou master en informatique et une thèse de doctorat en Traitement Automatique du Langage Naturel.

Compétences (scientifiques et techniques) et qualités personnelles souhaitées pour le poste :

·  savoir-faire en traitement automatique des langues naturelles
·  une spécialisation en NLG ou traduction automatique et des connaissances en Machine Learning/Deep Learning seraient un plus
·  goût du travail en équipe
·  anglais scientifique courant

additional information

Vous intervenez dans le cadre d'un projet qui porte la majeure partie de la recherche en NLP du groupe Orange. Cette équipe établit un lien entre d'une part le monde scientifique et académique et d'autre part le monde industriel avec ses problématiques sur des données réelles.

Au sein de cette équipe, vous jouerez un rôle primordial en développant les savoirs et la montée en compétence sur le sujet du NLG.

department

Au sein d'Orange, l'équipe DESKIÑ mène les travaux de recherche et de développement dans le domaine du traitement automatique des langues naturelles (analyse sémantique, extraction d'informations, requêtes en langage naturel, etc, …). Au niveau recherche, elle rédige des publications, participe à des conférences, participe à des challenges. Au niveau développement, elle crée des outils et des solutions pour le groupe et en diffuse quelques-uns en open-source.

contract

Post Doc