Paris NLP Season 3 Meetup #1 @Xebia

Thanks to our host : Xebia

Guillaume Lample, FAIR [Talk in English]
Unsupervised machine translation

Machine translation (MT) has achieved impressive results recently, thanks to recent advances in deep learning and the availability of large-scale parallel corpora. Yet, their effectiveness strongly relies on the availability of large amounts of parallel sentences, which hinders their applicability to the majority of language pairs.

Previous studies have shown that monolingual data — widely available in most languages — can be used to improve the performance of MT systems. However, these were used to augment, rather than replace, parallel corpora.

In this talk, I will present our recent research on Unsupervised Machine Translation, where we show that it is possible to train MT systems in a fully unsupervised setting, without the need of any cross-lingual dictionary or parallel resources whatsoever, but with access only to large monolingual corpora in each language. Beyond translating languages for which there is no parallel data, our method could potentially be used to decipher unknown languages.

Talk_Meetup_NLP_Guillaume_Lample

Thomas Wolf, Hugging Face [Talk in English]
Neural networks based dialog agents: going beyond the seq2seq model

I will present a summary of the technical tools behind our submission to the Conversational Intelligence Challenge 2 which is part of NIPS 2018 (convai.io).

This challenge tests how a dialog agent can incorporate personality as well as common sense reasoning in a free-form setting.

Our submission is leading the leaderboard topping all tested metrics with a significant margin over the second top model.

These strong improvements are obtained by an innovative use of transfert learning, data augmentation technics and multi-task learning in a non-seq2seq architecture.

Hugging Face Slides

Advertisements

Paris NLP Meetup #6 Season 2 @ LinkValue

You can find the video of the meetup here : https://www.youtube.com/watch?v=sIX8AxMe_bU

[Talk in English] Guillaume Barrois – Liegey Muller Pons
LMP is a technology company that develops tool to understand public opinion at a very local scale. This talk will present exemples of analysis that we apply to original textual data sources, in order to extract the dynamics and features of the opinion on a given territory.

meetup_nlp_liegey_muller_pons

[Talk in French] Ismael Belghiti – Hiresweet

HireSweet permet aux entreprises de recruter les meilleurs ingénieurs
en développant un moteur de recommandation classant des profils à partir d’une offre d’emploi. Ce talk présentera comment différentes techniques de NLP peuvent être appliquées pour calculer un score de matching entre un profil et une offre, en comparant leur performance sur une métrique de ranking dédiée.

meetup_nlp_hiresweet

• [Talk in English] Gil Katz earned his PhD in Information Theory from CentralSupélec in 2017. Today he is a senior data scientist in SAP Conversational AI (previously Recast.AI), based in Paris.

Unsupervised Learning and Word Embeddings

The field of Machine Learning can be divided into two main branches – supervised and unsupervised learning. While examples for applications of supervised learning are easy to come by, the power of unsupervised learning is less intuitive. In this talk, we will use the problem of representing words as a case study. The limitations of simple one-hot encoding will be discussed before describing the modern method of embedding words in a vector space of real numbers. After comparing several approaches, current advances and future challenges will be discussed.

meetup_nlp_recast

Paris NLP Meetup #5 Season 2 @ Snips

  • Adrien Ball, Snips

An Introduction to Snips NLU, the Open Source Library behind Snips Voice Platform

Integrating a voice or chatbot interface into a product used to require a Natural Language Understanding cloud service. Snips NLU is a Private by Design NLU engine. It can run on the edge or on a server, with minimal footprint, while performing as good or better than cloud solutions.

2018_05_NLP_meetup_snips

  • Jérôme Dockes, INRIA

Mapping neuroimaging text reports to spatial distributions over the brain.

We learn the statistical link between anatomical terms and spatial coordinates extracted from the neuroscience literature. This allows us to associate brain images with fragments of text which describe neuroimaging observations. Accessing the unstructured spatial information contained in such reports offers new possibilities for meta-analysis.

2018_05_NLP_meetup_inria

  • Charles Borderie, Victor de la Salmonière et Marian Szczesniak, Lettria

LETTRIA développe des outils de Traitement du Langage exclusivement dédiés à la compréhension du Français. L’accent est mis sur la facilité d’utilisation, la performance et l’appréciation du réel sens des mots.

2018_05_NLP_meetup_Lettria

Paris NLP Meetup #4 Season 2 @ Critéo

Arnaud DELAUNAY et Daoud CHAMI, LinkValue
NLP as a pricing tool ?
Deep Learning on text data for Regression problems

2018_03_NLP_meetup_linkvalue

Pierre-Emmanuel Mazaré, Facebook (FAIR)
In this talk, we’ll present DrQA, our architecture for question answering. We test it in various settings and show its value both on closed domain tasks such as SQuAD and in an open-domain setup that has access to all wikipedia text.

2018_03_NLP_meetup_facebook

Sacha VAKILI, Doctrine
Natural Language Processing for Legal Applications

2018_03_NLP_meetup_doctrine

 

Cinquième Paris NLP Meetup @ Dataiku

La cinquième édition du meetup a été accueilli le 24 Mai par Dataiku, qu’on remercie chaleureusement.

Au programme de la soirée, 2 talks cette fois:

  • Karl Neuberger (Partner @ Quantmetry) – Antoine Simoulin (Data Scientist @ Quantmetry) nous on présenté le projet Senometry: Analyse de dossiers médicaux textuels pour l’extraction de données structurées que Quantmetry a mené en collaboration avec l’unité de Sénologie du CHRU de Strasbourg (unité de traitement des maladies du sein) pour la mise en place d’une méthodologie d’extraction et de structuration automatisée de données textuelles anonymisées issues des dossiers de patientes traitées pour un cancer du sein.
  • Damien Nouvel (chercheur @ Inalco) nous a introduit la problématique de la désambiguïsation lexicale de manière générale et pour plusieurs langues, puis nous a décrit les méthodes généralement utilisées pour réaliser cette tâche pour enfin illustrer ces méthodes pour la reconnaissance et la résolution des entités nommées en français.

On remercie nos speakers encore une fois ainsi que notre hôte Dataiku et on vous donne rendez-vous à la prochaine édition qui aura lieu le 26 Juillet.

Quatrième Paris NLP Meetup à l’école 42

L’école 42 nous a accueilli le 22 mars pour cette quatrième édition du Paris NLP meetup, où 80 personnes ont pu assister aux 3 talks de la soirée.

  • Paul Renvoisé (Cofondateur @ Recast.ai) Recast.ai est une plateforme de construction et d’entrainement de chatbot collaborative créé en septembre 2015. Paul nous a exposé le problème de constitution de datasets pour l’apprentissage supervisé (classification et reconnaissance d’entité nommé). (slides)
  • Christophe Bourguignat (Cofondateur et CEO @ Zelros) – Mathieu Bizen (Data Scientist @ Zelros) La mission de Zelros est d’intégrer le conversationnel dans les process de l’entreprise. Les speakers nous ont présenté des applications des modèles basés sur des réseaux de neurones pour les tâches de Natural Language Understanding. (slides)
  • Francois Régis Chaumartin (CEO @ Proxem) Proxem Software est une suite logicielle qui intègre les technologies de web, text et data mining. François nous a présenté l’intégration du deep learning qui rend plus simple la création d’un analyseur sémantique sur mesure, multi-lingue et adapté au corpus à traiter, en maximisant le rappel et la précision.

La video du meetup est aussi disponible ici.

On remercie encore une fois nos 3 speakers et notre hôte l’école 42 !

Troisième Paris NLP Meetup @NUMA

Le troisième Paris NLP meetup s’est déroulé le 25 Janvier au Numa, où plus de 150 personnes étaient présentes pour 3 talks de qualité:

  • Jean Senellart (CEO @ Systran SA) nous a présenté OpenNMT,  un framework de Neural Machine Translation développé en collaboration avec le groupe Harvard NLP. En plus de l’avancé technique que les modèles de NMT représentent, Jean nous a exposé le côté “Game changing” de ces technologie dans le marché de la traduction automatique.
  • Thomas Perrais (Data Scientist @ Proxem) a présenté un article de Bartunov et al. , publié en 2015, qui traite de l’apprentissage des word embeddings en lien avec le problème de la désambiguïsation. (slides)
  • Eric Sibony (CSO @ Shift Technology) nous a parlé du nouveau programme de R&D de Shift Technology: le traitement automatique des déclarations de sinistre pour les assurances ainsi que les difficultés rencontrées et les opportunités que ça représente. (slides)

On remercie encore une fois nos trois speakers ainsi que notre hôte, le Numa !

Second Paris NLP meetup @Algolia

Plus de 120 personnes était présentes pour ce second meetup qui s’est déroulé chez Algolia, qu’on remercie énormément pour l’accueil, l’organisation impeccable, les bières et les pizzas ! (Un grand merci à Sylvain Utard et Tim Carry).

Parmi les 300 personnes qui se sont inscrites au meetup, on n’a pu malheureusement accueillir qu’une fraction (faute de places disponibles). Mais ne vous inquiétez pas, les présentations ont été enregistrées, donc pour ceux qui veulent les voir (ou les revoir) on a inclus les liens vers les vidéos.

Les 3 présentations au menu étaient encore une fois d’une très grande qualité.

  • Sylvain Utard (Algolia) a ouvert (légèrement) le capot du moteur d’indexation et de recherche d’Algolia en nous exposant les différentes structures de données qui permettent de répondre au challenge de l’instant search. Vidéo Slides
  • Éric de la Clergerie (INRIA Alpage) nous a présenté deux manières de construire des espaces sémantiques, en utilisant non seulement des grands corpora de texte, mais aussi en injectant de la connaissance. Vidéo Slides
  • Piotr Bojanowski (Facebook AI Research) nous a parlé de fastText une librairie conçue pour les tâches de classification de texte et d’apprentissage de représentations, orienté rapidité et efficacité ! Vidéo Slides

On remercie encore une fois nos 3 speakers !

Le prochain meetup se déroulera le 25 janvier au Numa, see you there 🙂

Premier Paris NLP Meetup !

Le premier Meetup Paris NLP s’est déroulé mercredi 28 septembre à TheFamily, avec plus de 120 NLPeuse/NLPeur enthousiastes présents dans la salle et trois speakers de qualité.

  • Nicolas Marlier (CTO JulieDesk) qui nous a parlé de la manière avec laquelle JulieDesk font coexister traitement algorithmique et vérification humaine au sein de leur produit slides.
  • Djamé Seddah (Chercheur Alpage-INRIA) nous a parlé du passage de la syntaxe de surface à la syntaxe profonde et de l’amélioration que ça apporte aux modèles linguistiques slides.
  • Claude Fauconnet (Digital Innovation Project Manage – Total) nous a exposé les diverses applications du NLP au sein de Total slides.

On les remercie encore une fois de leur présence.

Vous trouverez la vidéo du meetup ici.

Si vous voulez intervenir lors d’un prochain meetup ou si vous avez simplement des questions, vous pouvez envoyer un mail à l’adresse contact@nlp.paris.

Le prochain meetup Paris NLP est programmé pour le 23 Novembre, soyez au rendez-vous !