{"id":24289,"date":"2019-12-12T18:00:01","date_gmt":"2019-12-12T17:00:01","guid":{"rendered":"https:\/\/lium.univ-lemans.fr\/?p=24289"},"modified":"2020-04-09T14:12:05","modified_gmt":"2020-04-09T12:12:05","slug":"intelligence-artificielle-pour-une-comprehension-de-la-parole-controlee-par-la-semantique-2","status":"publish","type":"post","link":"https:\/\/lium.univ-lemans.fr\/en\/intelligence-artificielle-pour-une-comprehension-de-la-parole-controlee-par-la-semantique-2\/","title":{"rendered":"Th\u00e8se : Intelligence Artificielle pour une compr\u00e9hension de la parole contr\u00f4l\u00e9e par la s\u00e9mantique"},"content":{"rendered":"<div class=\"panel-grid\" id=\"pg-24289-0\" ><div class=\"panel-grid-core\"><div class=\"panel-grid-cell\" id=\"pgc-24289-0-0\" ><div class=\"panel-widget-style\" ><h2 style=\"color: #e5442d;\">Intelligence Artificielle pour une compr\u00e9hension de la parole contr\u00f4l\u00e9e par la s\u00e9mantique<\/h2>\n<p>&nbsp;<br \/>\n<strong>Supervisor:<\/strong> Sylvain Meignier<br \/>\n<strong>Co-supervisor(s):<\/strong> Nathalie Camelin et Antoine Laurent<br \/>\n<strong>Mails :<\/strong> prenom.nom@univ-lemans.fr<br \/>\n<strong>Application deadline :<\/strong> 22 May 2020<br \/>\n&nbsp;<br \/>\n<strong>Context :<\/strong><\/p>\n<p align=\"justify\">This thesis is part of the research topics of the Language and Speech Technologies (LST) team at the Laboratoire Informatique de l&#8217;Universit\u00e9 du Mans (LIUM). It will take place in Le Mans, as part of the ANR AISSPER project.<\/p>\n<p>&nbsp;<br \/>\n<strong>Keywords:<\/strong> Reconnaissance et compr\u00e9hension de la parole, approches End2End, r\u00e9seaux de neurones, int\u00e9gration de connaissances a priori<br \/>\n&nbsp;<br \/>\n<strong>Descritpion<\/strong><\/p>\n<p align=\"justify\">Le projet ANR AISSPER (Artificial Intelligence for Semantically controlled SPEech UndeRstanding) a pour objectif de proposer des nouveaux algorithmes afin de r\u00e9soudre le difficile probl\u00e8me de la compr\u00e9hension de la parole. En effet, malgr\u00e9 le d\u00e9veloppement et la commercialisation des assistants personnels intelligents (Alexa, Google Home,\u2026) la compr\u00e9hension de la parole reste un domaine o\u00f9 de nombreux verrous scientifiques subsistent. Notamment, la mod\u00e9lisation efficace des variabilit\u00e9s contenues \u00e0 diff\u00e9rents niveaux dans la parole (prosodique, acoustique, lexical, \u2026 ), demeure un probl\u00e8me de recherche important pour la reconnaissance et la compr\u00e9hension de la langue parl\u00e9e.<\/p>\n<p align=\"justify\">AISSPER a pour but d\u2019am\u00e9liorer la reconnaissance de concepts s\u00e9mantiques via des m\u00e9thodes issues de l\u2019intelligence artificielle. Pour ce faire, les partenaires d\u2019AISSPER vont focaliser leur travail sur l\u2019investigation de nouvelles m\u00e9thodes d\u2019apprentissage profond. L\u2019id\u00e9e est de se baser sur l\u2019utilisation de la s\u00e9mantique dans des m\u00e9canismes d\u2019attention sp\u00e9cifiques adapt\u00e9s \u00e0 diff\u00e9rents ensembles de contexte d\u2019informations. Ainsi, AISSPER vise \u00e0 d\u00e9velopper de nouveaux paradigmes mod\u00e9lisant conjointement informations acoustiques et s\u00e9mantiques pour l\u2019analyse s\u00e9mantique de documents oraux dans des approches dites End2End ou \u00ab de bout en bout \u00bb, c\u2019est \u00e0 dire directement du signal vers les concepts.<\/p>\n<p align=\"justify\">AISSPER rassemble des chercheurs reconnus dans le domaine de l&#8217;intelligence artificielle et du traitement automatique du langage. Ce projet est coordonn\u00e9 par le LIA (Laboratoire Informatique de l\u2019universit\u00e9 d\u2019Avignon). Il d\u00e9bute en janvier 2020 avec comme partenaires le LIUM et la soci\u00e9t\u00e9 ORKIS. Le travail a \u00e9t\u00e9 r\u00e9parti en plusieurs sous-parties (les WP, pour \u00ab Work Package \u00bb). Le WP1 a pour but de proposer des nouvelles architectures neuronales adapt\u00e9es sp\u00e9cifiquement au traitement de la compr\u00e9hension de la parole. Le WP2 doit mettre oeuvre les m\u00e9thodes issues du WP1 pour la compr\u00e9hension de la parole au niveau du tour de parole. Il s\u2019agira notamment de proposer des strat\u00e9gies d\u2019int\u00e9gration de connaissances a priori dans l\u2019architecture propos\u00e9e et \u00e9galement d\u2019analyser les informations construites par les couches cach\u00e9es du r\u00e9seau de neurones. Le WP3 doit \u00e9tendre le travail du WP2 pour une compr\u00e9hension au niveau du document et l\u2019int\u00e9gration d\u2019informations globales dans le m\u00e9canisme d\u2019attention. Il s\u2019agira \u00e9galement de proposer une strat\u00e9gie d\u2019extraction de caract\u00e9ristiques efficaces du signal de parole. Le WP4 aura pour objectif d\u2019int\u00e9grer, d\u2019appliquer et d\u2019\u00e9valuer toutes les d\u00e9couvertes scientifiques des WP pr\u00e9c\u00e9dents dans le cadre applicatif r\u00e9el propos\u00e9 par la soci\u00e9t\u00e9 ORKIS.<br \/>\nLe travail du doctorant se situe dans les WP 2 et 3. Il devra travailler en collaboration avec les chercheurs du LIUM et du LIA. Les exp\u00e9riences seront men\u00e9es sur 2 corpus diff\u00e9rents : le corpus MEDIA pour le WP2, contenant des dialogues de r\u00e9servation de restaurant et annot\u00e9s selon environ 80 concepts s\u00e9mantiques et le corpus DECODA pour le WP3, contenant des dialogues de la RATP annot\u00e9s en 8 th\u00e8mes g\u00e9n\u00e9raux. La strat\u00e9gie de diffusion d\u2019AISSPER veut que les travaux du doctorants soient publi\u00e9s dans les conf\u00e9rences les plus s\u00e9lectives du domaine de l\u2019apprentissage automatique et du traitement de la parole.<\/p>\n<p>&nbsp;<br \/>\n<strong>Bibliographie<\/strong><\/p>\n<p align=\"justify\">\u2022 Antoine Caubri\u00e8re, Natalia Tomashenko, Antoine Laurent, Emmanuel Morin, Nathalie Camelin, Yannick Est\u00e8ve \u201cCurriculum-based transfer learning for an effective end-to-end spoken language understanding and domain portability\u201d. 2019 Interspeech.<br \/>\n\u2022 A. Caubriere, Y. Esteve, N. Camelin, E. Simonnet, A. Laurent, and E. Morin. \u201cEnd-To-End Named Entity And Semantic Concept Extraction From Speech.\u201d 2018 IEEE Spoken Language Technology Workshop (SLT) 2018<br \/>\n\u2022 Edwin Simonnet, Nathalie Camelin, Paul Del\u00e9glise, Yannick Est\u00e8ve. \u201cExploring the Use of Attention-Based Recurrent Neural Networks For Spoken Language Understanding. Machine Learning for Spoken Language Understanding and interaction.\u201d, SLUNIPS\/NIPS 2018.<br \/>\n\u2022 Janod, Killian, Mohamed Morchid, Richard Dufour, Georges Linares, and Renato De Mori. \u201cDenoised Bottleneck Features From Deep Autoencoders for Telephone Conversation Analysis.\u201d IEEE\/ACM Transactions on Audio, Speech, and Language Processing, 2017.<br \/>\n\u2022 Bonneau-Maynard, H\u00e9l\u00e9ne and Ayache, Christelle and Bechet, Fr\u00e9d\u00e9ric and Denis, Alexandre and Kuhn, Anne and Lef\u00e8vre, Fabrice and Mostefa, Djamel and Quignard, Matthieu and Rosset, Sophie and Servan, Christophe and others. \u201cResults of the French Evalda-Media Evaluation Campaign for Literal Understanding.\u201d In LREC 2006. Ghannay, S., A.<br \/>\n\u2022 Yunlong Yu, Zhong Ji, Yanwei Fu, Jichang Guo, Yanwei Pang, Zhongfei (Mark) Zhang. \u201cStacked Semantics-Guided Attention Model for Fine-Grained Zero-Shot Learning.\u201d In NeurIPS 2018.<br \/>\n\u2022 Ashish Vaswani Noam Shazeer Niki Parmar Aidan N. Gomez y Lukasz Kaiser. \u201cAttention Is All You Need.\u201d In NIPS 2017 \u2022 [MEDIA] Bonneau-Maynard, H\u00e9l\u00e9ne and Ayache, Christelle and Bechet, Fr\u00e9d\u00e9ric and Denis, Alexandre and Kuhn, Anne and Lef\u00e8vre, Fabrice and Mostefa, Djamel and Quignard, Matthieu and Rosset, Sophie and Servan, Christophe and others. \u201cResults of the French Evalda-Media Evaluation Campaign for Literal Understanding.\u201d In LREC 2006<br \/>\n\u2022 [DECODA] De Mori Renato and Arbillot Eric, Bechet Frederic And Maza Benjamin And Bigouroux Nicolas And Bazillon Thierry And El-Beze Marc. \u201cDECODA: A Call-Centre Human-Human Spoken Conversation Corpus.\u201d In LREC 2012.<br \/>\n\u2022 Titouan Parcollet, Mohamed Morchid Georges Linar\u00e8s et Renato De Mori. \u201cBidirectional Quaternion Long Short-Term Memory Recurrent Neural Networks for Speech Recognition.\u201d In ICASSP 2019.<\/p><\/div><\/div><\/div><\/div>","protected":false},"excerpt":{"rendered":"<p>Intelligence Artificielle pour une compr\u00e9hension de la parole contr\u00f4l\u00e9e par la s\u00e9mantique &nbsp; Supervisor: Sylvain Meignier Co-supervisor(s): Nathalie Camelin et Antoine Laurent Mails : prenom.nom@univ-lemans.fr Application deadline : 22 May 2020 &nbsp; Context : This thesis is part of the research topics of the Language and Speech Technologies (LST) team at the Laboratoire Informatique de [&hellip;]<\/p>\n<p class=\"more-link style2\"><a href=\"https:\/\/lium.univ-lemans.fr\/en\/intelligence-artificielle-pour-une-comprehension-de-la-parole-controlee-par-la-semantique-2\/\"  class=\"themebutton\"><span class=\"more-text\">READ MORE<\/span><span class=\"more-icon\"><i class=\"fa fa-angle-right fa-lg\"><\/i><\/span><\/a><\/p>\n","protected":false},"author":14,"featured_media":13249,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":[],"categories":[78,87],"tags":[49],"acf":[],"_links":{"self":[{"href":"https:\/\/lium.univ-lemans.fr\/en\/wp-json\/wp\/v2\/posts\/24289"}],"collection":[{"href":"https:\/\/lium.univ-lemans.fr\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/lium.univ-lemans.fr\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/lium.univ-lemans.fr\/en\/wp-json\/wp\/v2\/users\/14"}],"replies":[{"embeddable":true,"href":"https:\/\/lium.univ-lemans.fr\/en\/wp-json\/wp\/v2\/comments?post=24289"}],"version-history":[{"count":1,"href":"https:\/\/lium.univ-lemans.fr\/en\/wp-json\/wp\/v2\/posts\/24289\/revisions"}],"predecessor-version":[{"id":24290,"href":"https:\/\/lium.univ-lemans.fr\/en\/wp-json\/wp\/v2\/posts\/24289\/revisions\/24290"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/lium.univ-lemans.fr\/en\/wp-json\/wp\/v2\/media\/13249"}],"wp:attachment":[{"href":"https:\/\/lium.univ-lemans.fr\/en\/wp-json\/wp\/v2\/media?parent=24289"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/lium.univ-lemans.fr\/en\/wp-json\/wp\/v2\/categories?post=24289"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/lium.univ-lemans.fr\/en\/wp-json\/wp\/v2\/tags?post=24289"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}