Maha réalise une thèse CIFRE au sein de F.initiatives, sur l’apprentissage non-supervisé sur les flux de données. Elle fait parti des six Chercheurs présents au sein du Research Lab.
Peux-tu me présenter ton parcours ?
Après avoir obtenu mon baccalauréat en 2013, j’ai poursuivi mes études supérieures à l’Université de Fez, au Maroc, dans les domaines de l’informatique et des mathématiques. J’y ai obtenu une licence en 2017 puis un master intitulé « Web Intelligence et Sciences des données ». Celui-ci était en double diplôme avec Sorbonne Université, donc les trois premiers étudiants de la promotion se sont vu offrir l’opportunité de faire un stage au Laboratoire d’Informatique de Paris Nord.
J’ai donc intégré ce laboratoire pour mon projet de fin d’études, ce qui a été mon premier contact avec le monde de la recherche, encore jusqu’ici très flou pour moi. Cette première expérience m’a directement donné envie de continuer dans la recherche et de réaliser une thèse, plutôt en entreprise, afin de pouvoir analyser l’application de mes recherches directement sur des données concrètes.
Après quelques recherches vaines pour trouver une entreprise où réaliser ma thèse CIFRE, j’ai décidé de rejoindre un master 2 « Machine Learning et Sciences des données » à l’Université Paris Descartes. C’est lors de ma recherche de projet de fin d’études pour ce deuxième diplôme que F.initiatives m’a contacté pour y faire réaliser un stage, puis une thèse CIFRE à partir de juillet 2021, sur l’apprentissage non-supervisé sur les flux de données.
Comment as-tu choisi ton sujet de thèse CIFRE ? est-ce qu’il a été construit en collaboration avec F.initiatives ?
Pendant mon stage, j’ai travaillé sur l’apprentissage non-supervisé. Concrètement, je faisais de la modélisation automatique de sujets et sous-sujets sur des données déjà existantes. Les méthodes étaient déjà existantes, je devais simplement les comparer puis les appliquer.
Lors de mon inscription en thèse, mon superviseur à l’Université m’a proposé ce sujet, où il est question de développer des méthodes capables de regrouper des données en continu sous certaines limites. Cela correspond tout à fait aux attentes de F.initiatives car de nombreuses données arrivent en continu.
Quelle est la valeur ajoutée de réaliser sa thèse en entreprise ?
Selon moi, réaliser une thèse en entreprise permet d’avoir une application directe de ses recherches. Cela représente également trois années d’expérience dans le monde professionnel privé. Souhaitant poursuivre ma carrière en entreprise, ma thèse CIFRE me permet de connaître les codes et attentes des entreprises.
En quoi consiste ton activité chez F.initiatives ?
A mon arrivée j’ai commencé à réaliser un état de l’art de l’existant, car de nombreuses recherches sur le clustering et le flux de données textuel sont déjà disponibles. Grâce à cela, j’ai pu faire ressortir certaines problématiques afin d’adapter mes recherches au cas de F.initiatives. Actuellement, je réalise de la recherche fondamentale afin de construire des algorithmes permettant d’évoluer sur le regroupement des données par sujet et thématique.