Pourquoi M-Pearl utilise une Intelligence Artificielle sémantique ?

M-Pearl met en relation candidats et recruteurs directement, sans moteur de recherche de CVs ou de postes. Un utilisateur, qu’il soit candidat ou recruteur, ne peut donc consulter les informations des autres utilisateurs qu’en cas de match. C’est l’algorithme M-Pearl qui a pour finalité l’évaluation du match entre profil candidat et profil de poste en entreprise.

Cette évaluation se fait en comparant les sujets abordés de part et d’autre ; dit plus simplement, en mesurant « combien les deux profils parlent de la même chose ». Cette « même chose » n’est pas un ensemble fermé aux frontières strictes, c’est un ensemble complexe de sujets entremêlés; c’est la raison pour laquelle classer et chercher des mots clés n’est une méthode ni suffisante ni satisfaisante. On utilise souvent des mots différents pour parler de la même chose, ou à l’inverse, on peut parler de choses différentes en utilisant les mêmes mots. Il ne s’agit donc pas de vérifier que le candidat et le recruteur utilisent les mêmes mots ou ont le même « avis » mais bien de vérifier qu’ils abordent les mêmes sujets, des sujets dits similaires.

Alors comment évaluer cette similarité ? Elle s’évalue grâce à la prise en compte du contexte dans lequel les mots sont employés, c’est-à-dire les autres mots présents dans la phrase, le paragraphe et dans le document complet. Par exemple, prenons le mot « développement ». Dans quels contextes peut-il être utilisé ? On peut parler de « développement personnel », on peut parler de « développement commercial », on peut aussi parler de « développement logiciel ». On pourrait alors se dire qu’il y a trois contextes clairement délimités mais l’analyse sémantique est une question de niveaux de détails: on peut illustrer cela en disant que, pour une personne de l’aéronautique, le « développement logiciel » de par ses technologies propres, ses relations avec l’électronique, ses normes ou ses exigences de fiabilité n’a « rien à voir » avec le « développement logiciel » dans le web.  Une personne du web pourrait alors réagir en disant que le « développement web » ne veut « plus rien dire » ; qu’il peut s’agir d’API, de microservices, de PHP etc. Cette illustration montre toute la profondeur et l’importance d’une bonne évaluation des contextes et la nécessité d’une solution adaptée et performante.

Pour comprendre l’intérêt des ensembles à dimensions multiples, imaginons une boussole dont l’aiguille s’oriente selon le contexte d’une discussion: si on parle de « conception mécanique » elle s’arrête dans la zone « mécanique ». Cette boussole nous permet de détecter une discipline mais nous souhaitons aussi spécialiser notre discours sur le secteur Automobile et gérer cette information supplémentaire  : comment faire ?

Pour intégrer cette information, on ajoute à notre boussole un second axe qui lui permet de s’orienter dans les 3 dimensions de l’espace: elle est maintenant capable de détecter une discipline appliquée à un secteur d’activité.

Maintenant si nous souhaitons prendre en charge d’autres informations, comme les logiciels de Conception Assistée par Ordinateur ou les normes, il nous faut une boussole qui s’oriente dans plus de 3 dimensions.

Selon les sujets traités, les ensembles sémantiques que nous créons chez M-Pearl ont de 100 à 300 dimensions. Ces niveaux de dimensions nous permettent de distribuer les mots dans l’espace avec suffisamment de liberté pour qu’ils y soient répartis par co-occurrence (selon leurs voisinages courants) et ainsi les rassembler par contextes, par sujets. C’est la sémantique distributionnelle.

Par cette méthode et pour un profil détaillé, nous orientons notre « hyper boussole » de façon suffisamment précise, sans avoir recours à des catégories. Candidats et recruteurs peuvent se trouver, même s’ils utilisent des mots différents.

M-Pearl = Intelligence Artificielle sémantique ?

Nous utilisons plusieurs technologies pour composer un score de match : d’autres méthodes d’analyse sémantique sont mises en œuvre et nous avons aussi développé nos propres algorithmes pour le testing. Par ailleurs, pour rester les plus pertinents dans nos propositions, nous utilisons des algorithmes conventionnels pour la localisation et la mobilité géographique ainsi que pour les prétentions salariales. 

L’assistance sémantique au recrutement

Nous avons donné une explication des principes en jeu dans la « sémantique distributionnelle ». M-Pearl déploie cette technologie dans l’assistance au recrutement en déclinant plusieurs évaluations sémantiques. Pour le rapprochement des responsabilités du poste avec l’expérience du candidat, nous mesurons la pertinence de chacune de ses expériences ainsi que celle de son parcours global. Cette opération nous permet de détecter si un poste représente une continuité professionnelle pour un candidat. Dans tous les cas, les motivations du candidat sont comparées aux objectifs du poste pour venir confirmer ou infirmer un match. En analysant les techniques, les responsabilités, les secteurs d’activité et les motivations, M-Pearl rapproche candidats et entreprises en évaluant leurs multiples points d’adéquation possibles.

La technologie M-Pearl

Ce que nous avons décrit ici relève de la sémantique distributionnelle en général. Pour l’assistance sémantique au recrutement, nous avons développé des briques technologiques supplémentaires pour spécialiser notre moteur dans le vocabulaire professionnel du recrutement. L’une des étapes clé du processus d’analyse est appelée tokenisation ou lemmatisation en français: elle vise à réduire et identifier certains mots selon leurs déclinaisons grammaticales mais aussi leur pluriel et leur féminin. Certains mots sont aussi polysémiques: ils ont des significations multiples et sont employés dans des contextes différents. Pour cette procédure de lemmatisation, nous avons développé notre propre algorithme qui n’utilise pas les outils standards. Par exemple, le mot « stagiaires » n’est pas identifié au mot « stagiaire » car le premier est utilisé dans un contexte de description d’une organisation alors que le second est associé à une description de poste. Notre développement spécifique en lemmatisation du vocabulaire professionnel fait actuellement l’objet d’une étude de dépôt de brevet.