La recherche avancée « Fulltext » dans Docubase – Moteur Lucene

Cet article vous présente les fonctions avancées de recherche avec le champ permettant de trouver à l’intérieur du texte des documents classés en GED Docubase basé sur le moteur Lucene.

Prérequis à la recherche FullText

Activation de la recherche FullText (recherche plein texte devrais-je dire !)

Avant de pouvoir faire une recherche dans le texte des documents, il faut que l’administrateur de la GED Docubase ait réalisé l’activation de cette fonction au niveau de la base GED utilisée. Pour cela, il doit se rendre dans l’onglet des « Process métier » dans l’interface d’administration : <votre_serveur_GED>/amfadmin.

  • Sélectionner la base pour laquelle on veut activer la fonction fulltext
  • Choisir l’action « Modification de la base »
  • Cliquer sur l’option « Indexation plein texte« 

Les différentes possibilités pour l’indexation plein texte seront décrites dans un autre article.

Ajouter un champ de recherche fulltext dans le formulaire de recherche

Afin de permettre à l’utilisateur de faire une recherche fulltext dans une base GED, il faut que ce champ soit ajouté dans le ou les formulaires de recherches GED Docubase.

Champ de recherche plein texte dans un formulaire de recherche Docubase

Ajout du champ de recherche plein texte dans un formulaire de recherche Docubase

Utiliser la recherche plein texte

Remarques générales sur la recherche plein texte

En introduction, quelques indications sur les recherches avancées avec le champ Fulltext.

Tout d’abord, il faut préciser que le moteur de recherche plein texte :

  • ne tient pas compte des majuscules/minuscules
  • tient compte des caractères accentués

Par exemple :

  • « i love msi » et « I LOVE MSI » donnent le même résultat.
  • « I lové msi » ne donne aucun résultat

Recherche par combinaison de mots

Caractères spéciaux

Caractère Utilisation Exemple
? Remplace un seul caractère je? recherche tous les mots commençant par je et suivis d’un seul caractère : jet, jeu, …
* Remplace 0 ou plusieurs caractères je* recherche tous les mots commençant par je et suivi ou non d’un ou plusieurs caractères : je, jet, jeu, jeudi, …

tri*al recherche tous les mots commençant par tri et finissant par al avec un ou plusieurs caractères entre : tribal, trivial, tribunal, …

Recherche de mots proches

Le moteur FullText basé sur Lucene permet de rechercher des mots en précisant leurs distances. Par exemple, je souhaite rechercher tous les documents liés à des salariés ayant 4 enfants à charge. Je sais que l’information nombre d’enfants à charge se trouve à moins de 5 mots de l’information « contrat » sur le document. Je peux afficher ces documents en faisant la recherche ci-dessous :

Formulaires de recherche : mots proches

Formulaires de recherche : mots proches

Pour faire cette recherche d’approximation de la position d’un mot par rapport à un autre ou plusieurs autres mots, j’utilise le tilde, « ~ », que je positionne en fin de recherche avec une valeur. Dans mon exemple, je recherche « 04 » et « Contrat N° » avec 5 mots maximums qui doivent les séparer.

Autres opérateurs de recherche

Opérateur Utilisation Exemple
OR le(s) document(s) contienne(nt) au moins 1 des termes ou phrases « love msi » OR « GED et dématérialisation » : documents contenant love msi ou GED et dématérialisation
AND le(s) document(s) contienne(nt) l’ensemble des termes ou phrases « love msi » AND « GED et dématérialisation » : documents contenant love msi et GED et dématérialisation
+ impose que le terme ou la phrase placé(e) juste derrière soit présent(e) dans le(s) document(s) +tribunal administratif : documents contenant obligatoirement le mot tribunal et éventuellement le mot administratif
NOT ou ! impose que le terme ou la phrase placé(e) juste derrière ne soit pas présent(e) dans le(s) document(s) tribunal NOT administratif : documents contenant le mot tribunal et ne contenant pas le mot administratif
impose que le terme ou la phrase placé(e) juste derrière ne soit pas présent(e) dans le(s) document(s) tribunal -administratif : documents contenant le mot tribunal et ne contenant pas le mot administratif
ATTENTION
Les caractères suivants doivent être précédés d’un \ si vous souhaitez qu’ils soient pris en compte en tant que caractère dans votre recherche :+ – && || ! ( ) { } [ ] ^  » ~ * ? : \Ex : Pour rechercher « Entreprise & co » mettre « Entreprise \& co »

 

Vous avez aimé cet article ? Alors partagez-le avec vos relations en cliquant sur les boutons ci-dessous :

 

Un commentaire

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.