Auteur :
Jean MarcVoir la page sur l'auteur

Est une indexation complète de World Wide Web et système de recherche pour un domaine ou un Intranet.
Ce système n’est pas censé remplacer le besoin de systèmes Internet-larges puissants de recherche comme par exemple Lycos, INFOSEEK, Google et AltaVista.
ht ://Dig est un logiciel libre développé en langage C++ par une communauté de personnes répartie dans le monde entier.
Comment ça marche ?
On prendra garde de choisir des mots suffisamment significatifs pour éviter un trop grand nombre de réponses mais également suffisamment nombreux, ou ayant une signification assez large, pour ne pas limiter la recherche a priori.
Les pluriels et les mots accentués sont automatiquement recherchés, inutile de les saisir.
Les mots effectivement utilisés par le moteur sont rappelés en haut de la page des résultats de la recherche.
Les résultats sont triés par ordre de pertinence.
Fonction de recherche avancées :
Des recherches peuvent être exécutées en utilisant de divers algorithmes configurables.
Actuellement les algorithmes suivants sont soutenus (dans toute combinaison) :
— exact
— soundex
— metaphone
— fins communes de mot (refouler)
— synonymes
— dépouiller d’accent
— sous-chaîne et préfixe
Quelques conseils pour la recherche :
ht ://Dig cherche des mots, pas des phrases.
"site web" ne cherchera pas la phrase "site web", mais toute page où apparaissent les deux mots, même séparés.
ht ://Dig respecte les caractères composés (é, è, ç, à, etc.), ce qui signifie que la recherche de "équipé" ne trouvera pas "équipe".
De même, méfiez-vous des pluriels, car ht ://Dig ne pratique pas les troncatures : vous n’obtiendrez pas le même résultat en tapant "heure" et "heures".
ht ://Dig est insensible à la casse (majuscules ou minuscules) : "Gutenberg" et "gutenberg" sont équivalents.
Sur la page des résultats de la recherche :
ht ://Dig vous propose de l’affiner si vous le souhaitez : Un menu à trois choix vous est proposé.
"Tous les mots" trouve les pages où chacun des mots que vous indiquez est présent ; "Au moins un mot parmi" peut vous proposer des pages où un seul des mots est présent ; "Recherche booléenne" est un mécanisme très utilisé en informatique documentaire.
Vous pouvez utiliser les opérateurs "and" et "or" (oui, en anglais !), comme par exemple "grève and (générale or reconductible)". Dans ce type de recherche booléenne, les parenthèses servent à regrouper les conditions. Les résultats :
ht ://Dig vous présente, sous le titre de la page trouvée, un extrait de celle-ci, avec les mots recherchés en gras.
Si les mots en question ne se trouvent pas au début de la page, ht ://Dig affiche un petit texte en anglais expliquant que les mots recherchés ne se trouvent pas au début du document.
En cliquant sur l’URL proposé, vous arriverez bien sûr au début de la page trouvée : en utilisant la fonction de recherche dans la page de votre navigateur web favori, vous trouverez la localisation précise du mot recherché.
La date de dernière mise à jour du document est affichée au format américain (avec le chiffre du mois au début).
Les propriétés suivantes sont identifiées par ht ://Dig :
— htdig-mots-clés
— htdig-noindex
— htdig-email
— htdig-avis-date
— htdig-email-sujet
— robots
— mots-clés
— description
Par opposition à certains WAIS-based ou au web-server basé les moteurs de recherche, ht ://Dig peut facilement franchir plusieurs web servers. Le type de ces différents serveurs d’enchaînement n’importe pas, aussi longtemps qu’ils comprennent des protocoles communs comme le HTTP.