SNO [le Portail du Site Non Officiel du net]
Accueil du site > Rubrique Informatique > ht ://Check

Dernière mise à jour :
lundi 1er décembre 2008
Statistiques éditoriales :
Tue, 02 Dec 2008 05:49:01 GMT
A ce jour il y a sur ..:SNO:..
42 rubriques
424 Articles
30 Brèves
295 Sites Web
Statistiques des visites :
92 aujourd'hui
422 hier
504 moyenne par jour
et il y a eu 363920 lectures d'articles
(par différents robots et humains)
depuis le 17 novembre 2003

Pourquoi nous boycottons Pékin 2008 ?


ht ://Check


ht ://Check has been released ; new features include document type recognition (DOCTYPE) and storing, as well as META description and keywords of HTML documents. Sources have been strongly modified in order to be more robust and to support latest releases of the autotools (autoconf, automake and libtool).

ht ://Check est plus qu’un contrôleur de lien . C’est une application de console écrite pour des systèmes de GNU/Linux dans C++ et dérivée du meilleur moteur de recherche disponible sur l’Internet pour libre : ht ://Dig .

 


Qu’est-ce que ht ://Check ?

ht ://Check est plus qu’un contrôleur de lien ; c’est une application de console écrite pour des systèmes de GNU/Linux en C++ et dérivée du meilleur moteur de recherche disponible sur l’Internet libre : ht ://Dig .

Il est très utile pour les Webmasters qui veulent surveillent leur Websites, afin de découvrir des liens cassés inattendus, ainsi que d’autres informations également intéressantes, données qu’ils ont sous forme de documents hypertextes.

ht ://Check établit un point d’émission de données très utile et extrêmement complet dans MySQL, il est très flexible et facilement améliorable car c’est un projet _ opensource _ .

dispositifs de ht ://Check

ht ://Check se compose de deux parts logiques : une "chenille" qui commence à vérifier les URLs spécifique ou à partir d’une liste ; et un "analyseur" qui prend les résultats des premières parties sommaires (la présente partie peut être faite par l’intermédiaire de la console ou en employant l’interface de PHP par un web server).

La "chenille"

— HTTP/1.1 conforme aux raccordements et cookies.
— HTTP Basic support de l’authentification.
— HTTP Proxy authentification de base incluse.
— Nombreux attributs de configuration qui laissent l’utilisateur maître des matchings d’URLs et la distance ("houblon") du premier URL.
— MySQL databases : les bases de données de MySQL sont directement créées par la chenille.
— MySQL connections : Connexion de MySQL dans les options générales définies par l’utilisateur (/etc/my.cnf ou /.my.cnf)

Nota : Aucun soutien de Java script et autres protocoles HTTPS, ftp, NNTP et fichiers locaux.

L’"Analyseur"

Juste une préface : aussi longtemps que toutes les données (après une requête) soient stockés dans une base de données de MySQL, il est assez facile d’obtenir une information désirée en questionnant la base de données.

La chenille, quoi qu’il en soit, est incluse dans l’application ’htcheck’, qui à l’extrémité montre par elle-même un petit rapport des textes. Dans un deuxième temps vous pouvez toujours rechercher l’information de cette base de données en établissant votre propre interface (PHP, Perl par exemple) ou en employant juste le défaut un écrit dans PHP.

ht ://Check établit un point d’émission de données qui peut être employé pour l’exploitation de structure d’enchaînement, indiquant la connaissance au sujet des rapports à l’intérieur et entre des documents.

En outre les outils d’extraction d’enchaînement peuvent trouver l’information intéressante ht ://Check, et l’emploient comme point d’émission de données auxiliaire afin d’établir une sorte de carte d’emplacement.

’htcheck ’(l’application en console) vous donne un sommaire des liens cassés, ancres cassées, serveurs vus, contenu-types produit.

L’interface de PHP vous laisse exécuter :
— Queries concernant URLs, en choisissant vos critères déterminants tels que modèle-pattern, status code, content-type, taille.
— Queries questions concernant les liens, avec les modèle-pattern sur la source et la destination URLs (également avec des expressions régulières), les résultats (cassé, correct, ancre non trouvée, réorienté) et leur type (normale, direct, réorientés).
— Informations concernant des URLs spécifique (les liens sortants et entrants, datetime, etc...).
— Informations concernant les liens spécifiques (cassés ou corrects) et l’instruction de HTML qui l’ont publiée.
— Statistiques sur des documents recherchés

Téléchargement