Passer au contenu

Consulter un site Web hors ligne

Profitez du format des fichiers d’aide de Windows pour transformer un site Web en un fichier CHM.

Récupérer le contenu d’un site sur votre disque dur (on dit aussi “ aspirer un site ”) pour pouvoir le consulter hors connexion est une opération classique, que nous avons déjà traitée dans l’Ordinateur individuel. La démarche que nous vous proposons ici est un peu différente : au lieu de laisser les fichiers téléchargés sous forme d’une arborescence de pages Web, vous allez le transformer en un unique fichier CHM. Il s’agit du format utilisé par certains fichiers d’aide de Windows. Un tel fichier sera donc lisible sur n’importe quel PC. Comparé à l’HTML, le CHM offre trois avantages : l’ensemble du site tient en un unique fichier, facile à consulter hors connexion, à copier ou à archiver. Ensuite, il occupe moins de place que les fichiers HTML. Enfin, les fichiers CHM contiennent un moteur de recherche immédiatement accessible et peuvent être utilisés sur la plupart des plates-formes. Mais attention, la procédure décrite ici ne s’adresse qu’aux plus avertis.

Installez un aspirateur de sites

Sur le site http://t.01net.com/tc1911, récupérez et installez le logiciel HTTrack puis lancez-le. Choisissez Français dans la liste des langues proposées. Pour démarrer un nouveau projet, cliquez sur Suivant, donnez-lui un nom et choisissez éventuellement une Catégorie. Indiquez dans quel dossier le site devra être aspiré sur votre disque dur (par défaut, ce sera un sous-dossier de C:Mes Sites Web). Cliquez sur Suivant. Dans le champ Adresse Web, saisissez l’adresse complète du site (par exemple www.monsiteweb.fr ou www.monsiteweb.fr/toto/page.html). Pour que l’aspiration soit compatible avec les exigences du format CHM, cliquez sur le bouton Définir les options.

Paramétrez HTTrack

Dans l’onglet Structure, choisissez comme Type de structure locale : Html dans Web, images / Autres dans Web/images. Cochez l’option Nom Dos 8+3. Si vous disposez d’une connexion ADSL rapide, activez l’onglet Contrôle du flux et saisissez dans Nombre de connexions la valeur 10, voire 20 si vous n’avez pas besoin de continuer à utiliser simultanément votre connexion Internet. Si le site que vous souhaitez télécharger n’est à récupérer que partiellement (c’est ce cas s’il comporte plusieurs centaines de pages), affichez l’onglet Limites. Choisissez un niveau de Profondeur maximale. Une profondeur de 2 signifie que tous les liens contenus dans les pages liées à la page d’origine seront explorés. Généralement, 3 est une bonne valeur. La profondeur extérieure représente les liens situés sur un autre site : dans ce paramètre, choisissez 0. Vous pouvez également limiter le Temps de capture en indiquant un nombre de secondes maximal. Cliquez enfin sur OK, puis sur Suivant et Terminer. La copie du site s’effectue sur votre disque dur (cela peut prendre longtemps). Quand elle est terminée, cliquez sur Quitter.

Installez help workshop

Microsoft propose aux développeurs un “ kit ” permettant la création de fichiers CHM. Pour l’obtenir, rendez-vous sur la page http://msdn.microsoft.com/en-us/library/ms669985.aspx et cliquez sur le lien Download HtmlHelp.exe. Téléchargez et installez le logiciel sans tenir compte des éventuels messages d’erreur. Pour démarrer le programme, ouvrez successivement, à l’aide de l’Explorateur de Windows, les dossiers C:Program files et HTML Help Workshop et double-cliquez sur le fichier hhw.exe. Si vous utilisez Windows Vista ou 7, vous pouvez aussi cliquer sur Démarrer et taper hhw dans le champ de recherche. Le format CHM est limité à 32 000 fichiers (en comptant les images comprises dans les pages Web), ce qui vous permet tout de même de capturer de gros sites. Toutefois, il arrive que certains sites, notamment ceux qui comportent du javascript ne fonctionnent que partiellement sous forme de fichier d’aide.

Créez un nouveau projet

Déroulez le menu File, New. Sélectionnez Project dans la liste et validez par OK. Cliquez sur Suivant, puis sur Browse. Choisissez le dossier où votre fichier CHM doit être enregistré (par exemple C:Mes sites web). Dans Nom de fichier, saisissez par exemple monsite et validez en cliquant sur Ouvrir, puis Suivant. Cochez uniquement l’option HTML Files (*.htm). Cliquez sur Suivant puis sur Add. Ouvrez le dossier C:Mes sites webXXXweb (où XXX est le nom du site que vous avez aspiré) et sélectionnez tous les fichiers HTM qu’il contient. Validez en cliquant sur Ouvrir puis Suivant et Terminer. Cliquez sur l’onglet Contents : le message qui apparaît vous propose de créer automatiquement le fichier qui représentera le contenu du site. Validez le message qui s’affiche par OK, puis Enregistrer. Procédez de même en cliquant sur l’onglet Index : cliquez sur OK et Enregistrer. Enfin, retournez dans l’onglet Project.

Compilez le CHM

Cliquez sur l’icône Change Project Options située en haut de la colonne de gauche. Dans l’onglet Files, cochez les options Automatically create content file (.hhc) when compiling et Include keywords for HTML files. Dans l’onglet Compiler, cochez les cases Compile Full text search information, Create a binary Index et Create a binary TOC et validez par OK. Enfin, déroulez le menu File, Compile : le nom du fichier à compiler est automatiquement prérempli. Validez par Compile puis, si nécessaire, confirmez l’enregistrement du fichier en cliquant sur Oui. Notez que, si vous devez recompiler le fichier CHM, il vous faudra le supprimer au préalable.

Affichez le résultat

Une fois la compilation terminée, à l’aide de l’Explorateur de Windows, double-cliquez sur le fichier C:Mes sites webmonsite.chm. Le fichier apparaît alors dans une fenêtre d’aide. Vous pouvez naviguer normalement dans le site ou retrouver rapidement une page en particulier en utilisant l’onglet Recherche. Si, lors de la navigation, vous obtenez systématiquement des erreurs d’exécution de scripts, cela est probablement dû à du code Javascript incompatible avec le format CHM. Dans ce cas, vous pouvez décider de modifier les pages Web défaillantes à l’aide d’un éditeur HTML. Vous devrez ensuite recompiler le fichier CHM afin d’appliquer les changements. Une solution plus simple, que nous présentons dans le paragraphe suivant, consiste à ne pas utiliser l’outil de visualisation d’aide intégré à Windows. En effet, ce dernier se fonde sur Internet Explorer, peu compatible avec les standards du Web et paranoïaque.

Optez pour ABC Amber CHM Viewer

ABC Amber CHM Viewer est un utilitaire gratuit de visualisation de fichiers d’aide totalement sécurisé et n’exécutant pas les scripts. De ce fait, il permet d’afficher sans erreurs la plupart des sites Web téléchargés via Httrack. En outre, vous êtes certain de ne pas utiliser votre connexion Internet quand vous affichez un fichier CHM (ce qui n’est pas systématiquement le cas dans les étapes précédentes). Pour l’obtenir, rendez-vous sur la page www.processtext.com et cliquez, dans la colonne de gauche, sur le lien Help Files : CHM viewer. Téléchargez le logiciel en utilisant le lien Click Here situé en bas de page (il s’agit d’une version complète, pas d’une démonstration). Installez le programme et lancez-le via le menu Démarrer. Afin d’obtenir l’interface en français, déroulez le menu Tools, Language : sélectionnez French et validez par OK. Pour ouvrir le fichier CHM précédemment créé, utilisez simplement le menu Fichier, Ouvrir CHM. Sélectionnez le fichier et validez en cliquant sur Ouvrir. Selon le nombre de pages, quelques dizaines de secondes peuvent être nécessaires pour charger le fichier.

Lisez vos fichiers CHM en tout lieu

Vous trouverez des lecteurs de fichiers CHM sur la plupart des plates-formes et ce gratuitement, ce qui vous permettra de profiter de vos sites en toutes circonstances. Ainsi, sous Mac, optez par exemple pour CHMox (chmox.sourceforge.net), et sous Linux pour XCHM (xchm.sourceforge.net). Vous trouverez également des applications compatibles sur de nombreux téléphones. Ainsi, sur iPhone et iPod Touch, vous pourrez utiliser l’application iChm, gratuite sur l’App Store. Sous Android, optez pour iReader (1,99 $ dans Android Market).

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Stéphane Darget