“ Ni les SAN ni les NAS n’offrent les performances nécessaires à notre moteur de recherche Voila “, lâche Rémi Poulet, directeur technique de Wanadoo Portail. En 2000, Wanadoo voulait évoluer vers une infrastructure plus centralisée, afin d’optimiser l’exploitation et de faciliter les sauvegardes. Lors d’une vaste campagne de tests, deux fournisseurs de SAN et un constructeur de serveurs de fichiers ont été mis à contribution. Aucune architecture n’a été en mesure de supporter le flux très particulier d’entrées-sorties d’un moteur de recherche : les accès disques portent sur des volumes réduits mais très nombreux.“Les caches conviennent, à la rigueur, en lecture. Mais les accès en écriture constituent un goulet d’étranglement qui limite le nombre de pages indexées “, précise Rémi Poulet. Il a donc fallu garder l’architecture distribuée existante, par ailleurs moins coûteuse, qui, faute d’offrir une haute disponibilité, permet de répartir les risques. Pour la partie francophone de Voila, quarante-cinq serveurs Linux sont fédérés par un réseau Gigabit Ethernet. Chaque serveur intègre environ 100 Go grâce à des disques SCSI de 9 ou 18 Go. Les disques de plus grande capacité sont, en effet, incapables de supporter le fort débit d’entrées-sorties nécessité par le moteur de recherche. Au total, le volume approche 5 To, à multiplier par trois si l’on inclut les moteurs de recherche en espagnol et en néerlandais. Cette architecture distribuée rend toutefois impossible une sauvegarde totale des données. Seuls les index sont mis à l’abri, soit 25 millions d’URL, pour un volume de 2,5 Go. Ils sont répliqués sur chaque serveur, à partir d’un serveur maître qui, par ailleurs, les recopie sur un lecteur de cartouches interne. En cas d’incident, les autres informations (analyses sémantiques, thématiques et résumés des pages Web) peuvent être perdues.
Les SAN à l’étude en fin d’année
Wanadoo n’est pourtant pas allergique aux NAS ni aux SAN : les messages électroniques et les pages Web personnelles de ses clients sont stockés sur quatre serveurs de fichiers de Network Appliance totalisant 4 To de capacité, et un serveur du même type héberge 1 To de contenu mutualisé, fourni par des partenaires. Enfin, des serveurs de Streaming attaquent, via de traditionnels attachements SCSI, une baie de disques partagée de type Compaq StorageWorks. “Les volumes des données vidéo sont faibles, mais quand ils augmenteront, nous devrons sans doute passer aux SAN. Ceux-ci pourraient aussi nous permettre d’améliorer la disponibilité du stockage des messages et des pages Web “, conclut Rémi Poulet.
🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.