La lutte contre les malwares est un jeu de chat et de la souris long et fastidieux. Elle demande de la patience, des connaissances et du temps mais s’effectue toujours dans l’urgence. Car face à un programme malveillant bien conçu et rapide à se diffuser chaque heure compte pour endiguer le mal et limiter les dégâts potentiels.
La vitesse de l’intelligence artificielle
Désormais, les chercheurs en sécurité pourront compter sur un nouvel allié : le machine learning, ou apprentissage automatique. Ce champ de l’intelligence artificielle permet à une machine d’apprendre « seule », peu à peu, en ingurgitant des quantités colossales de données. En l’occurrence, Cylance, la société derrière ce projet a accumulé entre 1 et 2 Petaoctets d’informations dans son ensemble de données.
Grâce à cela, en l’espace de 100 millisecondes et même moins, les chercheurs assistés de ces nouveaux programmes sont capables de déterminer si un ensemble de code est un malware ou juste un énième remake de Flappy Bird. Appelons ça du progrès !
Une longue phase d’apprentissage
Pour arriver à des résultats aussi rapides, des chercheurs ont développé un module de deep learning qui applique une analyse statique au code afin de rapidement identifier un malware – et évidemment, à termes, de le mettre hors d’état de nuire.
Ce sont deux chercheurs qui sont à l’origine de ce projet qu’ils présenteront d’ailleurs en août prochain lors de la Black Hat de Las Vegas. Les deux hommes travaillent pour une société baptisée Cylance qui promet d’ores et déjà la prochaine génération d’antivirus…
Matt Wolff, un des scientifiques, explique à Dark Reading, que lui et son équipe ont nourri et entraîné leur intelligence artificielle en lui soumettant des fichiers sans danger et d’autres malicieux et en lui précisant à chaque fois lesquels étaient sains et lesquels pouvaient poser problème. Un processus qui demande du temps : « nous avons en général une petite centaine de processeurs qui tournent pendant des jours pour traiter et assimiler les données, puis qui fonctionnent pendant des semaines et des mois afin d’entraîner les machines et de leur apprendre », remarque Matt Wolff.
Après cette phase d’apprentissage, le système est alors capable de détecter qui est qui, même avec un fichier qu’il n’a jamais rencontré. Pour identifier un malware pas même besoin de l’exécuter dans une sandbox et d’ensuite se livrer à une longue analyse. L’analyse statique fait gagner un temps fou.
Plus efficace
Si l’idée d’appliquer le machine learning et le deep learning à la lutte contre les malwares n’est pas nouvelle, elle a fortement évolué dans les deux dernières années, explique le chercheur en sécurité à Dark Reading. Les progrès réalisés par les composants (processeurs, mémoire, etc.) ont permis au cloud d’offrir une alternative crédible pour les chercheurs qui n’ont plus besoin de se lancer dans la réquisition de tout un data center.
De plus, le deep learning, qui est très efficace dans la reconnaissance de schémas répétitifs, s’avère parfait pour détecter des malwares qui recourent à des stratégies de contamination, d’expansion et de fonctionnement toujours très semblables, malgré leur nature « polymorphe ». Le deep learning est selon le scientifique de Cylance plus efficace que les outils actuels, qui reposent sur les signatures des malwares.
Mais si la lutte contre les malwares est plus efficace, ces derniers ne disparaîtront pas pour autant. Il va donc falloir continuer à vous servir de votre intelligence, pas artificielle, pour éviter leurs pièges.
A lire aussi :
Une puce dopée au deep learning pourrait rendre nos smartphones bien plus intelligents – 18/05/2015
Source :
Dark Reading
🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.