Surprise ! Les 2,8 millions d’applications disponibles sur le Play Store de Google (chiffres Statista de juin 2017) ne sont pas observées une à une par un humain méticuleux afin de débusquer les éventuels programmes dangereux.
La tâche est colossale et, au fil des années, le géant américain a multiplié les strates et outils (du physionomiste à l’entrée à des outils de scan ultra-performants) avec plus ou moins de bonheur.
Comparer pour mieux débusquer
La dernière approche en date promet de protéger les utilisateurs, en scrutant de près les critères de chaque application présente dans le Play Store qui pourraient nuire au respect de la vie privée et à la sécurité des utilisateurs.
Pour y arriver, Google utilise un système éprouvé qui compare les applications similaires entre elles. Ainsi, une appli de coloriage sera confrontée à une somme d’applications du même genre. Et si un de ces programmes étudiés demande à accéder à la position géographique et au carnet d’adresses de l’utilisateur alors que ce n’est pas la norme, le système de Google tirera la sonnette d’alarme. Car il y a fort à parier que ce cahier de coloriage numérique ne soit pas ce qu’il prétend être.
Néanmoins, les ingénieurs du géant américain se sont rendus compte qu’un système de catégories trop étroitement définies ne correspond pas à un paysage applicatif qui évolue vite. Sans compter qu’une curation manuelle de ses catégories est lente et un nid à erreur.
La force de l’intelligence artificielle
Google s’est donc tourné vers un de ses points forts : l’intelligence artificielle. En comptant sur l’apprentissage machine, l’énorme quantité de données que représentent les presque trois millions d’applications ne sont plus un handicap, mais, au contraire, un avantage. Ces informations deviennent une masse d’éléments qui permettent d’apprendre à une intelligence artificielle à traiter automatiquement des requêtes.
En l’occurrence, les ingénieurs ont développé un algorithme pour répartir dans des groupes des applications aux fonctionnalités similaires. Pour cela, les métadonnées déjà structurées de l’application (la description textuelle, les données métriques liés aux utilisateurs, comme les installations, les autorisations demandées ou encore son comportement, etc.) sont analysées et soumises à l’algorithme.
Groupées, ses applications sont alors comparées les unes aux autres pour débusquer les éventuelles irrégularités concernant la sécurité et le respect de la vie privée.
Le géant de Mountain View souligne l’importance des travaux précédents, qui ont été permis cette nouvelle étape. Ainsi, l’analyse par groupe d’applications similaires, les modèles d’apprentissage profond pour les langues, qui servent à affiner la constitution des groupes, et enfin les analyses automatiques des données sont au cœur de cette nouvelle solution qui s’ajoute à l’effort général que Google appelle son combat contre les PHA, les Potentially Harmful Apps, les applications potentiellement dangereuses. Les efforts du géant du Web semblent porter leur fruit. Entre 2015 et 2016, les applis dangereuses présentes sur le Play Store sont passées de 0,15% à 0,05%.
Source :
Blog sécurité de Google
🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.