Tweets Analyzer a été développé par @x0rz, un chercheur en sécurité informatique, il s'adresse aussi bien à des journalistes qu'à de simples curieux, soucieux de comprendre l'ensemble des métadonnées peuvent compromettre l'identité d'un utilisateur sur Twitter, comme l'explique dans ce billet l'auteur de Tweets Analyzer. Il fournit une approche très pédagogique pour qui cherche à comprendre une notion complexe : l'anonymat sur Internet. Comme cet outil s'adresse à tous, nous allons détailler l'installation pas à pas.
L'installation
Vous aurez tout d'abord besoin d'installer pip :
$ wget https://bootstrap.pypa.io/get-pip.py # python get-pip.py
Vous aurez également besoin de Git s'il n'est pas déjà installé sur votre machine (adaptez la commande d'installation en fonction de votre distribution) :
# apt-get install git
Le code de Tweet Analyzer est donc disponible sur GitHub.
$ git clone https://github.com/x0rz/tweets_analyzer.git
$ cd tweet_analyzer
Un fichier requirements.txt est fourni il vous permet de les installer très simplement en lançant la commande suivante
# pip install -r requirements.txt
Si tout s'est bien passé, vous obtiendrez quelque chose comme ceci :
Comme Tweets Analyzer utilise l'API de Twitter, vous allez avoir besoin de créer une application sur dev.twitter.com. Une fois identifié, rendez vous sur la page https://apps.twitter.com/ et créez une nouvelle application
Puisque l'on parle de confidentialité, sachez que Twitter va vous demander votre numéro de mobile pour créer une application...
Une fois votre application crée, une paire de clés a été généré pour y accéder cliquez sur l'onglet Keys and Access Tokens. Vous aurez besoin de cliquer sur un bouton pour générer la paire de clé de l'access token. Une fois en possession de nos 4 clés, nous allons tout simplement renseigner le fichier secret.py pour y coller ces clés.
On édite donc ce fichier avec notre éditeur de texte préféré
$ emacs secrets.py
Une fois renseigné, votre fichier ressemble à ceci
Nous sommes maintenant prêts pour utiliser Tweets Analyzer
On commence comme toujours par regarder quelles options nous sont proposer et la syntaxe en lançant :
`$ ./tweets_analyzer.py -h``
help
On peut donc maintenant passer à l'analyse d'un compte, pour notre exemple nous allons prendre celui du nouveau président américain @potus qui ne compte pas beaucoup de tweets mais révèle tout de même des choses intéressantes. Notez que par défaut, Tweets Analyzer analyse les 1000 derniers tweets, vous pouvez avec l'option --limit augmenter cette valeur mais l'API de Twitter ne semble pas aimer qu'on la sollicite de trop.
$ ./tweets_analyzer.py -n potus
Et voici ce que nous obtenons :
Nous apprenons donc que le président Trump tweete principalement le soir entre 19 et 21h, qu'il tweete exclusivement depuis un iPhone et que la personne qu'il aime le plus retwitter n'est autre que lui même avec 66 retweets de son compte @realDonaldTrump . On apprend enfin qu'il se parle régulièrement à lui même encore avec 74 mentions... à lui même. Moralité, tweeter à l'heure de l'apéritif peut mener à d'étranges comportements.
Vous pouvez évidemment faire des traitements plus fins grâce à Tweets Analyzer avec l'option de filtre et l'analyse des followers d'un compte avec l'option --friend.