06 février 2008

Nausées visuelles

Dans le problème de la recherche d'images pédopornographiques, j'ai déjà abordé le démontage du disque dur et la copie du disque dur ("La vue, c'est la vie").

J'ai également abordé les difficultés que je rencontrais avec la reconstitution des scellés. Au passage, je recommande cette méthode (trop forts les ricains) aux experts débutants qui me lisent. Personnellement, je continue à l'ancienne avec mon bâton de cire et mon creuset, sur de vieilles étiquettes récupérées et mes sachets de congélation...

Vous avez lancé vos scripts, vos virtualiseurs et vos différents programmes d'analyses. Vous voici donc à la tête de trois tas d'images:
- les images non effacées encore stockées de façon apparente sur le disque dur;
- les images effacées, récupérables avec leurs caractéristiques liées à l'OS (chemin d'accès vers le répertoire de stockage, dates de manipulation, etc)
- les images effacées, découvertes en zone non allouée, mais sans information OS.

Seulement voilà, l'habileté de vos outils à pister la moindre trace d'images vous place à la tête de 400000 (quatre cent mille) images...

Première étape: éliminer les doublons. Vous pouvez utiliser Picasa ou mieux ftwin.

Deuxième étape: éliminer les icones. Personnellement, je procède par tri sur les tailles de fichiers. Il est rare qu'un fichier de taille inférieure à 2Ko contienne une information intéressante. Ceci étant, je n'efface rien, je mets simplement de côté pour investigations ultérieures si nécessaire.
Cette étape est périlleuse sous Windows XP car dès qu'un répertoire dépasse 3000 ou 4000 fichiers la manipulation de masse est difficile (du moins sur mon poste de travail). Alors 400000...

Troisième étape: repérer les images disposant de métadonnées renseignées de type EXIF ou IPTC. C'est souvent riche d'informations et permet également d'effectuer un classement (par date de prise de cliché, par type d'appareil photo, etc). Lire à ce sujet une anecdote sur l'excellent site de Sid (ou sur le site de l'excellent Sid:).

A ce stade, vous voici face à 100000 (cent mille) images qu'il va vous falloir étudier une à une... Comment procède-je?

Et bien, pour l'instant, je n'ai rien trouvé de mieux que de faire défiler l'ensemble des photos sur l'écran de mon ordinateur. J'utilise pour cela des logiciels très simples, comme IrfanView et Picasa. Les deux disposent d'un mode d'affichage de miniatures permettant d'afficher plusieurs images à la fois. Ils disposent également de fonctionnalités permettant d'imprimer des images sous forme de planches contact (pour le rapport).

A ce stade de l'expertise, il faut prendre la précaution de fermer la porte de son bureau parce que débute parfois une véritable descente aux enfers. Sur certaines expertises, j'ai eu droit à des collections d'images de cadavres mutilés à coups de machette, assortis des films des massacres associés. Dans un autre coin du disque se trouvaient des images d'enfants de cinq ans violés par des pédophiles.

Il faut sélectionner les images et films. Les classer. Les imprimer (pour les films, extraire les images les plus représentatives).

Cette partie de ce type d'expertise est très difficile.
J'en ai les larmes aux yeux rien que de l'évoquer.
C'est pour cela que je tiens ce blog.
Merci de m'avoir lu.

10 commentaires:

  1. ce type de sac existe en France et est utilisé par la PJ et la Gendarmerie, vous devez être dans un coin perdu.
    Sur le sac transparent est marqué "scellés judiciaires" et des rubans autocollants sont fournis. Ils se cassent tout seuls si on essaye de les décoller.

    Il y a plusieurs tailles de sacs transparents.

    donc ce n'est pas une nouveauté, mais votre région est en retard :)

    RépondreSupprimer
  2. Je n'ai pas dit que ces sacs n'existaient pas dans ma région... simplement que je ne les utilisais pas. Ceci dit, vous avez raison, je suis dans un coin désertique... et froid!

    RépondreSupprimer
  3. Merci pour ce témoignage. Je pense souvent aux policiers et auxiliaires de justice obligés de supporter la violence et la folie de déséquilibrés.

    C'est assez impressionnant à imaginer. Vous avez tout mon soutien.

    Sur une note plus technique, j'ai remarqué que certaines photos (notamment disponible sur google image) n'ont aucunes informations EXIF (très pratiques , je les ai découvertes grâce à WikiCommons qui montre tous les détails sur la prise de la photo).

    Cela est donc possible de les effacer ? (je ne demande surtout pas comment, je ne souhaite pas être à l'origine d'une difficulté accrue de votre travail ;).


    Bon courage !

    RépondreSupprimer
  4. perso, je fais un montage sous linux pour regarder les photos. je dédoublonne et j'utilise un script maison qui genère des planches de miniatures au format html (généralement 1000 par page). Ce script est basé sur convert d'imagemagick avec l'option autoorient. les planches html sont chainées (lien next), ca facilite la navigation.
    Pour les photos/non photos, j'ai un script qui regarde la taille des photos mais également la colormap sachant que le profil de la colormap d'une image informatique n'a rien à voir avec celui d'une vraie photo.

    RépondreSupprimer
  5. bonjour Zythom,
    un de mes amis a récemment eu une "panne de fichier Word", perdant du coup 6 mois de travail.

    Amenant son portable à la FNAC, ceux-ci ont réussi à le retrouver l'intégralité des versions de ce fichier, soit environ 300 versions via diverses sauvegardes, la plus récente (choisie à l'oeil nu) datant d'il y a une semaine.

    Mon ami a été très surpris (et heureux) d'apprendre que les techniciens de la Fnac ont utilisé une méthode "brutale" pour faire recracher au disque dur TOUS ses fichiers Words, depuis la Génèse.


    ...

    "AhhA! que n'es-tu pas un peu naïf, mon ami", enchaînais-je, "tu ne sais pas jusqu'où un disque dur peut révéler entre les mains d'un expert."


    J'en ai profité pour lui recommander la lecture de votre blog.

    En passant, êtes vous au courant du giga scandale hongkongais actuel? Un acteur ayant amené son PC en réparation, les techniciens ont trouvé un paquet impressionnant de photos et de vidéos prOnos l'impliquant avec d'autres stars (de la chanson genre sainte nitouche à la Britney Spears au début de sa carrière nommée Gillian Chung).

    ...fuite via internet, les autorités tentent de stopper la chose, sans succès, les stars dont la carrière est désormais foutue prétendent au photomontage.
    Le hacker a promis de mettre en ligne les vidéos prochainement.

    Les hongkongais sont très, très partagés sur cette histoire. Ca dépasse de loin le simple voyeurisme paparazziste et vient chambouler le puritanisme des uns et la naïveté des autres.

    Si l'affaire vous intéresse, je vous enverrai quelques renseignements au fur et à mesure que ma femme me les traduit ;)

    RépondreSupprimer
  6. Je découvre via Cyberpoete votre blog et ce premier article m'a bougrement interessée. Je n'aimerais pas avoir à subir la violence que votre profession vous impose et imagine les sales nuits que certains de vos dossiers doivent vous faire passer. Courage...

    RépondreSupprimer
  7. Pour revenir à un aspect technique, l'analyse d'un gros volume d'images, il y a quelques années j'ai eu une discussion passionnante avec des informaticiens graphistes qui m'ont appris que nombre d'entre eux travaillaient d'arrache-pied pour mettre au point un algorithme permettant d'analyser une photo afin d'identifier certaines formes et objets contenu dans une image.
    Le but était de mettre au point une application pour la sélection d'images et de dessins (uniquement à partir de leur contenu) destinés à la réalisation de dessins animés.
    Par exemple, dans une base de données de plusieurs milliers de photos ou de dessins vous pourriez sélectionner toutes celles qui représentent un arbre, un oiseau, un ballon rouge, une voiture connue, ou plus difficile, une personne célèbre.

    Je ne sais pas où en sont les recherches, mais je pense que l'ingéniosité, l'imagination et la créativité de certains spécialistes ont bien du permettre d'arriver à mettre au point quelques systèmes et algorithmes efficaces pour une première analyse en masse.
    Si certains connaissent un utilitaire dans ce domaine, ou ont des idées ou des infos à ce sujet, ce serait intéressant de les connaître.

    RépondreSupprimer
  8. Désolé de m'éloigner de l'aspect émotionnel du billet de Zythom, mais je reviens sur l'idée de mon dernier commentaire : l'analyse automatique du contenu d'une image.

    Je n'ai pas de solide formation ni en mathématique ni en informatique, mais je me souviens de mes cours de fac (études commerciales) sur les calculs statistiques permettant de vérifier si deux phénomènes sont liés. Le but étant bien sûr de trouver une corrélation entre plusieurs informations (statistiques) afin de définir une stratégie commerciale efficace.

    Par exemple, en marketing nous avions étudié entre-autre le test du Khi2. Nos exercices de travaux pratiques nous avaient permis de déduire qu'il y a un lien incontestable entre la pointure des chaussures et la tailles des pieds des consommateurs… D'autres études plus sérieuses nous avaient aussi permis de définir des liens entre des données à priori bien éloignées (ex. taille, couleur des voitures avec sexe, âge de leurs conducteurs).

    Plus concrètement, par extrapolation, ne serait-il pas imaginable d'avoir d'un côté une série de photos caractéristiques et de l'autre une série de photos à analyser. Une méthode similaire au Khi2 (si tant est qu'on arrive à attribuer des données mathématiques récurrentes liées au contenu des photos - merci aux mathématiciens de donner leur avis) permettrait de dire si les secondes ont un lien ou une ressemblance avec les premières… Le sujet est passionnant à mon avis.

    RépondreSupprimer
  9. Alors que donne votre liste municipale? Je suppose qu'être avant avant dernier sur la liste,ne vous dispense pas d'aller porter des prospectus chez les gens. c'est amusant ?

    RépondreSupprimer
  10. @poilauxpattes: Il y a effectivement des recherches sur le type d'approche que vous décrivez (utiliser des critères sur lesquels on voit une vraie séparation entre les catégories d'images qu'on veut discriminer).

    Je me rappelle avoir entendu parler, disons environ vers 2000, d'algorithmes de détection d'images pornographiques (pour filtres parentaux etc.). Cependant, on m'avait dit que c'était marginalement plus astucieux que de regarder la proportion de l'image de couleur chair... (Je ne me suis pas renseigné plus avant, et le cryptographe qui m'a dit cela n'était sans doute pas lui-même le plus au fait des choses. Il se peut donc qu'il s'agisse d'une exagération.)

    RépondreSupprimer

Lectrice, admiratrice, avocate, magistrate, programmeuse, dessinatrice, chère consœur, femmes de tous les pays, lecteur, j'ai toute confiance en vous pour prendre bien soin de vérifier que votre prose est compatible avec les normes orthographiques et grammaticales en vigueur. Et si vous pouviez éviter les propos insultants ou haineux, je vous en serais reconnaissant.
N'hésitez pas à respecter ces quelques règles qui peuvent même s'appliquer en dehors de ce blog.

Les commentaires sur ce blog sont modérés. Votre message apparaîtra sur le blog dès que le modérateur l'aura approuvé. Merci de votre patience.