UNE IA À SOI – PARTIE II

e-Drama en 5 actes

Acte I – T’as la réf?
Une fois l’IA installée localement, une nouvelle phase a débuté : celle du Large Vision Model (LVM). Pour qu’une IA appréhende une époque, un style, une manière de regarder, il faut lui construire un référentiel.
Le mien est clair : travailler sur des maisons de couture « oubliées » mais qui ont pourtant marqué leur temps –de la fin du XIXe siècle au premier tiers du XXe–

Acte II – Self Obsessed
J’ai commencé par une obsession : la maison des Sœurs Callot (1895–1953).
Quatre soeurs, « les quatre filles du docteur March » de la Couture dans un atelier où règne élégance précieuse et inventive.
Elles ont précédé Chanel, formées Madeleine Vionnet et l’une d’elles (Marthe Bertrand) est l’arrière-arrière-grand-mère d’Isabelle Huppert…

Soeurs Callot-robe du soir-1915 – Image Wikipédia

Pendant plusieurs jours, j’ai donc constitué un corpus d’images qui deviendra le référentiel. Plongée dans mes livres d’histoires de la mode et magazines d’époque… Consultation d’archives numériques, de bases spécialisées, des sites de musées, de studios photos…

Acte III – Dataset go !
Chaque image doit être scrupuleusement décrite, datée, numérotée. Cadrage, angle, texture, style doivent être vérifiés voire corrigés.
Pour terminer chaque image doit être attachée à un fichier-étiquette que l’on doit créer.

Avec ces caractéristiques l’IA « comprend » ce qu’elle doit retenir.

Et parce que le choix des images oriente. C’est ici que se glisse un biais assumé : Si je ne retient que certains volumes, certains détails, ce sera un dataset des Sœurs Callot, vu à travers mon regard. Dans ma démarche je me dois de rester exhaustif.

ENTRACTE

Acte IV – Chauffe Marcel !
Le dossier dataset_callot_v1 était prêt et il restait à (enfin) entraîner l’IA !

Là aussi, il faut choisir le bon dosage dans un océan de paramètres, activer des extensions, comprendre ce que chaque options implique. C’est à ce moment que se défini la qualité du dataset.
Je vous passe le big bazar, les erreurs de débutant, les fichiers qui refusent de se charger…

Une fois tout mis en place, la puissance de l’ordinateur (la carte graphique) va entrer en jeu. Le dataset des Sœurs Callot contient un peu plus de 100 images et 100 étiquettes. Avec le calibrage choisi, cela correspond à 47 minutes d’entraînement, une température dans la pièce qui augmente de 10°C et quelques décibels en plus…

Je vous laisse imaginer les salles de serveurs d’OpenAI…

Acte V – Test me if you can
47 minutes plus tard une nouvelle phase pouvait débuter. Il s’agissait désormais de comprendre les résultats que j’allais obtenir afin de finaliser un dataset livrable « livrable ».
Pour cela il faut entamer une batterie d’essais successifs, voici deux choses à retenir:

  • créer un prompt initial, sans biais pour confronter l’image générée aux sources originales.
  • créer un prompt « à trous », livrable, aisément éditable pour personnaliser le résultat

Test après test, j’ai identifié ce qui fonctionnait, ce qui échappait à l’IA, ce qui restait flou ou maladroit.
Le résultat était mitigé, les images étaient mal travaillées et mal choisies…
Il fallait recommencer le dataset !

C’est ainsi qu’est né la seconde version, le dataset_callot_v2, puis la v2.1 et enfin la, v2.3 : 50% plus fournie, plus cohérente, plus fidèle.

Alors, j’ai pu commencer à travailler comme un styliste avec le prompt « à trous ».
Petit à petit, un style Callot réinterprété a émergé, laissant libre champ à l’imagination.

Épilogue – Sky is the limit
L’IA « à soi » est un studio de production et non de substitution, un assistant visuel pour l’historien, le designer, l’artiste et un espace d’expérimentation sans limites.

NB
Depuis j’ai trouvé des dizaines de nouveaux modèles de la dernière période mais au style très différent. Un dilemme se pose dois-je créer une 4e version du dataset ou une version bis tenant compte des nouvelles inspirations de la maison?