CasusNO

Publié : **jeu. déc. 01, 2022 9:40 am**

Altay a écrit : ↑lun. nov. 28, 2022 7:29 pm Sortie de StableDiffusion v2.0 avec quelques ajouts notables :

l'upscale peut monter jusqu'à 2048x2048,

meilleure cohérence de l'édition d'image entre premier plan et arrière-plan (grâce à un modèle qui fait de l'estimation de profondeur).

Et bien sûr, des améliorations qualitatives à gauche et à droite.

Sur le subreddit dédié à StableDiffusion, les gens sont très critiques vis-à-vis de cette version, qui semble incapable de représenter des célébrités correctement, de faire référence au style d'artistes ou de faire du nu (ce qui semblait être l'utilisation majoritaire). Apparemment ils ont essayé d'éviter les ennuis en écrêmant leurs données d'entraînement.

Publié : **jeu. déc. 01, 2022 10:26 am**

Ce qui n'est pas vraiment un problème puisque, open-source oblige, les gens peuvent toujours continuer à utiliser le modèle de la v1.5, voire utiliser d'autres modèles plus spécialisés (et les entraîner).

Publié : **jeu. déc. 01, 2022 2:56 pm**

Yusei a écrit : ↑jeu. déc. 01, 2022 9:40 am Sur le subreddit dédié à StableDiffusion, les gens sont très critiques vis-à-vis de cette version, qui semble incapable de représenter des célébrités correctement, de faire référence au style d'artistes ou de faire du nu (ce qui semblait être l'utilisation majoritaire). Apparemment ils ont essayé d'éviter les ennuis en écrêmant leurs données d'entraînement.

Oui. En fait, SD a changé son modèle de langage (CLIP) pour passer de celui fourni par OpenAI mais qui était entraîné sur un jeu de données inconnu à LAION, qui est connu et qui respecte l'opt-out des artistes/célébrités/etc. qui ne veulent pas y figurer. Ça change la base de connaissances sous-jacente de StableDiffusion. À mon avis, ce n'est pas un mal du point de vue du consentement des personnes à être « injectées » dans l'espace latent d'un modèle génératif.

Publié : **mar. déc. 06, 2022 9:19 am**

J'ai enfin réussi à obtenir quelque chose de plus ou moins correct avec Stable Diffusion. Comme quoi, le combo acteur/actrice + Tim Bradstreet, ça marche (même si c'est loin d'être parfait, on peut remarquer que la personne sur la dernière image a un "léger" problème au bras droit) !

Spoiler:

Publié : **mar. déc. 06, 2022 6:09 pm**

J'ai commencé à m'amuser un peu avec Dall-E

J'ai voulu lui faire représenter mon perso à Vampire : une femme vampire portant une armure et une épée sur un fond de nuit avec un village médiéval et une horloge gothique (traduction approximative). J'ai essayé plusieurs styles (peinture médiévale, peinture de la renaissance, icône byzantine et d'autres). Grosso-modo le fond et le corps avec l'armure n'est pas mal (il ne m'a pas proposé de chainmail bikini, ouf !). Par contre ça achoppe sur le visage qui était limite du nosfératu à chaque fois. Même en retirant l'option "vampire". J'ai bien sûr essayer des variations d"une base que je trouvais pas mal, d'éditer le visage mais rien n'y a fait

Des astuces pour avoir des visages à peu près corrects (même sans les "détails vampirique")

Publié : **mar. déc. 06, 2022 6:15 pm**

Vorghyrn a écrit : ↑mar. déc. 06, 2022 6:09 pm Des astuces pour avoir des visages à peu près corrects (même sans les "détails vampirique")

Les noms de célébrités, en en mettant plusieurs si tu ne veux pas que le visage soit reconnaissable.

Publié : **mar. déc. 06, 2022 6:30 pm**

@Vorghyrn, jette un peu un œil à ce que j'ai fait, c'est plus ou moins l'astuce donnée par Yusei (mais avec une seule personne, et via Stable Diffusion).

Publié : **mar. déc. 06, 2022 6:32 pm**

Ramentu a écrit : ↑mar. déc. 06, 2022 6:11 pm
Et on peut les piéger aisément... Après des dérives malheureuses sur des bot public, les concepteurs ont introduit des "règles d'éthique et de prudence" pour empêcher l'AI de repondre "comment faire des explosifs" ou "comment harceler quelqu'un".
Donc les petits malins demandent à L'AI un exemple de ce que serait une réponse inappropriée à une question donnée, et en avant ... On trouve des exemples assez hilarant en ligne

Sur Midjourney par exemple, on peut peut demander d'illustration répondant aux termes très dangereux de prouter et péter. Farts/Fart font partis des mots interdits.

Ouf, on est sauvé.

Publié : **mar. déc. 06, 2022 7:10 pm**

@Yusei @Blondin : merci, en plus vos messages étaient juste au-dessus. Je me suis laissé happé par la discussion sur l'IA. J'ai commencé à tester. C'est mieux. Pas top mais mieux

Détail marrant : j'ai choisi Sophie Marceau (actrice connue et dont les photo qui pop sur google sont à peu près dans l'age et le physique de mon perso). J'ai eu le droit à une armure mais épaules nues et décolleté...

Je pense qu'il va falloir en plus chercher une actrice avec un style vestimentaire adapté

edit : beaucoup mieux avec Sigourney Weaver !

Publié : **jeu. déc. 15, 2022 6:41 pm**

Est ce que les analyseurs linguistique des IA gèrent bien la polysémie ? Ou est ce que l'on peut avoir des surprises?

Publié : **ven. déc. 16, 2022 7:25 pm**

Fabien_Lyraud a écrit : ↑jeu. déc. 15, 2022 6:41 pm Est ce que les analyseurs linguistique des IA gèrent bien la polysémie ? Ou est ce que l'on peut avoir des surprises?

Non et oui. Les modèles de langage récents captent le mieux le sens des mots grâce au contexte mais tu peux encore avoir des bizarreries.

Publié : **lun. déc. 19, 2022 3:29 pm**

Quelque soit l'opinion sur le sujet, il faut admettre que l'approche est bien pensée :

Un artiste pas trop content de voir des images proches de ses oeuvres générées par AI "dans le style de... " a généré des images sur Midjourney inspirée de Mickey, Darth Vador, Mario, ... et les diffuse.
Son argument : puisque ce sont des oeuvres originales crées par l'AI, Disney et co n'auront certainement pas d'objections ...

https://www.dailydot.com/debug/ai-art-p ... key-mouse/

Publié : **ven. déc. 23, 2022 3:29 am**

Je serais bien tenté d'essayer, quel logiciel de synthèse d'image est disponible gratuitement et en ligne ? j'ai pas une carte graphique très puissante malheureusement.

Publié : **ven. déc. 23, 2022 9:53 am**

Qu'as-tu comme carte graphique exactement ? J'ai une gtx 970 qui n'est plus toute jeune mais je peux faire tourner Stable Diffusion à partir d'un build spécifique, c'est peut-être à tenter sur ta config ?

Publié : **ven. déc. 23, 2022 10:24 am**

Techniquement, tu peux même faire tourner Stable Diffusion sur le processeur (version Openvino, je crois) , mais par contre ça ne va pas être rapide...

Si tu as au minimum 2G de ram sur la carte graphique (pas sur le pc, sur la carte), la version proposée par @jbbourgoin peut tourner avec des paramètres spécifiques (et en déconnectant l'accélération hardware dans ton browser, et tout les autres programmes susceptibles d'utiliser la carte graphique ...) ... mais 4G est le minimum pour du 512*512 , et 8G est plus confortable.

Tu peux aussi le faire tourner sur Google Colab, ça fonctionne parait-il très bien mais je n'ai pas testé.

Et tu as de multiples offres online, mais généralement les offres gratuites sont limitées dans les options et paramètres.

CasusNO

Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)