đ L'IA pour crĂ©er des vidĂ©os, des robots plus forts que toi au ping pong
Ton rapport du mois d'octobre est prĂȘt
Hey!
JâespĂšre que tu passes un bon week-end. Si câest le cas, il risque dâĂȘtre encore meilleur đ
Le voilĂ enfin ! Ton rapport du mois dâoctobre est prĂȘt. Je te parle de tout ce qui sâest passĂ© dâintĂ©ressant en intelligence artificielle.
đ De quoi on parle aujourdâhui
đ§đŒâđ» Google veut sa part dans lâAI art
⫠Runway efface, Runway remplace ! (et ça vaut le détour)
đ Les robots de Google jouent au ping pong
đ©đ»âđ» Interview warmup vous aide Ă prĂ©parer vos entretiens
đŹ Trouver les bons prompts est devenu un skill recherchĂ©
đ De arxiv Ă ar5iv
đ Etalab introduit un nouvel outil (ENFIN!)
đ Python 3.11 est lĂ
đ AudioLM, le nouveau modĂšle de Google pour continuer les audios
đ€ Câest parti !
Pour donner une grille de lecture de ce qui se passe en IA aujourdâhui, il est clair que les modĂšles de gĂ©nĂ©ration dâimages/vidĂ©os sont le sujet le plus chaud du moment.
MĂȘme si les GAFAM par exemple, sont trĂšs actifs sur Ă peu prĂšs tous les fronts.
Dâun point de vue global, concernant le paradigme dans lequel Ă©volue lâintelligence artificielle, beaucoup de choses risquent de changer.
Les modĂšles dâentreprises Ă impact comme OpenAI sâessoufflent, et devraient bientĂŽt laisser leur place Ă des acteurs comme Stability.ai qui proposent un fonctionnement plus communautaire et libre, ou carrĂ©ment Ă des approches dĂ©centralisĂ©es.
Il est surprenant quâun modĂšle comme DALL-E 2, entraĂźnĂ© avec les travaux dâartistes et de photographes partout dans le monde, ne bĂ©nĂ©ficie quâĂ une poignĂ©e de privilĂ©giĂ©s.
Mais bon, OpenAI sait mieux que nous ce qui est bien pour nous đâŠ
Google introduit Imagen video
AprĂšs lâannonce de Make-A-Video par Meta en septembre, Google aussi avance ses pions sur la gĂ©nĂ©ration de vidĂ©os par intelligence artificielle.
MĂȘme si Google travaille beaucoup sur ces sujets lĂ , ils nâont pas Ă©tĂ© autant mis avant quâOpenAI ou Meta.
Pour lâinstant on a quâune landing page et un article de recherche, je ne sais pas si Google donnera accĂšs Ă son modĂšle.
Trouver les bons prompts est devenu un skill recherché
Avec la dĂ©mocratisation des modĂšles de gĂ©nĂ©ration dâimages, il est devenu important de trouver les bonnes formulation pour permettre aux modĂšles de comprendre au mieux la requĂȘte.
Jâai trouvĂ© un petit projet trĂšs intĂ©ressant qui recense, Ă lâaide dâun arbre interactif, les prompts entrĂ©s par les utilisateurs de stable diffusion.
Lâauteur, Teo Sanchez (que jâai rencontrĂ© dĂ©but octobre dâailleurs, on prĂ©pare quelque chose avec La revue IA âïžđ), a rĂ©digĂ© un article sur le sujet, le voici.
AudioLM, un modĂšle de Google pour continuer les audios
Les modĂšles de reconnaissance vocale d'aujourd'hui sont de plus en plus performants.
Et ça tombe bien car je pense que les interactions humains-machines se feront par la voix plus naturellement.
Par contre, lorsqu'il s'agit de faire de la synthĂšse vocale, c'est autre chose, on est encore mauvais sur ces sujets.
Google a proposé un modÚle capable de continuer des audios, copier la voix d'un humain pour finir une phrase, ou finir un morceau de piano, et ça marche plutÎt bien.
Sur cette vidéo on voit l'entrée du modÚle (la bande son avant les pointillés), et la continuation obtenue en sortie.
De arxiv Ă ar5iv
Jâai trouvĂ© une petite astuce super cool, surtout pour ceux qui lisent beaucoup de papiers de recherches sur arxiv.
En remplaçant le x de arxiv par un 5 dans la barre de recherche, on obtient une page web trĂšs quali avec le contenu de lâarticle, les noms des auteurs, les illustrations, les citations, tout y est !
Etalab introduit un nouvel outil
Câest toujours frustrant de devoir tĂ©lĂ©charger un dataset pour le tester. Câest trop lourd, ça prend du temps et câest peu sĂ©curisant. Les plateformes gouvernementales mâont fait perdre pas mal de temps Ă cause de ça.
Etalab vient dâintroduire un outil pour observer le contenu dâun dataset avant de le tĂ©lĂ©charger, enfin !
Runway introduit erase and replace
Runway, une des entreprises partenaires du projet stable diffusion, a introduit une nouvelle fonctionnalité.
Cette feature permet dâeffacer un objet en le sĂ©lectionnant avec un curseur, puis le remplacer en Ă©crivant du texte.

Interview warmup vous aide à préparer vos entretiens
La semaine derniĂšre Google a parlĂ© dâun projet assez impressionnant, il sâagit dâinterview warmup. Câest un outil qui utilise la reconnaissance vocale et du NLP, qui vise Ă aider les candidats Ă prĂ©parer leurs entretiens dâembauche.
Lâoutil est dĂ©jĂ utilisĂ© pour certains mĂ©tiers de la data ou encore lâUX design. Je te conseille vraiment de le tester !
Bonus : Stable diffusion To The Moon
Le modĂšle stable diffusion nâa pas encore montrĂ© tout ce quâil avait sous le capot. Le fait dâavoir laissĂ© le projet en open source a permis Ă la communautĂ© de crĂ©er des projets formidables avec stable diffusion.
Ce thread Twitter regroupe 14 spin-off de stable diffusion disponibles sous forme de notebook colab, qui permettent de faire de jolis projet artistiques. Jâen cite quelques-uns et je te laisse regarder en dĂ©tail si ça tâintĂ©resse :
GĂ©nĂ©rer les meilleurs prompts pour stable diffusion (dâailleurs, câest un gros sujet dont je parlerais bientĂŽt!)
Faire une interpolation entre 2 images générées
GĂ©nĂ©rer des objets en 3D avec stable diffusion (en sâinspirant du modĂšle dreamfusion)

Quelle belle maniĂšre de conclure cette veille đ
Comme dâhab, nâhĂ©site pas Ă partager et rĂ©pondre Ă ce mail pour me donner ton avis, ça mâaidera pour continuer ce projet :)









