Reflexões sobre ‘AI Art’ no Início de um Ano

O aparecimento de ferramentas muito sofisticadas de redes neurais no fim do ano passado, inaugurou uma crise existencial nas artes e na tecnologia. Proponho começar o ano do blog com esse assunto.

Quadros em uma parede
Imagem: Pexels

Estivemos atentos ao notável desfile de novas ferramentas de Inteligência Artificial apresentadas durante o ano passado.

As novas tecnologias de fato apresentam desafios aos artistas, o que sempre aconteceu. Mas não tenho certeza se o desafio da arte feita com inteligência artificial é tão diferente do desafio da arte feita por primatas ou elefantes. Ambos os casos revelam o problema subjacente de definir a arte em nosso tempo.

Historicamente e transculturalmente, a arte sempre teve muitas definições e serviu a muitas funções. Me parece necessário oferecer um contexto mais amplo para esta discussão, que até agora tem sido um tanto estreita e árida – mas isso é verdade para quase todas as discussões sobre arte em nosso tempo, não apenas para as deste assunto.

A noção atual de arte surgiu após o advento de duas novas tecnologias:

  • (a) fotografia,

que levantou questões sobre continuar a usar métodos mais antigos de imitar a natureza, e

  • b) fotografia reproduzida em massa (incluindo cinematografia),

que levantou questões sobre a singularidade – entendida como convergência de tecnologias – e da inovação como características definidora da arte. Mas é preciso observar que a arte é uma característica universal do gênero humano. Nem toda pessoa produz arte ou se interessa por ela, mas toda sociedade humana se preocupa com ela. Nem todas as sociedades, no entanto, definiram a arte da mesma forma ou atribuíram-lhe as mesmas funções.

O propósito da arte às vezes tem sido codificar simbolicamente e, assim, preservar o conhecimento prático, como quais plantas são comestíveis e quais não são. Ou para sinalizar o status e o poder de potentados. Ou para celebrar os ancestrais (como os totens da América do Norte). Ou, como objetos sacramentais, para mediar o sagrado. Ou para ajudar na meditação. Ou para promover a apreciação da beleza.

A arte segundo diversos povos

Ao contrário dos gregos, os egípcios não valorizavam nem a singularidade nem a inovação em si. Pelo contrário, valorizavam a fidelidade à tradição. Seus estilos artísticos mudaram, lentamente, mas não porque eles sentiram qualquer necessidade de experimentar ou melhorar paradigmas antigos.

Os chineses seguiram esse padrão. Eles também não valorizavam a inovação. Os artistas podiam pintar o mesmo ramo de bambu repetidamente, durante anos, antes de encontrar sua essência. Eles queriam que os artistas descobrissem o eterno Tao na natureza e o transmitissem em termos visuais.

Da mesma forma, os japoneses não restauravam seus templos. Em vez disso, eles continuavam a reconstruir essas estruturas – isto é, a reproduzir os protótipos exatamente da mesma maneira, de novo e de novo.

No Ocidente, os artistas medievais raramente assinavam suas próprias obras. Tampouco estabeleceram a iconografia – tarefa que a Igreja realizou por eles. Até hoje, os cristãos ortodoxos orientais recriam ícones antigos. Eles valorizam artistas que demonstram piedade pessoal acima da ambição pessoal.

No momento, como eu já disse, a arte é definida quase exclusivamente em conexão com a singularidade e a inovação. Os artistas não passam mais fome nos proverbiais sótãos na margem esquerda do Sena, mas tentam conquistar uma imagem pública de figuras de vanguarda na luta contra os “valores burgueses”.

Muitos artistas descrevem seu trabalho em conexão com a reforma ou revolução social e política. Outros artistas, seguindo a tendência contemporânea ao individualismo, usam seu trabalho para se expressar psicologicamente.

Outros tantos artistas usam linguagem científica para descrever seu trabalho, como se estivessem fazendo experimentos para aprender sobre a física da luz ou dos fenômenos ópticos. Nesse contexto, faz sentido questionar se uma obra de arte é original (com valor artístico e financeiro) ou cópia (com pouco ou nenhum valor).

Concluo

Um crescente número de pessoas ligadas à arte parece rejeitar qualquer linha dura de separação entre arte e mero artifício – me ocorre que alguns dos mais hábeis pintores de cavernas também poderiam considerar uma tela de tecido trapaça.

Na minha opinião, as tecnologias emergentes devem ser rotuladas como tal, para que possamos ver o que ela realmente tem ou não, e chegar mais perto de uma avaliação honesta assim que nossa indignação diminuir. Duvido que alguma inteligência artificial possa produzir algo que rivalize com as grandes e eternas obras de arte. Mas se chegar a tanto, que se mantenha-o rotulado como “Produzido por IA” [por favor].

A máquina mais sofisticada em existência não se pode comparar nem remotamente, no sentido verdadeiro, ao ser humano. Há uma diferença categórica. Uma inteligência projetada não cria verdadeiramente seu output, pelo menos não ainda. E se consideramos elementos como “musas”, “inspiração” e coisas do gênero, talvez os grandes artistas também não criem todas as suas obras espontaneamente.

Mas uma pessoa não se safaria levando o crédito pela beleza de uma paisagem selvagem. E um zircônio não pode reivindicar legalmente ser um diamante (mesmo que tenha personalidade). A distinção entre beleza natural, humana e a simulada por máquina permanece significativa – pelo menos por enquanto.

Parece improvável que isso mude completamente, mas se estamos indo em direção a uma completa indistinção entre homem e máquina, eu “exijo” que mantenhamos o controle e coloquemos carimbos de identificação em nossos Senhores Robôs.

Stable Diffusion: Variações Sobre um Leão

Uma postagem visual para suavizar o mais vital de todos os fins de semana da história brasileira. Minha exploração da arte digital baseada em Difusão Latente continua.

Meu pequeno logotipo é uma linda obra de arte, que chegou às minhas mãos na adolescência e que tenho até hoje. É uma charge de jornal – estrangeiro – do início do século 19, cujo o autor eu ainda não identifiquei, mas sigo procurando.

A arte, sobre a qual ainda falarei mais, mostra um leão exibindo seu perfil direito, em atitude heráldica “couchant”, habilidosamente inscrito no contorno da América do Sul. Um autêntico achado geométrico. É uma imagem evocativa de um Brasil grande e forte, estendendo seu olhar sobre o Atlântico sul.

É uma imagem que resume as aspirações da nação quando eu era jovem. É também uma imagem austera, que se pretende heráldica ao invés de fruto de design; vai contra o pós modernismo vigente, mas aqui no blog essa é exatamente a ideia.

Este blog existe por causa desta imagem; foi olhando para ela em pensamento profundo que me inspirei. “A voz do leão”, para tentar falar de tecnologia e ciência para a lusofonia, com um ‘modicum’ de profundidade – sem dar muita bola para o estilo superficial preferido nas redes sociais — como as pessoas fazem nos centros avançados do mundo. O Brasil é o Leão.

Eu quis fazer variações para poder usar a imagem em outros contextos que exijam um ‘look’ mais contemporâneo — com resultados medianamente animadores. Lancei mão da Stable Diffusion e, abusando da engenharia de prompt, passei algumas horas agradáveis tentando fazer arte. Aproveitei para usar o gadget ‘galeria de slides’ do WordPress pela primeira vez.


Não sei se verei esse Brasil grande, que faz tecnologia, que lança foguetes e satélites e junta à elite material do mundo. Se depender da classe política que aí está eu duvido muito que cheguemos lá. Foi sob a batuta do Ministro da Tecnologia, um aviador e astronauta formado por um instituto de tecnologia, que eu testemunhei o maior [talvez o único] desmonte deliberado de políticas tecnológicas do estado brasileiro em toda história [a começar do programa espacial, que se encontra desativado desde 2003].

Que o Brasil possa se reencontrar a partir das eleições de amanhã. Boa sorte a todos.

A Síndrome de Leonardo

Na blogosfera esta semana encontro um interessante post de onde tirei o título deste artigo. O tema de fundo é a procrastinação, algo com que a grande maioria das pessoas pode se identificar.

Vitruvian Man - arte
Imagem: Pexels

O post ao qual me refiro faz comentário sobre o livro de Peter Burke, The polymath: a cultural history from Leonardo da Vinci to Susan Sontag. Em uma passagem da obra o autor sustenta a tese, já defendida por outros, de que as aventuras criativas de Leonardo Da Vinci foram na verdade fracassos.

Exemplos de seus fracassos incluiriam não ter sucesso na quadratura do círculo [o que é geometricamente impossível], e em vários projetos de engenharia que não funcionaram – como uma besta gigante e uma máquina voadora; ter mal-entendido vários aspectos do coração; ter feito desenhos com tintas experimentais que resultaram em lenta degradação de algumas de suas pinturas.

Mesmo sua primeira encomenda registrada como pintor independente – um retábulo para a Capela de São Bernardo em 1478 – ele não conseguiu concluir, apesar de receber um adiantamento em dinheiro de 25 florins para isso. Muitos de seus contemporâneos registraram que ele não cumpria os prazos ou nem mesmo terminava projetos — como nunca ter terminou uma estátua equestre encomendada por Francesco Sforza.

O ensaio continua a explicar como o pensamento e o trabalho de Leonardo estavam fora das disciplinas da época (e sua abordagem ainda está fora de muitas que são ensinadas hoje), embora isso fosse uma desvantagem para sua carreira na época. Leonardo não era o “profissional sério”. Ele pegava algumas ideias e brincava com elas.

Um sentimento familiar

A esta altura começo a suspeitar que a Síndrome de Leonardo é a responsável pelas minhas longas noites. Com a Internet sendo tão vasta, há inúmeras coisas para experimentar e hackear [no sentido de ‘desmontar para conhecer o funcionamento’], e tenho inúmeros projetos inacabados guardados em meus discos rígidos [na verdade uso SSD’s]. Não sou um acumulador no sentido típico de guardar jornais velhos para a posteridade – e de fato sou um minimalista. Mas quando se trata da minha vida digital, é difícil resistir à facilidade de poder guardar montanhas de ‘jornais’ em forma de bits.

Leonardo ficaria paralisado pela web moderna. De certa forma sou como um renascentista, reunindo em meus escaninhos pequenos trechos de código que um dia podem ser úteis. Meus “favoritos” estão transbordando de URLs interessantes que pretendo revisitar algum dia. Eu sou um acumulador digital que procrastina muito em certos períodos. Não sei se preciso tomar providências para mudar, ou se isso é uma resposta natural à vastidão da web e a única maneira sensata de abordá-la.

Terminar o serviço é uma verdadeira dor

Em algum momento do projeto, chegamos à parte em que as coisas divertidas já foram feitas. Já aprendemos praticamente tudo o que foi possível com o exercício, e o trabalho está “90%” acabado.

Esses últimos 10%, no entanto, são uma ladeira íngreme, e muitas, muitas pessoas simplesmente acabam por abandonar o projeto nessa fase. Em muitos casos não há problema, se o objetivo principal era aprender e realmente não há “tração de mercado” suficiente para justificar a conclusão do projeto.

Se houver um requisito formal para concluí-lo (como, digamos, um contrato, com sua assinatura), é claro que os 10% precisam ser concluídos, não importa quão chato isso seja.

Há até uma piada no meio: “90% do projeto é concluído em 10% do tempo. 10% do projeto é concluído em 90% do tempo.” Já notou como, quando um novo prédio está sendo construído na vizinhança ele parece ficar “completo” em um tempo surpreendentemente curto? Contudo, quase sempre esse momento está apenas na metade do tempo da construção, e 100% do tempo tomado pelo projeto até aqui deverá se repetir antes que as portas se abram.

Isso porque fazer o exterior e a estrutura é simples e pode ser feito por praticamente qualquer pessoa. Alvenaria, janelas, portas, telhados, etc., são habilidades importantes, mas não extremamente especializadas.

O interior, porém, requer muita habilidade. Você não pode simplesmente trazer um martelador meia-colher. Você precisa de carpinteiros e marceneiros experientes e pintores bem remunerados. Essas pessoas são mais difíceis de agendar e não costumam apressar o trabalho. O resultado do trabalho deles é o que as pessoas verão de perto, todos os dias, então precisa de muito polimento e tem que ser robusto.

O mesmo com qualquer produto

No momento(*) estou escrevendo uma interface para padronizar a entrada de ‘prompts’ e parâmetros em plataformas como ‘Stable Diffusion’. Provavelmente o trabalho já estava 90% completo na semana passada, mas acontece que estabeleci um roteiro de teste bastante robusto para ele, e não consigo parar de testar. Estou encontrando bugs em minha implementação (sempre encontro), e estou corrigindo-os à medida que avanço. Também, como sói acontecer, estou sempre a encontrar “pequenas coisas” que esqueci de implementar.

Assim que eu tiver tudo funcionando para minha satisfação – e se achar que é de interesse geral, detalharei neste espaço.

(*)Muitas coisas chatas, mas isso significa que não preciso me preocupar com comunicação e marketing, muito críticos (e arriscados), que deixo aos parceiros mais habilitados.

De volta a Leonardo

Eu entendo o ponto do autor do citado blog, bem como o do formulador original da crítica, Peter Burke, talvez porque, como eles, eu também não acredite no mito do Superdotado Sobrenatural. A inteligência no fundo é um artefato cultural e precisa ser associada a outros atributos para levar ao sucesso. Ninguém, mesmo os gênios, tem uma visão privilegiada do Todo. Toda ciência e técnica é fruto de trabalho árduo.

Mesmo assim, os argumentos dos detratores são bastante injustos. Em favor de Leonardo, eu devo dizer ele tirava ideias de qualquer lugar – mas não apenas ideias que estavam no “cânone” de uma disciplina, e isso por si só é um portento admirável. Sobre fazer experimentos com tintas também não considero uma falha de caráter, pelo contrário. É, na verdade, um experimento que eu chamaria de audacioso – e de longo prazo. Sobre entender mal vários aspectos do coração, ele descobriu/teorizou como a válvula aórtica e seus folhetos funcionavam de uma forma que se mostrou correta – embora ele estivesse errado sobre a circulação sanguínea em geral.

Mona Lisa – obra inacabada

Não sei. Ele trabalhou nela por quatro anos, levando-a para todos os lugares onde ia para não ter que parar, e se ela estiver realmente inacabada pode ser simplesmente porque a mão direita do mestre estava começando a paralisar. Há mais a ser dito sobre o perfeccionismo na Mona Lisa do que a síndrome de Leonardo.

Leonardo definitivamente começou muito mais do que ele podia terminar (decepcionando muitos clientes, por certo), e tinha um certo auto engrandecimento em relação ao que ele dizia que podia fazer, mas os registros dos fatos não são muito precisos.

No fim de tudo, ele é lembrado porque, na verdade, tinha um conjunto muito grande de ideias detalhadas, desenhos, planos e realizações. A maioria de nós adoraria ter criado uma obra de arte tão inacabada quanto a Mona Lisa.


Leitura adicional recomendada

Burke, P. (2021) The polymath: a cultural history from Leonardo da Vinci to Susan Sontag. First published in paperback. New Haven London: Yale University Press.

A.I. Art – Meus Experimentos com o Incrível ‘Stable Diffusion’

Se você não está prestando atenção ao que está acontecendo com o súbito aparecimento da Difusão Estável, você está perdendo um momento realmente interessante na história da tecnologia.

Imagem: Pexels.com

Tudo começou quando há dez dias, em 22 de agosto, a start-up Stability.ai abriu o código-fonte de sua plataforma de síntese de imagem chamada Stable Diffusion – uma arquitetura de difusão latente semelhante ao DALL-E 2 do OpenAI e ao Imagen do Google, treinada com milhões de imagens extraídas da web. Desde então a tecnologia tem desfrutado uma contínua explosão de interesse.

Ao contrário do conteúdo deepfake baseado em autoencoder, ou das recriações da figura humana que podem ser alcançadas por Neural Radiance Fields (NeRF) e Generative Adversarial Networks (GANs), os sistemas baseados em difusão aprendem a gerar novas imagens adicionando ruído às imagens usadas como fontes. A reiteração desse processo ensina o sistema como fazer imagens plausíveis – e até foto-realistas – a partir apenas desse ruído.

Modelos baseados em difusão aprendem a reconstruir fotos adicionando ruído a imagens “não contaminadas” e observando a relação elas e a imagem “contaminada” à medida que mais ruído é adicionado. Imagem: Google

Com a repetição do processo, o modelo começa a entender as “relações latentes” entre fontes altamente difusas e suas versões nítidas e de maior resolução. Depois de bem treinado, um modelo de difusão latente do tipo “texto-para-imagem” pode então “recuperar” imagens, separando-as do ruído de base usando prompts de texto como guias para quais elementos recuperar.

Em apenas alguns dias, houve uma explosão de inovação em torno deste processo. As coisas que as pessoas estão criando são absolutamente surpreendentes.

Tenho acompanhado o subreddit r/StableDiffusion e seguido o fundador da Stability, Emad Mostaque, no Twitter.

Minhas experiências

No início desta semana eu comecei a fazer experimentos com a tecnologia. O mínimo que posso dizer é que gerar imagens a partir de texto é um jogo totalmente novo.

Com os modelos “texto-para-imagem”, as habilidades linguísticas adquirem muita importância, à medida que a precisão conceitual na composição do chamado “prompt” vai determinar o resultado final do trabalho. No estágio atual da tecnologia, o prompt deve ser composto em inglês. Eu suponho que uma interface em português vai surgir em algum momento – farei minha contribuição na medida do possível.

Minhas explorações mostradas aqui foram feitas na plataforma online beta.dreamstudio.ai (atualmente grátis). A conta no site permite a geração de 200 imagens, antes de começar a monetizar. Já existem muitos outros sites parecidos, e novos aparecem todo dia.

Canalizei meu Roger Dean interior e comecei a esboçar algumas coisas. Depois de uma manhã eu já tinha uma pequena coleção para curtir e mostrar:

  • Um Sonho de São Paulo

Eu gosto do estilo matte paint, e minha primeira ideia foi investigar como São Paulo apareceria como um cenário a la Blade Runner.

Um sonho de São Paulo
Prompt usado: A dream of Sao Paulo city, Caspar David Friedrich, matte painting, artstation HQ

No prompt eu estabeleço alguns parâmetros/atributos que eu gostaria que a imagem tivesse:

Dream, indicando uma atmosfera onírica; São Paulo city, o objeto central, Caspar Friedrich, replicando o estilo do artista homólogo, Matte painting, para dar a textura, Artstation HQ, para invocar o estilo do studio Artstation [games, mídia].

  • São Paulo Dream

Neste ponto o leitor já percebeu que eu gosto de São Paulo e curto uma atmosfera onírica, com elementos pós-apocalípticos.

    Prompt Usado: A dream of Sao Paulo, a distant galaxy, Caspar David Friedrich, matte painting, trending on artstation HQ
    • Nave Alien Gigante
    Prompt usado: gigantic extraterrestrial futuristic alien ship in brand new condition, not ruins, hyper-detailed, artstation trending, world renowned artists, antique renewal, good contrast, realistic color, cgsociety, greg rutkowski, gustave dore, Deviantart
    • Roma Alienígena
    Prompt usado: Julius Caesar, alien roman historic works, ruins, hyper-detailed, world renowned artists, historic artworks society, good contrast, realistic color, cgsociety, Greg Rutkowski, Deviantart
    • Um Rio de Janeiro de Sonho
    Prompt usado: Rio de Janeiro, fuzzy, dreamy, world renowned artists, good contrast, pastel color, Greg Rutkowski, Deviantart
    • Rio Hipgnosis

    Aqui eu tentei replicar o estilo do já citado Roger Dean, e do estúdio Hipgnosis, famoso pelas capas de discos das grande bandas de rock nos anos setenta, como Yes, Pink Floyd, Led Zeppelin, e muitos outros. Note a silhueta do Pão de Açúcar, quase imperceptível. Definitivamente Lisérgico.

    Prompt usado: Rio de Janeiro, sketchy, dreamy, world renowned artists, good contrast, pastel color, Roger Dean, Hipgnosis
    • Transilvania

    Aqui eu recebi o valoroso input de minha mulher, ligada ao mundo das bruxas e das brumas, que sempre me apoia em minhas desventuras digitais. A ideia era fazer Drácula aparecer no cenário, mas vejo que será preciso maior empenho na engenharia do prompt.

    Prompt usado (composto por Marília Gião): Dracula castle on a mountain, at dusk, matte paint, Transylvania dream, David Friedrich, chariots with horses, hyper detailed, deviantart

    É mesmo uma coisa incrível. Imagine ter um artista conceitual multi habilidoso ao seu dispor, cujo único propósito na existência é interagir com você e materializar suas fantasias visuais mais loucas. Tudo a um custo muito baixo.

    Você pode executar a difusão estável em seu próprio computador, em um ambiente virtual python, se tiver as inclinações técnicas para configurá-lo [é preciso placa gráfica compatível com CUDA – tipicamente Nvidia] . Posso dar algumas indicações nos comentários, se alguém tiver interesse. Em serviços online como Replicate ou Hugging Face você pode ainda usar a biblioteca “imagem-para-imagem” – que está chegando também à interface do DreamStudio que usamos aqui.

    Há muito mais acontecendo. A melhor descrição que vi até agora de um processo iterativo para construir uma imagem usando Stable Diffusion vem de Andy Salerno: 4.2 Gigabytes, ou: Como desenhar qualquer coisa. Nestes experimentos eu usei partes dos prompts de Andy.

    E há muito mais por vir.

    As inescapáveis questões éticas

    As questões éticas levantadas por esses sistemas precisam ser enfrentadas e resolvidas. São questões difíceis.

    A difusão estável foi treinada com milhões de imagens extraídas da web. Essas imagens são protegidas por direitos autorais. Não estou qualificado para falar sobre a legalidade disso. Pessoalmente, estou mais preocupado com a moralidade.

    O Stable Diffusion v1 Model Card tem todos os detalhes de especificação, mas para resumir, ele usa um conjunto de dados LAION-5B (5,85 bilhões de pares de imagem-texto) e seu subconjunto Laion-aesthetics v2 5+ (um conjunto de aproximadamente 600 Milhões de pares). Essas imagens foram retiradas da web.

    O modelo final tem cerca de 4,2 GB de dados – um blob binário de “floating points”. O fato de se poder comprimir uma quantidade tão grande de informação visual em um volume tão pequeno é, em si, um feito fascinante. Contudo, de novo, as pessoas que criaram essas imagens não foram consultadas sobre seu consentimento.

    Para além disso, como já como discutimos no blog em outra postagem [link], o modelo pode ser visto como uma ameaça direta ao meio de subsistência de milhões de profissionais pelo mundo afora. Eu mesmo fui um desenhista ilustrador em meu primeiro emprego. Hoje eu não teria chance de começar. O vídeo e o áudio seguirão o mesmo caminho. Ninguém esperava que as IAs criativas viessem tão rapidamente para ceifar os empregos dos artistas, mas aqui estamos!

    Há também implicações [negativas] para o mercado de arte — e, em breve, do fonográfico, além do cinema.

    Nasce uma Nova profissão: a Engenharia de Prompt

    Como tentei mostrar, e como você mesma(o) pode verificar se resolver praticar a técnica no link que forneci, o background pessoal influenciará muito no sucesso. As pessoas que vão exercer essa atividade em um nível profissional elevado nas agências de criação terão que se aprofundar na observação e no estudo da linguagem.

    Além da precisão linguística, os parâmetros envolvidos na composição do prompt, para um resultado artístico perfeitamente controlado, exigem conhecimento técnico, senso de estilo e conhecimento histórico. Quanto mais palavras-chave relacionadas estiverem envolvidas na composição maior será o controle do artista sobre o resultado final. Exemplo: o prompt

    Uma cidade futurista distante, cheia de prédios altos dentro de uma enorme cúpula de vidro transparente, No meio de um deserto árido cheio de grandes dunas, Raios de sol, Artstation, Céu escuro cheio de estrelas com um sol brilhante, Escala maciça, Neblina, Muito detalhado, Cinematográfico, Colorido

    é mais sofisticado do que simplesmente

    Uma cidade cheia de prédios altos dentro de uma enorme cúpula de vidro transparente

    Note que a densidade conceitual, portanto a qualidade, do prompt depende muito do background cultural e linguístico da pessoa que faz a composição. De fato, um prompt de qualidade se assemelha muito a uma cena de cinema descrita em um roteiro/storyboard [a propósito, lá se vão os Production Designers, junto com os concept artists, graphic designers, set designers, costume designers, lighting designers…].

    Na tentativa de monetizar os frutos da nova tecnologia, os empreendedores da Internet serão forçados pela mão invisível do mercado de trabalho a se aprofundar nos conhecimentos linguísticos. Será um efeito colateral benigno, penso eu, considerando estado atual da Internet. Talvez isso leve a uma melhor articulação das ideias no ambiente da rede.

    Assim como influenciadores do YouTube têm talento para lidar com os aspectos visuais das interações humanas, os aspirantes à engenharia de prompt terão que se destacar em farejar as nuances da expressão humana. Eles têm grande potencial para ser os novos profissionais descolados da economia digital, assim como foram os web designers, e depois os influencers — que, com o fim das redes sociais, agora tendem a perder relevância.

    Para se diferenciar, os engenheiros de prompt terão que ser ávidos leitores e praticantes de semiótica/semiologia.

    Umberto Eco e os estruturalistas poderão voltar à moda.

    Indistinguível da magia

    Apenas alguns meses atrás, se eu tivesse visto alguém criar essas imagens em um programa de TV, ou em um vídeo do YouTube, eu teria resmungado sobre essas mistificações, grosseiras mesmo para padrões da TV e da Internet (sorry).

    A ficção científica é real agora. Modelos generativos de aprendizagem de máquina estão aqui, e a taxa com que eles estão melhorando é absolutamente irreal. Eu digo isso tendo um histórico de ceticismo quanto ao “hype” e às possibilidades dessa modalidade de AI. Vale a pena prestar atenção ao que eles são capazes de fazer, como estão se desenvolvendo, e ao impacto que eles terão na sociedade.

    Leitura recomendada

    https://arxiv.org/abs/2112.10752

    https://github.com/CompVis/stable-diffusion


    Reativei minha conta para twitar sobre essas coisas para o meu único seguidor. Siga @VoxLeone no Twitter e me ajude a conquistar o Brasil!

    Também fiz conta no Reddit, onde meu Karma é exatamente = 1. Siga u/VoxLeone!