A Síndrome de Leonardo

Na blogosfera esta semana encontro um interessante post de onde tirei o título deste artigo. O tema de fundo é a procrastinação, algo com que a grande maioria das pessoas pode se identificar.

Vitruvian Man - arte
Imagem: Pexels

O post ao qual me refiro faz comentário sobre o livro de Peter Burke, The polymath: a cultural history from Leonardo da Vinci to Susan Sontag. Em uma passagem da obra o autor sustenta a tese, já defendida por outros, de que as aventuras criativas de Leonardo Da Vinci foram na verdade fracassos.

Exemplos de seus fracassos incluiriam não ter sucesso na quadratura do círculo [o que é geometricamente impossível], e em vários projetos de engenharia que não funcionaram – como uma besta gigante e uma máquina voadora; ter mal-entendido vários aspectos do coração; ter feito desenhos com tintas experimentais que resultaram em lenta degradação de algumas de suas pinturas.

Mesmo sua primeira encomenda registrada como pintor independente – um retábulo para a Capela de São Bernardo em 1478 – ele não conseguiu concluir, apesar de receber um adiantamento em dinheiro de 25 florins para isso. Muitos de seus contemporâneos registraram que ele não cumpria os prazos ou nem mesmo terminava projetos — como nunca ter terminou uma estátua equestre encomendada por Francesco Sforza.

O ensaio continua a explicar como o pensamento e o trabalho de Leonardo estavam fora das disciplinas da época (e sua abordagem ainda está fora de muitas que são ensinadas hoje), embora isso fosse uma desvantagem para sua carreira na época. Leonardo não era o “profissional sério”. Ele pegava algumas ideias e brincava com elas.

Um sentimento familiar

A esta altura começo a suspeitar que a Síndrome de Leonardo é a responsável pelas minhas longas noites. Com a Internet sendo tão vasta, há inúmeras coisas para experimentar e hackear [no sentido de ‘desmontar para conhecer o funcionamento’], e tenho inúmeros projetos inacabados guardados em meus discos rígidos [na verdade uso SSD’s]. Não sou um acumulador no sentido típico de guardar jornais velhos para a posteridade – e de fato sou um minimalista. Mas quando se trata da minha vida digital, é difícil resistir à facilidade de poder guardar montanhas de ‘jornais’ em forma de bits.

Leonardo ficaria paralisado pela web moderna. De certa forma sou como um renascentista, reunindo em meus escaninhos pequenos trechos de código que um dia podem ser úteis. Meus “favoritos” estão transbordando de URLs interessantes que pretendo revisitar algum dia. Eu sou um acumulador digital que procrastina muito em certos períodos. Não sei se preciso tomar providências para mudar, ou se isso é uma resposta natural à vastidão da web e a única maneira sensata de abordá-la.

Terminar o serviço é uma verdadeira dor

Em algum momento do projeto, chegamos à parte em que as coisas divertidas já foram feitas. Já aprendemos praticamente tudo o que foi possível com o exercício, e o trabalho está “90%” acabado.

Esses últimos 10%, no entanto, são uma ladeira íngreme, e muitas, muitas pessoas simplesmente acabam por abandonar o projeto nessa fase. Em muitos casos não há problema, se o objetivo principal era aprender e realmente não há “tração de mercado” suficiente para justificar a conclusão do projeto.

Se houver um requisito formal para concluí-lo (como, digamos, um contrato, com sua assinatura), é claro que os 10% precisam ser concluídos, não importa quão chato isso seja.

Há até uma piada no meio: “90% do projeto é concluído em 10% do tempo. 10% do projeto é concluído em 90% do tempo.” Já notou como, quando um novo prédio está sendo construído na vizinhança ele parece ficar “completo” em um tempo surpreendentemente curto? Contudo, quase sempre esse momento está apenas na metade do tempo da construção, e 100% do tempo tomado pelo projeto até aqui deverá se repetir antes que as portas se abram.

Isso porque fazer o exterior e a estrutura é simples e pode ser feito por praticamente qualquer pessoa. Alvenaria, janelas, portas, telhados, etc., são habilidades importantes, mas não extremamente especializadas.

O interior, porém, requer muita habilidade. Você não pode simplesmente trazer um martelador meia-colher. Você precisa de carpinteiros e marceneiros experientes e pintores bem remunerados. Essas pessoas são mais difíceis de agendar e não costumam apressar o trabalho. O resultado do trabalho deles é o que as pessoas verão de perto, todos os dias, então precisa de muito polimento e tem que ser robusto.

O mesmo com qualquer produto

No momento(*) estou escrevendo uma interface para padronizar a entrada de ‘prompts’ e parâmetros em plataformas como ‘Stable Diffusion’. Provavelmente o trabalho já estava 90% completo na semana passada, mas acontece que estabeleci um roteiro de teste bastante robusto para ele, e não consigo parar de testar. Estou encontrando bugs em minha implementação (sempre encontro), e estou corrigindo-os à medida que avanço. Também, como sói acontecer, estou sempre a encontrar “pequenas coisas” que esqueci de implementar.

Assim que eu tiver tudo funcionando para minha satisfação – e se achar que é de interesse geral, detalharei neste espaço.

(*)Muitas coisas chatas, mas isso significa que não preciso me preocupar com comunicação e marketing, muito críticos (e arriscados), que deixo aos parceiros mais habilitados.

De volta a Leonardo

Eu entendo o ponto do autor do citado blog, bem como o do formulador original da crítica, Peter Burke, talvez porque, como eles, eu também não acredite no mito do Superdotado Sobrenatural. A inteligência no fundo é um artefato cultural e precisa ser associada a outros atributos para levar ao sucesso. Ninguém, mesmo os gênios, tem uma visão privilegiada do Todo. Toda ciência e técnica é fruto de trabalho árduo.

Mesmo assim, os argumentos dos detratores são bastante injustos. Em favor de Leonardo, eu devo dizer ele tirava ideias de qualquer lugar – mas não apenas ideias que estavam no “cânone” de uma disciplina, e isso por si só é um portento admirável. Sobre fazer experimentos com tintas também não considero uma falha de caráter, pelo contrário. É, na verdade, um experimento que eu chamaria de audacioso – e de longo prazo. Sobre entender mal vários aspectos do coração, ele descobriu/teorizou como a válvula aórtica e seus folhetos funcionavam de uma forma que se mostrou correta – embora ele estivesse errado sobre a circulação sanguínea em geral.

Mona Lisa – obra inacabada

Não sei. Ele trabalhou nela por quatro anos, levando-a para todos os lugares onde ia para não ter que parar, e se ela estiver realmente inacabada pode ser simplesmente porque a mão direita do mestre estava começando a paralisar. Há mais a ser dito sobre o perfeccionismo na Mona Lisa do que a síndrome de Leonardo.

Leonardo definitivamente começou muito mais do que ele podia terminar (decepcionando muitos clientes, por certo), e tinha um certo auto engrandecimento em relação ao que ele dizia que podia fazer, mas os registros dos fatos não são muito precisos.

No fim de tudo, ele é lembrado porque, na verdade, tinha um conjunto muito grande de ideias detalhadas, desenhos, planos e realizações. A maioria de nós adoraria ter criado uma obra de arte tão inacabada quanto a Mona Lisa.


Leitura adicional recomendada

Burke, P. (2021) The polymath: a cultural history from Leonardo da Vinci to Susan Sontag. First published in paperback. New Haven London: Yale University Press.

Elon Musk versus ASG e suas contradições

Meses atrás o S&P 500 chutou a fabricante de veículos elétricos Tesla para fora de seu índice ASG como parte de uma atualização anual da lista. Enquanto isso, Apple, Microsoft, Amazon e até mesmo a multinacional de petróleo Exxon Mobil permanecem.

Imagem: Pexels

Como reportado pela CNBC em maio passado, o índice S&P 500 ESG usa dados ambientais, sociais e de governança para classificar e efetivamente recomendar empresas aos investidores. Seus critérios incluem centenas de pontos de dados, agregados por empresa, relacionados à forma como os negócios afetam o planeta e atendem às partes interessadas além dos acionistas – incluindo clientes, funcionários, fornecedores, parceiros e vizinhos. As alterações no índice entraram em vigor em 2 de maio, e uma das responsáveis pelas mudanças índice, Margareth Dorn, explicou em seu blog o problema com a empresa de Musk.

Ela disse que a “falta de uma estratégia de baixo carbono” e “códigos de conduta empresarial” da Tesla, juntamente com episódios de racismo e as más condições de trabalho relatadas na fábrica da Tesla em Fremont, Califórnia, afetaram a pontuação. “Embora a Tesla possa estar desempenhando seu papel ao tirar os carros movidos a combustível das ruas, ela ficou para trás de seus pares quando examinada por uma lente ASG mais ampla”, escreveu a porta-voz da S&P.

A Tesla notoriamente sempre teve uma avaliação baixa, não apenas no aspecto ambiental. Sua cultura empresarial sempre angariou antipatias. No Twitter, o CEO da Tesla, Elon Musk, disse que a S&P Global Ratings “perdeu sua integridade” e “foi aparelhada com falsos guerreiros da justiça social”.

Algo inesperado

Quer dizer então que a Tesla, empresa que mostrou como fazer carros elétricos que as pessoas realmente desejam — carros que podem ser carregados por energia solar (lembre-se que a Tesla também administra a Solar City), e uma das poucas empresas líderes em mostrar que os Estados Unidos ainda podem fabricar coisas não está apta, enquanto Exxon, um dos maiores poluidores do mundo, aparece como um missionário ambiental?

Não é bem assim

A Tesla certamente deu vida ao mercado de carros elétricos, e não há absolutamente nenhuma dúvida quanto a isso. Mas não basta apenas tê-los introduzido para as massas – a maioria dos carros elétricos não são Teslas.

O problema é que outros fabricantes têm a “vantagem do segundo empreendedor”, e a Tesla simplesmente não tem inovado o suficiente para se manter à frente e reter os benefícios de ser o primeiro. Por exemplo, os concorrentes agora alcançaram um ótimo nível de rendimento do conjunto motor/baterias enquanto a Tesla, no momento, não tem nenhum avanço que lhe permita ficar à frente deles.

Se, portanto, a Tesla não tem condições de de mostrar que é mais verde que a concorrência e liderar o mercado, é razoável, por mais crédito que mereça por impulsionar o mercado no passado, dizer que atualmente ela não possui credenciais particularmente fortes em termos de tecnologia verde.

Você não pode simplesmente fazer algo grande em um ponto fixo no tempo e esperar ser bem avaliado por isso para sempre se os outros pegarem o que você fez e fizerem ainda melhor. Obviamente não é assim que os índices funcionam.

Eu arriscaria dizer que o maior problema é que Musk se esticou demais. Por um tempo ele esteve realmente a conduzir a Tesla em várias questões-chave, como a autonomia das baterias. Agora ele parece estar desinteressado e tem se distraído com coisas como mídia social – com sua vacilante oferta ao Twitter. Aparentemente ele precisa voltar seu foco para empreendimentos como Tesla e SpaceX para que possa começar a levá-los de volta à frente da concorrência novamente e para recuperar o valor da Tesla. Caso contrário, acabará como “apenas mais um fabricante de veículos elétricos”.

A pergunta de um milhão de dólares

Por que, afinal, o mercado deveria se preocupar com coisas relacionadas à justiça social? A propósito, as grandes corporações já demonstraram que nunca são “responsáveis”. A aparência de ser responsável geralmente é a única coisa que importa para elas. Por acaso elas já deram aos grupos de Diversidade, Equidade e Inclusão alguma “Equity”? Deram elas algum assento no conselho de diretores aos países pobres da África?

O engraçado é que as preocupações ambientais e as preocupações com a justiça social geralmente estão em conflito direto. As preocupações de justiça ambiental e social muitas vezes estão em desacordo consigo mesmas. Pense na fazenda solar que invade espaços selvagens, ou na desativação de uma usina de carvão em uma comunidade muito pobre, mas cuja substituição custa empregos e aumenta os preços da energia (o que afeta desproporcionalmente os pobres). Claro que existem algumas proposições ASG que parecem sábias quando vistas ao telescópio, mas a maioria delas simplesmente não é. Como categoria o ASG traz profundas contradições em si.

Isso não quer dizer que os dados solicitados e coligidos pelo índice sejam inúteis ou não importantes. É fundamental conhecer a demografia dos funcionários, estatísticas ambientais, bem como ter um corpo de boas regras corporativas. Mas a ideia de estabelecer algum tipo de pontuação empresarial por altos valores morais em ASG é simplesmente estúpida, e nisso tenho que concordar com Musk.

Pessoalmente eu penso que quem realmente quer colocar seu dinheiro onde está sua moral, deve investir em empresas dentro de categorias que se alinhem com seus valores. Você fará mais bem apoiando uma empresa de gás natural que está a projetar usinas de hidrogênio (e deixando claro que é por isso que você fez esse investimento) do que investindo no Google porque ele comprou alguns créditos de carbono.

Mais um artefato da guerra cultural

Ao contrário dos solenes órgãos do “establishment” do jornalismo corporativo, a mídia independente – oi! – costuma ser muito direta sobre as deficiências do ASG. O podcast Breaking Points recentemente trouxe muitos detalhes sobre as recentes operações do governo americano junto ao Deutsche Bank e Goldman Sachs por suposta “greenwashing” [lavagem verde]. Além dos grandes bancos, os políticos também estão jogando rápido e solto com o novo rótulo. Em maio um comissário da União Européia chegou a chamar o gás natural de “fonte de energia verde”(!).

Sem surpresa, o rótulo ASG agora se tornou outra arma da guerra cultural travada para desacreditar adversários políticos. Usada pela direita como uma crítica ao movimento “woke”, e pela esquerda como forma de denunciar o “greenwashing” em empresas de setores que considera “malandros” (como petróleo e gás), a sigla se tornou precocemente datada.

Mas a verdadeira tragédia é que os padrões ASG continuarão a alimentar o crescente ceticismo em relação às mudanças climáticas e aqueles que divulgam de boa fé seus perigos potenciais. Infelizmente, para os céticos todas as iniciativas contra as mudanças climáticas parecem enganosas, não importa como sejam apresentadas, o que leva a crer que eles provavelmente jamais serão persuadidos.

ASG tem todas as características de uma farsa. Faríamos bem em descartar o rótulo junto com todos os males associados a ele.

*Em tempo: até os fundos ASG estão investindo em ações da empresas de Big Oil: Link

Post Scriptum

A Tesla vem sobrevivendo porque as grandes empresas de automóveis ainda não querem fazer elétricos; eles querem fazer picapes de alta margem de lucro e loucamente poluentes. A Tesla foi beneficiária de um esquema que lhe transferiu enormes somas de dinheiro da Ford & GM em troca da venda de carros elétricos. Basicamente, um subsídio indireto do governo, já que o custo de reduzir a poluição efetivamente foi repassado para os compradores de picapes – essencialmente um imposto para quem precisa de uma picape.

Mas, bem, a Ford tem uma picape elétrica a caminho. A GM não vai ficar muito atrás. Não há mais créditos de carbono para a Tesla. Não há mais almoços grátis.

Eu diria que em 10 anos poderemos ver uma fusão/assimilação da Tesla com/por um dos grandes fabricantes automotivos. Principalmente para acesso destes a patentes e engenheiros.

A.I. Art – Meus Experimentos com o Incrível ‘Stable Diffusion’

Se você não está prestando atenção ao que está acontecendo com o súbito aparecimento da Difusão Estável, você está perdendo um momento realmente interessante na história da tecnologia.

Imagem: Pexels.com

Tudo começou quando há dez dias, em 22 de agosto, a start-up Stability.ai abriu o acesso à sua plataforma de síntese de imagem chamada Stable Diffusion – uma arquitetura de difusão latente semelhante ao DALL-E 2 do OpenAI e ao Imagen do Google, treinada com milhões de imagens extraídas da web. Desde então a tecnologia tem desfrutado uma contínua explosão de interesse.

Ao contrário do conteúdo deepfake baseado em autoencoder, ou das recriações da figura humana que podem ser alcançadas por Neural Radiance Fields (NeRF) e Generative Adversarial Networks (GANs), os sistemas baseados em difusão aprendem a gerar novas imagens adicionando ruído às imagens usadas como fontes. A reiteração desse processo ensina o sistema como fazer imagens plausíveis – e até foto-realistas – a partir apenas desse ruído.

Modelos baseados em difusão aprendem a reconstruir fotos adicionando ruído a imagens “não contaminadas” e observando a relação elas e a imagem “contaminada” à medida que mais ruído é adicionado. Imagem: Google

Com a repetição do processo, o modelo começa a entender as “relações latentes” entre fontes altamente difusas e suas versões nítidas e de maior resolução. Depois de bem treinado, um modelo de difusão latente do tipo “texto-para-imagem” pode então “recuperar” imagens, separando-as do ruído de base usando prompts de texto como guias para quais elementos recuperar.

Em apenas alguns dias, houve uma explosão de inovação em torno deste processo. As coisas que as pessoas estão criando são absolutamente surpreendentes.

Tenho acompanhado o subreddit r/StableDiffusion e seguido o fundador da Stability, Emad Mostaque, no Twitter.

Minhas experiências

No início desta semana eu comecei a fazer experimentos com a tecnologia. O mínimo que posso dizer é que gerar imagens a partir de texto é um jogo totalmente novo.

Com os modelos “texto-para-imagem”, as habilidades linguísticas adquirem muita importância, à medida que a precisão conceitual na composição do chamado “prompt” vai determinar o resultado final do trabalho. No estágio atual da tecnologia, o prompt deve ser composto em inglês. Eu suponho que uma interface em português vai surgir em algum momento – farei minha contribuição na medida do possível.

Minhas explorações mostradas aqui foram feitas na plataforma online beta.dreamstudio.ai (atualmente grátis). A conta no site permite a geração de 200 imagens, antes de começar a monetizar. Já existem muitos outros sites parecidos, e novos aparecem todo dia.

Canalizei meu Roger Dean interior e comecei a esboçar algumas coisas. Depois de uma manhã eu já tinha uma pequena coleção para curtir e mostrar:

  • Um Sonho de São Paulo

Eu gosto do estilo matte paint, e minha primeira ideia foi investigar como São Paulo apareceria como um cenário a la Blade Runner.

Um sonho de São Paulo
Prompt usado: A dream of Sao Paulo city, Caspar David Friedrich, matte painting, artstation HQ

No prompt eu estabeleço alguns parâmetros/atributos que eu gostaria que a imagem tivesse:

Dream, indicando uma atmosfera onírica; São Paulo city, o objeto central, Caspar Friedrich, replicando o estilo do artista homólogo, Matte painting, para dar a textura, Artstation HQ, para invocar o estilo do studio Artstation [games, mídia].

  • São Paulo Dream

Neste ponto o leitor já percebeu que eu gosto de São Paulo e curto uma atmosfera onírica, com elementos pós-apocalípticos.

Prompt Usado: A dream of Sao Paulo, a distant galaxy, Caspar David Friedrich, matte painting, trending on artstation HQ
  • Nave Alien Gigante
Prompt usado: gigantic extraterrestrial futuristic alien ship in brand new condition, not ruins, hyper-detailed, artstation trending, world renowned artists, antique renewal, good contrast, realistic color, cgsociety, greg rutkowski, gustave dore, Deviantart
  • Roma Alienígena
Prompt usado: Julius Caesar, alien roman historic works, ruins, hyper-detailed, world renowned artists, historic artworks society, good contrast, realistic color, cgsociety, Greg Rutkowski, Deviantart
  • Um Rio de Janeiro de Sonho
Prompt usado: Rio de Janeiro, fuzzy, dreamy, world renowned artists, good contrast, pastel color, Greg Rutkowski, Deviantart
  • Rio Hipgnosis

Aqui eu tentei replicar o estilo do já citado Roger Dean, e do estúdio Hipgnosis, famoso pelas capas de discos das grande bandas de rock nos anos setenta, como Yes, Pink Floyd, Led Zeppelin, e muitos outros. Note a silhueta do Pão de Açúcar, quase imperceptível. Definitivamente Lisérgico.

Prompt usado: Rio de Janeiro, sketchy, dreamy, world renowned artists, good contrast, pastel color, Roger Dean, Hipgnosis
  • Transilvania

Aqui eu recebi o valoroso input de minha mulher, ligada ao mundo das bruxas e das brumas, que sempre me apoia em minhas desventuras digitais. A ideia era fazer Drácula aparecer no cenário, mas vejo que será preciso maior empenho na engenharia do prompt.

Prompt usado (composto por Marília Gião): Dracula castle on a mountain, at dusk, matte paint, Transylvania dream, David Friedrich, chariots with horses, hyper detailed, deviantart

É mesmo uma coisa incrível. Imagine ter um artista conceitual multi habilidoso ao seu dispor, cujo único propósito na existência é interagir com você e materializar suas fantasias visuais mais loucas. Tudo a um custo muito baixo.

Você pode executar a difusão estável em seu próprio computador, em um ambiente virtual python, se tiver as inclinações técnicas para configurá-lo [é preciso placa gráfica compatível com CUDA – tipicamente Nvidia] . Posso dar algumas indicações nos comentários, se alguém tiver interesse. Em serviços online como Replicate ou Hugging Face você pode ainda usar a biblioteca “imagem-para-imagem” – que está chegando também à interface do DreamStudio que usamos aqui.

Há muito mais acontecendo. A melhor descrição que vi até agora de um processo iterativo para construir uma imagem usando Stable Diffusion vem de Andy Salerno: 4.2 Gigabytes, ou: Como desenhar qualquer coisa. Nestes experimentos eu usei partes dos prompts de Andy.

E há muito mais por vir.

As inescapáveis questões éticas

As questões éticas levantadas por esses sistemas precisam ser enfrentadas e resolvidas. São questões difíceis.

A difusão estável foi treinada com milhões de imagens extraídas da web. Essas imagens são protegidas por direitos autorais. Não estou qualificado para falar sobre a legalidade disso. Pessoalmente, estou mais preocupado com a moralidade.

O Stable Diffusion v1 Model Card tem todos os detalhes de especificação, mas para resumir, ele usa um dataset LAION-5B (5,85 bilhões de pares de imagem-rótulo) e seu subconjunto Laion-aesthetics v2 5+ (um conjunto de aproximadamente 600 Milhões de pares). Essas imagens foram retiradas da web.

O modelo final tem cerca de 4,2 GB de dados – um blob binário de “floating points”. O fato de se poder comprimir uma quantidade tão grande de informação visual em um volume tão pequeno é, em si, um feito fascinante. Contudo, de novo, as pessoas que criaram essas imagens não foram consultadas sobre seu consentimento.

Para além disso, como já como discutimos no blog em outra postagem [link], o modelo pode ser visto como uma ameaça direta ao meio de subsistência de milhões de profissionais pelo mundo afora. Eu mesmo fui um desenhista ilustrador em meu primeiro emprego. Hoje eu não teria chance de começar. O vídeo e o áudio seguirão o mesmo caminho. Ninguém esperava que as IAs criativas viessem tão rapidamente para ceifar os empregos dos artistas, mas aqui estamos!

Há também implicações [negativas] para o mercado de arte — e, em breve, do fonográfico, além do cinema.

Nasce uma Nova profissão: a Engenharia de Prompt

Como tentei mostrar, e como você mesma(o) pode verificar se resolver praticar a técnica no link que forneci, o background pessoal influenciará muito no sucesso. As pessoas que vão exercer essa atividade em um nível profissional elevado nas agências de criação terão que se aprofundar na observação e no estudo da linguagem.

Além da precisão linguística, os parâmetros envolvidos na composição do prompt, para um resultado artístico perfeitamente controlado, exigem conhecimento técnico, senso de estilo e conhecimento histórico. Quanto mais palavras-chave relacionadas estiverem envolvidas na composição maior será o controle do artista sobre o resultado final. Exemplo: o prompt

Uma cidade futurista distante, cheia de prédios altos dentro de uma enorme cúpula de vidro transparente, No meio de um deserto árido cheio de grandes dunas, Raios de sol, Artstation, Céu escuro cheio de estrelas com um sol brilhante, Escala maciça, Neblina, Muito detalhado, Cinematográfico, Colorido

é mais sofisticado do que simplesmente

Uma cidade cheia de prédios altos dentro de uma enorme cúpula de vidro transparente

Note que a densidade conceitual, portanto a qualidade, do prompt depende muito do background cultural e linguístico da pessoa que faz a composição. De fato, um prompt de qualidade se assemelha muito a uma cena de cinema descrita em um roteiro/storyboard [a propósito, lá se vão os Production Designers, junto com os concept artists, graphic designers, set designers, costume designers, lighting designers…].

Na tentativa de monetizar os frutos da nova tecnologia, os empreendedores da Internet serão forçados pela mão invisível do mercado de trabalho a se aprofundar nos conhecimentos linguísticos. Será um efeito colateral benigno, penso eu, considerando estado atual da Internet. Talvez isso leve a uma melhor articulação das ideias no ambiente da rede.

Assim como influenciadores do YouTube têm talento para lidar com os aspectos visuais das interações humanas, os aspirantes à engenharia de prompt terão que se destacar em farejar as nuances da expressão humana. Eles têm grande potencial para ser os novos profissionais descolados da economia digital, assim como foram os web designers, e depois os influencers — que, com o fim das redes sociais, agora tendem a perder relevância.

Para se diferenciar, os engenheiros de prompt terão que ser ávidos leitores e praticantes de semiótica/semiologia.

Umberto Eco e os estruturalistas poderão voltar à moda.

Indistinguível da magia

Apenas alguns meses atrás, se eu tivesse visto alguém criar essas imagens em um programa de TV, ou em um vídeo do YouTube, eu teria resmungado sobre essas mistificações, grosseiras mesmo para padrões da TV e da Internet (sorry).

A ficção científica é real agora. Modelos generativos de aprendizagem de máquina estão aqui, e a taxa com que eles estão melhorando é absolutamente irreal. Eu digo isso tendo um histórico de ceticismo quanto ao “hype” e às possibilidades dessa modalidade de AI. Vale a pena prestar atenção ao que eles são capazes de fazer, como estão se desenvolvendo, e ao impacto que eles terão na sociedade.

Leitura recomendada

https://arxiv.org/abs/2112.10752

https://github.com/CompVis/stable-diffusion


Reativei minha conta para twitar sobre essas coisas para o meu único seguidor. Siga @VoxLeone no Twitter e me ajude a conquistar o Brasil!

Também fiz conta no Reddit, onde meu Karma é exatamente = 1. Siga u/VoxLeone!

‘Inteligência Artificial’ e o Futuro das Artes Digitais

Eu leio os jornais. Eu vejo o ritmo do ‘progresso’. Eu entendo como esses novos modelos de aprendizado de máquina funcionam em um nível técnico e estou impressionado com a rapidez com que eles estão se desenvolvendo.

artista-digital
Imagem: Pexels.com

Francamente, eu não espero que a arte digital feita por humanos (imagens, vídeos, filmes, música, texto) sobreviva mais uma década. O que espero é que pouca ou nenhuma arte digital seja vendida com lucro por artistas humanos daqui a dez anos, e a única razão pela qual não estendo esse raciocínio para mídias físicas como escultura ou arte de rua é que eu não sei se teremos robôs hábeis o suficiente para fazê-las – embora seja inevitável que robôs habilidosos surjam em algum momento, na duvidosa hipótese de que a civilização sobreviva.

As pessoas frequentemente vão buscar o exemplo da pintura e da fotografia para defender a ideia de que inteligência artificial (IA) não vai realmente acabar com o mercado de arte, mas eu simplesmente não vejo esse exemplo como válido. A fotografia e a pintura sobreviveram porque são fundamentalmente diferentes e podem ser facilmente distinguidas, desde que seus respectivos criadores optem por se diferenciar.

A arte da IA é diferente, porque seu propósito específico é replicar. Não importa o que os artistas humanos façam com a mídia digital, a IA sempre vai estar lá para engolir as mudanças de qualquer nova onda e aprender a replicá-las.

O advento da fotografia nunca teve a intenção de matar a indústria da pintura. Contrariamente, esses algoritmos de IA, gestados nas grandes corporações de tecnologia, têm como objetivo manifesto matar a indústria da imagem.

Sobre a Excelência na técnica

Leonardo da Vinci não apenas pegou um pincel, compôs a Mona Lisa e se proclamou mestre. Ele construiu suas habilidades como aprendiz em oficinas, fazendo obras acessórias, figuras de fundo e encomendas menores. É esse trabalho que cria a oportunidade para que obras-primas aconteçam. Se esse ambiente desaparecer, o topo da elite artística será afetado. Existe algo único no equilíbrio entre ser ousado o suficiente para se destacar da multidão, mas ao mesmo tempo acessível o suficiente para um apelo mais amplo.

No momento, os modelos de aprendizado de máquina ainda são fracos, mas já são fortes o suficiente para tirar 90% dos artistas digitais do mercado. Com o custo próximo de zero, as pessoas não vão mais reutilizar nada. Vão gerar algo novo para cada coisa que fizerem. Não tenho certeza se há algo que possa ser feito para evitar esse futuro. Penso que devemos começar reconhecer que muita coisa vai se perder nessa revolução. Também duvido que artifícios sociais como bolsas de estudo e programas de residência possam deter o avanço das máquinas simplesmente jogando dinheiro no problema.

Otimistas

Há um lado otimista nesta questão. Seus lugares-tenentes sustentam que não precisamos temer a arte da IA. Na verdade, os artistas podem até querer agradecer.

Segundo os otimistas, há muito tempo os artistas sentem uma espécie de tédio por causa da falta de um caminho claro para a inovação ou para criação de algo “novo” e inspirador. As coisas tornaram-se obsoletas e excessivamente mercantilizadas, com músicos, fotógrafos, pintores, etc. muitas vezes confessando que o que eles criam não passa de recauchutagem de ideias desgastadas – admito que qualquer artista ligado na cena vai mesmo dizer que não há mais muita arte inspiradora.

A IA essencialmente reorganiza motivos antigos de novas maneiras. É um dispositivo de permutação que mostra o estado da arte atual (na qual é baseado o treinamento dos modelos) aplicado a situações arbitrárias. Os artistas podem usá-lo como ferramenta para encontrar um espaço onde uma nova exploração seja possível e, finalmente, começar a criar arte inspiradora novamente.

este-cara-nao-existe
Imagem gerada no popular serviço Esta Pessoa Não Existe. É uma imagem criada com o uso de redes GAN – Generational Adversarial Network.

Os otimistas ainda consideram que o que está sendo banalizado agora é apenas a transformação das obras mesmas em espaços de ideias digitalmente definíveis: crie uma nova ideia em arte, dê a uma máquina representações suficientes e ela pode gerar infinitamente novos trabalhos dentro desse espaço.

A corrente otimista argumenta que certas coisas vão escapar à banalização. O que ainda não pode ser banalizado seria:

1) Novos espaços de ideias. A IA é incapaz de gerar algo que possa ser definido como um novo movimento artístico.

2) Novas mídias. Algo como Dall-E [ver nota no final] vai aparecer, mais cedo ou mais tarde, para gerar arquivos CAD. Contudo, há muitas expressões artísticas que não serão fisicamente reproduzíveis por um computador. As obras nessas mídias permanecerão valiosas ou até aumentarão de valor. E embora a IA possa gerar novas ideias nesses espaços, será necessário que haja pessoas que decidam se esforçar para executá-las.

3) Curadoria. Decidir quais ideias (geradas por IA ou não) merecem atenção.

Take final

Comecei a investigar este assunto na década passada, e as evidências me sugerem que começaremos a ver todas as atividades humanas enfrentando um declínio salarial anual de 6 a 12% a partir de agora. Uma máquina já pode fazer trabalho humano bem o suficiente para substituí-lo ou substituir mais de 90% das pessoas no trabalho que elas fazem, deixando o resto brigando por migalhas.

A parte criativa e sensível do seu trabalho, que uma máquina não pode fazer, pode parecer muito importante para você, mas o chefe do chefe do seu chefe provavelmente não se importa com isso, já que a mediocridade escalável é mais lucrativa do que qualquer “extra” que um humano possa oferecer.

Na verdade, a já envelhecida queixa das empresas de que “existe-trabalho-mas-ninguém-está-qualificado” é uma grande balela. Os mesmos executivos que dizem isso estão espremendo seus gerentes de linha, ao não deixá-los contratar auxílio e forçá-los ao trabalho cada vez mais pesado.

A tendência de longo prazo dos salários é de queda. Os mercados de trabalho não parecem mais se comportar como o da oferta e procura de bens. Nesse mercado as curvas não mais encontram equilíbrio. Elas divergem.

Não se trata apenas de AI Art, e outras macaquices digitais. Estamos muito provavelmente caminhando para um colapso salarial generalizado e de base ampla em todo o mundo, e esse tipo de situação provavelmente resultará em um conflito global entre pessoas e capital, no qual a) todo um sistema socioeconômico é derrubado, ou b) a humanidade é lançada na escravidão da qual é improvável que se recupere.


Nota: DALL·E é uma versão do GPT-3 [Generative Pre-trained Transformer – Transformador Generativo Pré- treinado] com bilhões de parâmetros, treinada para gerar imagens a partir de descrições de texto [ex: “ovelha a tocar piano em um navio”], usando um conjunto de dados de pares de texto-imagem. Ele tem um conjunto diversificado de recursos, incluindo a criação de versões antropomorfizadas de animais e objetos, combinando conceitos não relacionados de maneiras plausíveis, renderizando texto e aplicando transformações a imagens existentes.

Leitura recomendadada

https://arxiv.org/abs/2005.14165

https://openai.com/blog/dall-e/

Facebook Recua na TikTokização

No último post [27/07] nós discutimos – com a contribuição de estimados leitores – a transformação ora empreendida pelo Facebook(*) no sentido de imitar o TikTok, o que vem a significar o fim das redes sociais como as conhecemos.

Imagem: Pexels.com

Aconteceu, porém, um evento inesperado ontem [28/07], em que a holding Meta anunciou algumas pedaladas para trás em suas metas [trocadilho infame pero inevitable]. Reproduzo abaixo, destacando em cor diferente, a abordagem do site The Verge:

O Instagram vai recuar em algumas mudanças recentes no produto após uma semana de críticas intensas, disse a empresa hoje [28/07] . A versão de teste do aplicativo – que abre em tela cheia para fotos e vídeos – será desativada nas próximas duas semanas. O Instagram também reduzirá o número de postagens recomendadas, à medida que trabalha para melhorar seus algoritmos.

“Estou feliz por termos arriscado – se não falharmos de vez em quando, não estamos pensando grande o suficiente ou sendo ousados o suficiente”, disse o chefe do Instagram, Adam Mosseri, em entrevista. “Mas nós definitivamente precisamos dar um grande passo para trás e nos reagrupar. Quando aprendermos melhor, então voltaremos com alguma nova ideia ou iteração. Vamos trabalhar nisso.”

As mudanças ocorrem em meio à crescente frustração do usuário com uma série de mudanças projetadas no Instagram para ajudá-lo a competir melhor com o TikTok e navegar na mudança mais ampla verificada no comportamento do usuário, para mais longe da fotografia, voltando a sua atenção aos vídeos. Esse tipo de redesenho geralmente provoca a ira de usuários resistentes à mudança. Todavia, neste caso, a insatisfação notável foi confirmada pelos próprios dados internos do Instagram, disse Mosseri. A tendência de os usuários assistirem a mais vídeos é real e veio antes do TikTok, disse ele.

Mas é claro que as pessoas realmente não gostaram das mudanças de design do Instagram. “As pessoas estão frustradas com as recentes modificações no design e o feedback trazido pelos dados não é bom”, disse ele. “Então, acho que precisamos dar um grande passo para trás, reagrupar e descobrir como vamos querer seguir em frente”.

A empresa também planeja mostrar aos usuários menos recomendações de algoritmo. Na quarta-feira [27/07], o CEO da Meta, Mark Zuckerberg, disse que postagens e contas recomendadas atualmente representam cerca de 15% do que você vê quando navega no Facebook, com uma porcentagem maior no Instagram.

Até o final de 2023, esse número será de cerca de 30%, disse Zuckerberg. Mas o Instagram reduzirá temporariamente a quantidade de postagens recomendadas, enquanto trabalha para melhorar suas ferramentas de personalização. Mosseri deixou claro que o recuo anunciado hoje não é permanente.

~o~

(*) No post de quarta-feira eu não mencionei especificamente o Instagram, assim como não o fiz no título de hoje, em parte porque eu estou acostumado a me referir ao grupo Meta genericamente como “Facebook”. De fato é o Instagram que está a atrair uma maior barragem de fogo no momento, principalmente nos mercados avançados.

As redes da Meta compartilham a árvore decisória e a orientação tecnológica, o que significa que os nomes das duas redes são um tanto quanto intercambiáveis quando o assunto é o uso algoritmos para recomendação de conteúdo.

Uma rápida análise final

Parece haver uma obsessão envolvida em todo esse negócio de o Facebook tentar perseguir o mesmo mercado que o TikTok – os jovens.

Dado que nos países mais ricos – e no Brasil também – a demografia mostra claramente que há uma forte tendência ao envelhecimento da população, a estratégia do Facebook faz pouco sentido. Você acaba alienando os dois campos, tentando ser o que você não é. De um ponto de vista racional, ele deveria ter continuado com foco na realidade do mercado que tem.

A juventude e a moda sempre foram inconstantes e a marcas Facebook e Instagram hoje em dia são efetivamente um veneno para os jovens, desprezadas, ridicularizadas. Isso não vai mudar tentando torná-lo um outro TikTok. É simplesmente tarde demais.

Tentando esconder o elefante-na-sala

Zuckerberg diz que apenas 15% do conteúdo do Facebook/Instagram é originário de recomendação de algoritmos, e que o objetivo é chegar a 30% no fim do ano que vem. Isso é claramente uma falsidade, uma vez que obviamente não inclui a contribuição de terceiras partes para as recomendações de conteúdo – e nem o que é medido por observadores independentes. Lembro que para ser igual ao TikTok – e pode apostar que Zuckerberg quer ser – é necessário 100% de conteúdo recomendado e 0% de conteúdo social.

Final

A Meta não vai simplesmente desistir das mudanças anunciadas para Facebook/Instagram. A Corporação vai agora retomar a implementação das mudanças em um tom menos estridente, com um pouco mais de vagar, a conta-gotas – como sempre fez.

Já passamos do ponto onde a Meta poderia escolher sua estratégia. Agora o único caminho a seguir é ir em frente com as mudanças. Parar agora significa colapso total do negócio.

Eu ando particularmente contente com a possibilidade da restauração dos princípios originais das redes sociais [don’t be evil!], com a saída/eliminação do grande monopolista e a chance de participação de novas empresas, ideias e visões.

O que foi dito no post de quarta-feira, continua válido, e deverá ser implantado em um perfil temporal mais longo. Não terei que esperar muito — não estou ficando mais jovem. Com base na experiência anterior posso dizer que, se tiver recursos, no final de 2023 a Meta estará fazendo exatamente o que planejou fazer.