Uma postagem visual para suavizar o mais vital de todos os fins de semana da história brasileira. Minha exploração da arte digital baseada em Difusão Latente continua.
Meu pequeno logotipo é uma linda obra de arte, que chegou às minhas mãos na adolescência e que tenho até hoje. É uma charge de jornal – estrangeiro – do início do século 19, cujo o autor eu ainda não identifiquei, mas sigo procurando.
A arte, sobre a qual ainda falarei mais, mostra um leão exibindo seu perfil direito, em atitude heráldica “couchant”, habilidosamente inscrito no contorno da América do Sul. Um autêntico achado geométrico. É uma imagem evocativa de um Brasil grande e forte, estendendo seu olhar sobre o Atlântico sul.
É uma imagem que resume as aspirações da nação quando eu era jovem. É também uma imagem austera, que se pretende heráldica ao invés de fruto de design; vai contra o pós modernismo vigente, mas aqui no blog essa é exatamente a ideia.
Este blog existe por causa desta imagem; foi olhando para ela em pensamento profundo que me inspirei. “A voz do leão”, para tentar falar de tecnologia e ciência para a lusofonia, com um ‘modicum’ de profundidade – sem dar muita bola para o estilo superficial preferido nas redes sociais — como as pessoas fazem nos centros avançados do mundo. O Brasil é o Leão.
Eu quis fazer variações para poder usar a imagem em outros contextos que exijam um ‘look’ mais contemporâneo — com resultados medianamente animadores. Lancei mão da Stable Diffusion e, abusando da engenharia de prompt, passei algumas horas agradáveis tentando fazer arte. Aproveitei para usar o gadget ‘galeria de slides’ do WordPress pela primeira vez.
Não sei se verei esse Brasil grande, que faz tecnologia, que lança foguetes e satélites e junta à elite material do mundo. Se depender da classe política que aí está eu duvido muito que cheguemos lá. Foi sob a batuta do Ministro da Tecnologia, um aviador e astronauta formado por um instituto de tecnologia, que eu testemunhei o maior [talvez o único] desmonte deliberado de políticas tecnológicas do estado brasileiro em toda história [a começar do programa espacial, que se encontra desativado desde 2003].
Que o Brasil possa se reencontrar a partir das eleições de amanhã. Boa sorte a todos.
Quando você cria algo no Photoshop é provável que você nunca tenha pensado muito sobre a origem das cores digitais que você usa. Igualmente, talvez você nunca tenha se perguntado se alguém pode “possuir” uma determinada cor.
Imagem: Pexels.com
Mas muitos usuários logo vão começar a dar atenção a essas coisas, pois suas coleções de arquivos PSD está prestes a ficar cheias de tons de cinza esquisitos, devido a mudanças de licenciamento entre a Adobe e a Pantone.
A partir de agora, aplicativos populares da Adobe, como Photoshop, Illustrator e InDesign, não vão mais suportar gratuitamente as cores da Pantone, e aqueles usuários que precisam que essas cores apareçam em seus arquivos já salvos precisarão pagar por uma licença separada. Bem vindo ao mundo do software proprietário.
A remoção das cores da Pantone do software da Adobe deveria ter acontecido em 31 de março deste ano, mas essa data chegou, passou e nada aconteceu. A data foi mudada para 16 de agosto, e depois 31 de agosto. No entanto, apenas agora as pessoas estão percebendo os efeitos da decisão, relatando problemas com criações que usam as cores exatas da Pantone. A solução oferecidoa é um plug-in da Adobe para “minimizar a interrupção do fluxo de trabalho e fornecer as bibliotecas atualizadas aos usuários da Adobe Creative Cloud”. O que, é claro, custa US$ 15 por mês. É como a Netflix, só que para colorir!
No entanto, a Pantone ainda afirma – em seu FAQ desatualizado – que “Esta atualização terá um impacto mínimo no fluxo de trabalho do designer. Arquivos e documentos da Creative Cloud contendo referências de cores Pantone manterão as identidades e informações de cores”. Muitos usuários relatam que seu Photoshop agora informa: “Este arquivo tem cores Pantone que foram removidas e substituídas por preto devido a alterações no licenciamento da Pantone com a Adobe”. Outros relataram que o problema não está sendo resolvido mesmo anexando uma licença Pantone no Photoshop.”
Uma dica sugerida pela Print Week é fazer backup de suas bibliotecas Pantone e reimportá-las quando o software Adobe atualizar para removê-las. “Há uma boa chance de que isso funcione, já que as cores do Pantone são armazenadas como arquivos .ACB, assim como todas as cores do Photoshop.”
“Ou, sabe como é, você pode simplesmente copiar os valores de metadados do intervalo Pantone.”
Se você não está prestando atenção ao que está acontecendo com o súbito aparecimento da Difusão Estável, você está perdendo um momento realmente interessante na história da tecnologia.
Tudo começou quando há dez dias, em 22 de agosto, a start-upStability.ai abriu o código-fonte de sua plataforma de síntese de imagem chamada “Stable Diffusion” – uma arquitetura de difusão latente semelhante ao DALL-E 2 do OpenAI e ao Imagen do Google, treinada com milhões de imagens extraídas da web. Desde então a tecnologia tem desfrutado uma contínua explosão de interesse.
Ao contrário do conteúdo deepfake baseado em autoencoder, ou das recriações da figura humana que podem ser alcançadas por Neural Radiance Fields (NeRF) e Generative Adversarial Networks (GANs), os sistemas baseados em difusão aprendem a gerar novas imagens adicionando ruído às imagens usadas como fontes. A reiteração desse processo ensina o sistema como fazer imagens plausíveis – e até foto-realistas – a partir apenas desse ruído.
Modelos baseados em difusão aprendem a reconstruir fotos adicionando ruído a imagens “não contaminadas” e observando a relação elas e a imagem “contaminada” à medida que mais ruído é adicionado. Imagem: Google
Com a repetição do processo, o modelo começa a entender as “relações latentes” entre fontes altamente difusas e suas versões nítidas e de maior resolução. Depois de bem treinado, um modelo de difusão latente do tipo “texto-para-imagem” pode então “recuperar” imagens, separando-as do ruído de base usando prompts de texto como guias para quais elementos recuperar.
Em apenas alguns dias, houve uma explosão de inovação em torno deste processo. As coisas que as pessoas estão criando são absolutamente surpreendentes.
Tenho acompanhado o subreddit r/StableDiffusion e seguido o fundador da Stability, Emad Mostaque, no Twitter.
Minhas experiências
No início desta semana eu comecei a fazer experimentos com a tecnologia. O mínimo que posso dizer é que gerar imagens a partir de texto é um jogo totalmente novo.
Com os modelos “texto-para-imagem”, as habilidades linguísticas adquirem muita importância, à medida que a precisão conceitual na composição do chamado “prompt” vai determinar o resultado final do trabalho. No estágio atual da tecnologia, o prompt deve ser composto em inglês. Eu suponho que uma interface em português vai surgir em algum momento – farei minha contribuição na medida do possível.
Minhas explorações mostradas aqui foram feitas na plataforma onlinebeta.dreamstudio.ai (atualmente grátis). A conta no site permite a geração de 200 imagens, antes de começar a monetizar. Já existem muitos outros sites parecidos, e novos aparecem todo dia.
Canalizei meu Roger Dean interior e comecei a esboçar algumas coisas. Depois de uma manhã eu já tinha uma pequena coleção para curtir e mostrar:
Um Sonho de São Paulo
Eu gosto do estilo matte paint, e minha primeira ideia foi investigar como São Paulo apareceria como um cenário a laBlade Runner.
Prompt usado: A dream of Sao Paulo city, Caspar David Friedrich, matte painting, artstation HQ
No prompt eu estabeleço alguns parâmetros/atributos que eu gostaria que a imagem tivesse:
Dream, indicando uma atmosfera onírica; São Paulo city, o objeto central, Caspar Friedrich, replicando o estilo do artista homólogo, Matte painting, para dar a textura, Artstation HQ, para invocar o estilo do studio Artstation [games, mídia].
São Paulo Dream
Neste ponto o leitor já percebeu que eu gosto de São Paulo e curto uma atmosfera onírica, com elementos pós-apocalípticos.
Prompt Usado: A dream of Sao Paulo, a distant galaxy, Caspar David Friedrich, matte painting, trending on artstation HQ
Nave Alien Gigante
Prompt usado: gigantic extraterrestrial futuristic alien ship in brand new condition, not ruins, hyper-detailed, artstation trending, world renowned artists, antique renewal, good contrast, realistic color, cgsociety, greg rutkowski, gustave dore, Deviantart
Roma Alienígena
Prompt usado: Julius Caesar, alien roman historic works, ruins, hyper-detailed, world renowned artists, historic artworks society, good contrast, realistic color, cgsociety, Greg Rutkowski, Deviantart
Um Rio de Janeiro de Sonho
Prompt usado: Rio de Janeiro, fuzzy, dreamy, world renowned artists, good contrast, pastel color, Greg Rutkowski, Deviantart
Rio Hipgnosis
Aqui eu tentei replicar o estilo do já citado Roger Dean, e do estúdio Hipgnosis, famoso pelas capas de discos das grande bandas de rock nos anos setenta, como Yes, Pink Floyd, Led Zeppelin, e muitos outros. Note a silhueta do Pão de Açúcar, quase imperceptível. Definitivamente Lisérgico.
Prompt usado: Rio de Janeiro, sketchy, dreamy, world renowned artists, good contrast, pastel color, Roger Dean, Hipgnosis
Transilvania
Aqui eu recebi o valoroso input de minha mulher, ligada ao mundo das bruxas e das brumas, que sempre me apoia em minhas desventuras digitais. A ideia era fazer Drácula aparecer no cenário, mas vejo que será preciso maior empenho na engenharia do prompt.
Prompt usado (composto por Marília Gião): Dracula castle on a mountain, at dusk, matte paint, Transylvania dream, David Friedrich, chariots with horses, hyper detailed, deviantart
É mesmo uma coisa incrível. Imagine ter um artista conceitual multi habilidoso ao seu dispor, cujo único propósito na existência é interagir com você e materializar suas fantasias visuais mais loucas. Tudo a um custo muito baixo.
Você pode executar a difusão estável em seu próprio computador, em um ambiente virtual python, se tiver as inclinações técnicas para configurá-lo [é preciso placa gráfica compatível com CUDA – tipicamente Nvidia] . Posso dar algumas indicações nos comentários, se alguém tiver interesse. Em serviços online como Replicate ou Hugging Face você pode ainda usar a biblioteca “imagem-para-imagem” – que está chegando também à interface do DreamStudio que usamos aqui.
Há muito mais acontecendo. A melhor descrição que vi até agora de um processo iterativo para construir uma imagem usando Stable Diffusion vem de Andy Salerno: 4.2 Gigabytes, ou: Como desenhar qualquer coisa. Nestes experimentos eu usei partes dos prompts de Andy.
E há muito mais por vir.
As inescapáveis questões éticas
As questões éticas levantadas por esses sistemas precisam ser enfrentadas e resolvidas. São questões difíceis.
A difusão estável foi treinada com milhões de imagens extraídas da web. Essas imagens são protegidas por direitos autorais. Não estou qualificado para falar sobre a legalidade disso. Pessoalmente, estou mais preocupado com a moralidade.
O Stable Diffusion v1 Model Card tem todos os detalhes de especificação, mas para resumir, ele usa um conjunto de dados LAION-5B (5,85 bilhões de pares de imagem-texto) e seu subconjunto Laion-aesthetics v2 5+ (um conjunto de aproximadamente 600 Milhões de pares). Essas imagens foram retiradas da web.
O modelo final tem cerca de 4,2 GB de dados – um blob binário de “floating points”. O fato de se poder comprimir uma quantidade tão grande de informação visual em um volume tão pequeno é, em si, um feito fascinante. Contudo, de novo, as pessoas que criaram essas imagens não foram consultadas sobre seu consentimento.
Para além disso, como já como discutimos no blog em outra postagem [link], o modelo pode ser visto como uma ameaça direta ao meio de subsistência de milhões de profissionais pelo mundo afora. Eu mesmo fui um desenhista ilustrador em meu primeiro emprego. Hoje eu não teria chance de começar. O vídeo e o áudio seguirão o mesmo caminho. Ninguém esperava que as IAs criativas viessem tão rapidamente para ceifar os empregos dos artistas, mas aqui estamos!
Há também implicações [negativas] para o mercado de arte — e, em breve, do fonográfico, além do cinema.
Nasce uma Nova profissão: a Engenharia de Prompt
Como tentei mostrar, e como você mesma(o) pode verificar se resolver praticar a técnica no link que forneci, o background pessoal influenciará muito no sucesso. As pessoas que vão exercer essa atividade em um nível profissional elevado nas agências de criação terão que se aprofundar na observação e no estudo da linguagem.
Além da precisão linguística, os parâmetros envolvidos na composição do prompt, para um resultado artístico perfeitamente controlado, exigem conhecimento técnico, senso de estilo e conhecimento histórico. Quanto mais palavras-chave relacionadas estiverem envolvidas na composição maior será o controle do artista sobre o resultado final. Exemplo: o prompt
Uma cidade futurista distante, cheia de prédios altos dentro de uma enorme cúpula de vidro transparente, No meio de um deserto árido cheio de grandes dunas, Raios de sol, Artstation, Céu escuro cheio de estrelas com um sol brilhante, Escala maciça, Neblina, Muito detalhado, Cinematográfico, Colorido
é mais sofisticado do que simplesmente
Uma cidade cheia de prédios altos dentro de uma enorme cúpula de vidro transparente
Note que a densidade conceitual, portanto a qualidade, do prompt depende muito do background cultural e linguístico da pessoa que faz a composição. De fato, um prompt de qualidade se assemelha muito a uma cena de cinema descrita em um roteiro/storyboard [a propósito, lá se vão os Production Designers, junto com os concept artists, graphic designers, set designers, costume designers, lighting designers…].
Na tentativa de monetizar os frutos da nova tecnologia, os empreendedores da Internet serão forçados pela mão invisível do mercado de trabalho a se aprofundar nos conhecimentos linguísticos. Será um efeito colateral benigno, penso eu, considerando estado atual da Internet. Talvez isso leve a uma melhor articulação das ideias no ambiente da rede.
Assim como influenciadores do YouTube têm talento para lidar com os aspectos visuais das interações humanas, os aspirantes à engenharia de prompt terão que se destacar em farejar as nuances da expressão humana. Eles têm grande potencial para ser os novos profissionais descolados da economia digital, assim como foram os web designers, e depois os influencers — que, com o fim das redes sociais, agora tendem a perder relevância.
Para se diferenciar, os engenheiros de prompt terão que ser ávidos leitores e praticantes de semiótica/semiologia.
Umberto Eco e os estruturalistas poderão voltar à moda.
Indistinguível da magia
Apenas alguns meses atrás, se eu tivesse visto alguém criar essas imagens em um programa de TV, ou em um vídeo do YouTube, eu teria resmungado sobre essas mistificações, grosseiras mesmo para padrões da TV e da Internet (sorry).
A ficção científica é real agora. Modelos generativos de aprendizagem de máquina estão aqui, e a taxa com que eles estão melhorando é absolutamente irreal. Eu digo isso tendo um histórico de ceticismo quanto ao “hype” e às possibilidades dessa modalidade de AI. Vale a pena prestar atenção ao que eles são capazes de fazer, como estão se desenvolvendo, e ao impacto que eles terão na sociedade.
Nos fóruns de desenvolvedores e empreendedores que frequento, tem ficado muito comum ouvir coisas com mais ou menos o seguinte teor:
Imagem: Pexels.com
Estou começando a desconfiar de quem diz que ainda existem inúmeros problemas para resolver neste mundo. Eu faço uma pesquisa rápida no Google para qualquer ideia que eu tenha e adivinhem? O nicho já está cheio de concorrentes no campo. Como iniciar uma startup hoje em dia? Sim, eu sei, é preciso se diferenciar. Sim, eu sei, é a execução que importa. Mas é desencorajador colocar as esperanças em um mercado que já está cheio de outros que começaram seu progresso quando eu era ainda um iniciante.
Como abordar essa exasperação?
Esse parece ser um familiar poço de desespero. Escritores são propensos a ansiedades semelhantes. “Tudo o que vale a pena dizer já foi dito. Mas, como ninguém estava ouvindo, é preciso dizer de novo” – assim escreveu André Gide. Curiosamente, Goethe já havia defendido o mesmo ponto um século antes. Jean de La Bruyère havia dito a mesma coisa no século XVII. Agostinho havia escrito mais ou menos a mesma coisa no final da Antiguidade. E o Eclesiastes havia vencido a todos séculos antes disso: “Não há nada de novo sob o sol”.
Eu também estou na corrida. Não tenho autoridade alguma para falar sobre o que leva uma startup ao sucesso – noto aqui que eu não sou muito fã do termo “startup”, que remete às panelinhas universitárias da elite econômica. Contudo, também tenho ideias originais, portanto sei em primeira pessoa que há ainda muito espaço para a inovação. Eu vejo que as tensões desencorajadoras não estão no espaço da criação, e nem na capacidade de realização. Estão em outros fatores, como capacidade de crédito, rede de relacionamentos, ambiente de negócios, etc. Meras externalidades.
Estou convencido também de que grande parte do problema se resume à uma questão de perspectiva: o que você procura é um segmento/categoria de mercado novo ou maduro? Segmentos de mercado recém inaugurados trazem muitas oportunidades, e há muitos deles ao redor. Nós desenvolvedores precisamos saber usar um novo mercado ao nosso favor.
Se eu realmente me atrevesse a dar um conselho, eu descreveria exatamente o que estou fazendo agora, e diria mova-se rapidamente começando nas áreas que seus concorrentes já validaram e aprenda a evitar os erros que eles cometeram no passado. Faça o possível para se diferenciar com base no feedback do seu mercado.
A concorrência é inevitável, mas pode ser aproveitada para aumentar seu aprendizado sobre o mercado e as necessidades do seu cliente, se souber como analisar sua estatística. Ela é positiva na medida em que é muito mais fácil ter várias empresas validando e/ou invalidando um novo espaço do que você fazer isso sozinho.
O ciclo de vendas para mercados novos e não comprovados geralmente é muito lento, pois eles exigem educação [exposição ao produto] e mudança de comportamento do consumidor. Então por que não deixar que os primeiros a adotar seu produto se encarreguem naturalmente disso antes de você conquistar uma participação significativa no mercado?
Unicórnios
Se você está tentando montar uma startup unicórnio este post não é para você [e apenas minha sôfrega imaginação te vê frequentando este blog].
Mas se você – como eu – quer ter um negócio real, ou alguma coisa própria, na internet, e acha que tem uma solução competitiva para algum problema – o sucesso obviamente será decorrente, então você e eu só precisamos fazer algo melhor do que o que já existe [e tratar de espalhar bem a novidade]. Onde as Big Techs são catedrais nós seremos bazares. Pense em uma feira onde servem os mesmos tipos de comida e como os chefs conseguem dar seu toque pessoal aos sabores, diferença que reflete na qualidade, clientela, e na atmosfera geral.
Há muitas maneiras de fazer algo melhor. Quase sempre é possível tornar um produto ou serviço de tecnologia melhor, com maior velocidade, com interface do usuário mais intuitiva, mais especializado para uma tarefa específica, e assim por diante.
Deve-se também ter em mente que o primeiro no mercado nem sempre é o mais bem-sucedido; muitas vezes é o segundo no mercado, ou mesmo o décimo, desde que o projeto deles tenha a melhor execução. O Facebook não era muito melhor do que o Myspace, e, embora as pessoas esqueçam, havia dezenas de outros sites que competiam pelo mesmo espaço naquela época. Tudo o que o Facebook fez melhor foi apresentar uma interface de usuário melhorada e segmentar um público específico (universitários, na época). A expansão para outros públicos veio depois.
Enfim, o resumo é que, mesmo que uma ideia tenha sido feita, será que ela foi feita de modo definitivo, do jeito que você quer, ou do jeito que o público quer? Quero acreditar que sempre há escolhas – especialmente quando não tentamos ser unicórnios.
Um produto Mínimo Viável não é mais suficiente
Imagem: Pexels.com
No palavreado das startups, um produto mínimo viável (PMV), é um produto com recursos suficientes para atrair clientes pioneiros e validar uma ideia de produto ainda no início do ciclo de desenvolvimento.
O conceito de PMV desempenha um papel central no chamado desenvolvimento ágil. Em setores como software, o PMV é uma ferramenta valiosa para ajudar a equipe de desenvolvimento a receber feedback do usuário o mais rápido possível para iterar na melhora do produto.
O que é PMI?
Este é um conceito originário da metodologia Lean Development [desenvolvimento enxuto]. A abreviação vem do inglês Minimum Awesome Product, [Produto Mínimo Incrível – PMI]. “Incrível” aqui significa exatamente isso – um produto que os consumidores chamarão de incrível. Eles não esperam nada menos em 2022.
O PMI é uma evolução do PMV e uma forma de evitar que o produto mínimo viável seja muito “mínimo”. Hoje em dia, os usuários já são muito acostumados a uma “experiência” gráfica e não estão dispostos a explorar um site com Times New Roman preto sobre um fundo branco e um botão “Inscrever-se” – Embora haja quem vá ao outro extremo e carregue seu PMV com excesso de animações, imagens, vídeos e outros efeitos especiais extravagantes.
A principal distinção de um PMI quando comparado a um PMV é que o PMI tem um conjunto de recursos um pouco mais amplo, além de também levar em contar o design da interface e da experiência do usuário [UX]. O PMI usa os elementos que os usuários estão acostumados a encontrar em aplicativos do mesmo tipo. Um design de interface bem estruturado tende fazer o usuário acreditar que o aplicativo é mais eficaz do que um outro com um design mais despojado. Além disso, é preciso ter sempre em vista a maneira como seus concorrentes projetam seus produtos. O seu não deve parecer mais tosco em comparação.
De qualquer forma, é claro que um produto mínimo viável sempre deve aspirar ser um um produto mínimo incrível. O pressuposto de um PMV foi sempre a qualidade do conjunto de recursos e não qualidade final. Ele deve ter o conjunto mínimo de recursos necessários, mas construídos e projetados com o melhor padrão. Resumindo: se o seu negócio é vender pizza, o seu produto mínimo viável deve ser uma pizza que seja incrível.
A Overjet, fundada por alunos do MIT, usa inteligência artificial para anotar radiografias para dentistas – Imagem: Cortesia de Overjet
Quando você imagina um radiologista em um hospital, pode ser que você pense em um especialista que se senta em uma câmara escura e passa horas examinando raios-X para fazer diagnósticos.
Compare essa imagem mental com seu dentista, que além de interpretar raios-X também tem que fazer cirurgias, gerenciar equipe, comunicar-se com pacientes e administrar seus negócios. Quando os dentistas analisam raios-X, eles o fazem em salas iluminadas e em computadores que não são especializados em radiologia, e geralmente com o paciente sentado ao lado deles.
Portanto não é surpresa que dentistas que analisam um mesmo raio X possam propor tratamentos diferentes. “Os dentistas fazem um ótimo trabalho, considerando todas as suas ocupações”, diz Wardah Inam SM, PhD. Inam é cofundadora da Overjet, uma empresa que usa inteligência artificial para analisar e anotar raios-X para dentistas e seguradoras.
A Overjet busca tirar a subjetividade das interpretações de raios-X para melhorar o atendimento ao paciente. “Trata-se de avançar para uma medicina mais precisa, onde temos os tratamentos certos na hora certa”, diz Inam, que cofundou a empresa com Alexander Jelicich. “É aí que a tecnologia pode ajudar. Uma vez que quantificamos a doença, podemos facilitar a recomendação do tratamento correto.”
Overjet foi aprovado pela Food and Drug Administration [EUA] para detectar e delinear cáries e quantificar os níveis ósseos como auxílio no diagnóstico da doença periodontal, uma infecção gengival comum, mas evitável, que causa a deterioração do maxilar e de outros tecidos que suportam os dentes. Além de ajudar os dentistas a detectar e tratar doenças, o software da Overjet também foi projetado para ajudar os dentistas a mostrar aos pacientes os problemas que estão vendo e explicar por que estão recomendando determinados tratamentos.
A empresa, que já analisou dezenas de milhões de raios-X, é usada por clínicas odontológicas em todos os Estados Unidos e atualmente está trabalhando com seguradoras que representam mais de 75 milhões de pacientes nos EUA. Inam espera que os dados que a Overjet está analisando possam ser usados para agilizar as operações e melhorar o atendimento aos pacientes. “Nossa missão na Overjet é melhorar a saúde bucal criando um futuro clinicamente preciso, eficiente e centrado no paciente”, diz Inam.
Foi uma jornada relâmpago para Inam, que não sabia nada sobre a indústria odontológica até que uma experiência desconcertante despertou seu interesse em 2018.
Chegando à raiz do problema
Inam veio para o MIT em 2010, primeiro para seu mestrado e depois seu doutorado em engenharia elétrica e ciência da computação, e diz que pegou o vírus do empreendedorismo desde cedo. “Para mim, o MIT era uma área livre à experimentação, onde você podia aprender coisas diferentes e descobrir o que você gosta e o que você não gosta”, diz Inam. “Além disso, se você está curioso sobre um problema, pode realmente mergulhar nele.”
Enquanto fazia aulas de empreendedorismo na Sloan School of Management, Inam acabou iniciando uma série de novos empreendimentos com colegas de classe. “Eu não sabia que queria começar uma empresa quando vim para o MIT”, diz Inam. “Eu sabia que queria resolver problemas importantes. Passei por essa jornada de decidir entre a academia e a indústria, mas gosto de ver as coisas acontecerem mais rápido e gosto de causar impacto na minha vida, e foi isso que me atraiu para o empreendedorismo.”
Durante seu pós-doutorado no Laboratório de Ciência da Computação e Inteligência Artificial (CSAIL), Inam e um grupo de pesquisadores aplicaram aprendizado de máquina a sinais wireless para criar sensores biomédicos que pudessem rastrear os movimentos de uma pessoa, detectar quedas e monitorar a frequência respiratória.
Ela não tinha interesse pela odontologia até depois de deixar o MIT, quando teve que mudar de dentista e recebeu um plano de tratamento totalmente novo. Confusa com a mudança, ela pegou seus raios-X e pediu a outros dentistas para dar uma olhada, apenas para receber mais variações nas recomendações de diagnóstico e tratamento.
Nesse ponto, Inam decidiu mergulhar na odontologia por conta própria, lendo livros sobre o assunto, assistindo a vídeos no YouTube e, eventualmente, entrevistando dentistas. Antes que ela percebesse ela estava gastando mais tempo estudando sobre odontologia do que em seu trabalho.
Na mesma semana em que Inam deixou o emprego, ela soube da competição Hacking Medicine do MIT e decidiu participar. Foi aí que ela começou a construir sua equipe e a fazer conexões. O primeiro financiamento da Overjet veio do grupo de investimentos afiliado ao Media Lab, o E14 Fund.
“O fundo E14 fez o primeiro cheque, e acho que não teríamos chegado a existir se não fosse por eles nos dando uma chance”, diz ela. Inam aprendeu que um grande motivo para a variação nas recomendações de tratamento entre os dentistas é o grande número de opções potenciais de tratamento para cada doença. Uma cárie, por exemplo, pode ser tratada com uma restauração, uma coroa, um canal radicular, uma ponte, e assim por diante.
Quando se trata de doença periodontal, os dentistas devem fazer avaliações milimétricas para determinar a gravidade e a progressão da doença. A extensão e progressão da doença determina o melhor tratamento. “Eu senti que a tecnologia poderia desempenhar um grande papel não apenas para melhorar o diagnóstico, mas também para comunicar com os pacientes de forma mais eficaz, para que eles entendam e não precisem passar pelo processo confuso que fiz de me perguntar quem está com a razão”, diz Inam.
A Overjet começou como uma ferramenta para ajudar as seguradoras a otimizar os sinistros odontológicos antes de começar a integrar sua ferramenta diretamente nas clínicas odontológicas. Todos os dias, algumas das maiores organizações odontológicas do país estão usando Overjet, incluindo Guardian Insurance, Delta Dental, Dental Care Alliance e Jefferson Dental and Orthodontics.
Hoje, à medida que um raio-X odontológico é importado para um computador, o software da Overjet analisa e anota as imagens automaticamente. No momento em que a imagem aparece na tela o sistema tem informações sobre o tipo de raio-X tirado, como os dentes podem ser afetados, o nível exato de perda óssea, anotando com sobreposições de cores, indicando a localização e gravidade das cáries e muito mais. A análise efetuada fornece aos dentistas mais informações para informar os pacientes sobre as opções de tratamento.
O software da Overjet analisa e anota radiografias bucais automaticamente em tempo quase real, oferecendo informações sobre o tipo de radiografia tirada, como um dente pode ser afetado, o nível exato de perda óssea, com sobreposições de cores, a localização e gravidade das cáries, e mais. (clique para abrir a imagem no tamanho original) – Imagem: Cortesia de Overjet
“Agora, o dentista ou higienista só precisa sintetizar essas informações e usar as ferramentas incluídas no software para se comunicar com você”, diz Inam. “Aí então, ele vai te mostrar as radiografias com as anotações do Overjet e dizer: ‘Você tem 4 milímetros de perda óssea e está no vermelho; isso é mais do que os 3 milímetros que você tinha da última vez, então vou recomendar o tratamento x, y, z.” O Overjet também incorpora informações históricas sobre cada paciente, rastreando a perda óssea em cada dente e ajudando os dentistas a detectar casos em que a doença está progredindo mais rapidamente.
“Vimos casos em que um paciente com câncer com xerostomia pode ir do nada para algo extremamente ruim nos seis meses entre as visitas. Esses pacientes devem ir ao dentista com mais frequência”, diz Inam. “Trata-se de usar dados para mudar a forma como praticamos o atendimento, planejamos o tratamento e oferecemos serviços para diferentes tipos de pacientes.”
O sistema operacional da odontologia
A FDA autorizou a Overjet a operar em duas doenças altamente prevalentes. A autorização também coloca a empresa em posição de conduzir análises em nível de setor e ajudar as clínicas a se compararem com seus pares. “Usamos a mesma tecnologia para ajudar as clínicas a entender o seu desempenho e melhorar as operações”, diz Inam. “Podemos olhar para cada paciente em cada clínica e identificar como elas podem usar o software para melhorar os cuidados que estão fornecendo.”
Seguindo em frente, Inam vê a Overjet desempenhando um papel fundamental em praticamente todos os aspectos das operações odontológicas. “Estas radiografias foram digitalizadas há bastante tempo, mas nunca foram usadas porque os computadores não conseguiam lê-las”, diz Inam. “A Overjet está transformando dados não estruturados em dados que se pode analisar.
No momento, estamos construindo a infraestrutura básica. Eventualmente, queremos expandir a plataforma para melhorar qualquer serviço que uma clínica possa fornecer, basicamente nos tornando o sistema operacional da clínica para ajudá-las a fazer seu trabalho de forma mais eficaz.”
Nota de VoxL: Tenho uma longa história de colaboração com odontólogos e radiologistas, em vários projetos. Nos últimos anos tenho me capacitado no campo do Aprendizado de Máquina (AI) e me preparo para oferecer serviços como o descrito no artigo — começando ainda em 2022, espero. Estamos trabalhando nos detalhes do fluxo de trabalho.
Alguns meses atrás eu fiz um post explorando o tema da visão de computador (VC) [link], enfocando de forma prática a análise facial.
Desejamos boa sorte à Overjet no marcado brasileiro, mas aviso que seremos concorrentes [Hey, há um lugar para todos sob o Sol!].