Algo Prático: Um Provador Virtual para o Varejo de Confecções

Hoje vou me despir [trocadilho intencional] da pretensão intelectual- acadêmica para enfocar um assunto prático sobre desenvolvimento de sistemas.

Eu tenho grande interesse no mercado de confecções e moda, em geral. Talvez pelo fato de ter uma clientela no setor, além de amigos e familiares envolvidos no negócio. Nosso estúdio de software já teve a oportunidade de criar inovações importantes para nossos clientes do setor de confecções, sempre com foco na interação e responsividade. Por essa razão, achei que seria interessante falar neste post sobre o sistema Revery AI. Queremos nos colocar como fornecedores dessa classe de tecnologia para o mercado brasileiro, empregando nossa expertise em manipulação de imagens, sistemas de aprendizado de máquina (AI) e soluções 3D.

Imagem: iStock

O aumento repentino das compras online por conta da pandemia de Covid-19 impôs desafios significativos aos varejistas de confecções. A incapacidade física de experimentar e visualizar as roupas tornou as compras menos interativas, contribuindo para baixas taxas de conversão e altas taxas de devolução, em comparação com as compras tradicionais. Os provadores virtuais como o que discutimos aqui tornam-se alternativas viáveis, nestes tempos infecciosos, para recriar, em certa medida, a experiência perdida de provar roupas pessoalmente. Existem muitas empresas desenvolvendo um provador virtual [inclusive a nossa]. O grande problema para sua implementação é a escalabilidade.

Os sites de comércio eletrônico de confecções têm milhares, senão milhões de items em estoque – que chamaremos de Unidade(s) de Manutenção de Estoque (UME). Atualmente, o fluxo de trabalho para edição de conteúdo dos sites que vendem para esse segmento geralmente requer trabalho gráfico personalizado em software como o Photoshop e/ou software modelador em 3D, que são caros e requerem mão-de-obra especializada. Em contraste, o Revery AI aproveita a pesquisa de aprendizado de máquina [Machine Learning] para automatizar todo esse processo, resultando no primeiro provador virtual escalável que pode ser facilmente integrado a qualquer grande plataforma de e-commerce com milhões de UMEs.

Aprendizado de Máquina

Em vez de uma produção gráfica elaborada, em 3D, o sistema trabalha com imagens básicas. O objetivo é produzir visualizações precisas e realistas de roupas vestindo pessoas. Uma solução comum [e ingênua] para atualizar o conteúdo do site com novos items seria simplesmente copiar e colar a peça no modelo. Mas isso apresenta dois problemas.

1) Se as poses e maneirismos do modelo-roupa forem incompatíveis, o copiar-colar não funcionará.

2) Mesmo com poses ideais, copiar e colar não leva em consideração as interações peça-peça, peça-peça-modelo e também ignora a iluminação, as sombras, etc.

Este sistema usa o aprendizado de máquina profundo [deep learning] para superar esses problemas. Para o problema 1), o Revery AI usa uma série de distorções, para deformar a imagem da roupa em uma forma aproximada à do corpo fazendo a pose apropriada. Isso difere das abordagens comuns de baixa tecnologia, que normalmente usam apenas uma única e limitada deformação/transformação de imagem.

Para o problema 2), o sistema se baseia em um gerador de imagem que recebe as entradas relevantes (a imagem do modelo, imagem da roupa, pose, etc.) e retorna uma imagem realista de uma figura humana vestindo a roupa. O sistema produz melhorias significativas no tamanho, ajuste e caimento, em comparação com as técnicas costumeiras de baixa tecnologia, permitindo criar imagens realistas de qualquer modelo usando qualquer combinação de roupas. Para os interessados em detalhes técnicos adicionais, este link leva ao artigo original da pesquisa no site de pré-impressões Arxiv >> https://arxiv.org/abs/2003.10817

Tela do Revery AI. O usuário seleciona a peça à direita e o software a renderiza no modelo virtual à esquerda. Note que o software faz os ajustes e transformações na peça para se adaptar realisticamente ao modelo. A peça foi fotografada normalmente em superfície plana.

A abordagem de exibição de produtos e venda online adotada pelo Revery AI torna a integração com os varejistas muito mais fácil, porque requer apenas uma única imagem da peça de roupa em um fundo de cor uniforme. Todo o resto é integrado e resolvido pelo software. A equipe do Revery processa em torno de um milhão de imagens por semana. Em seguida, trabalha com o varejista para criar um ‘widget’ que possa ser facilmente integrado ao site da loja. A simplicidade desta solução significa que os clientes podem ter um provador virtual montado em poucos dias.

O sistema já se integra com sucesso a vários varejistas de alto perfil no e-commerce de moda. Pesquisas com os clientes mostram que o provador virtual melhorou o engajamento médio dos usuários em 500% e, mais importante, proporcionou um aumento na taxa de conversão da venda também de 500%. Além disso, os resultados mostram aumentos no valor médio dos pedidos e diminuições nas taxas de devolução. Essa solução também atende vários casos de uso que vão além do provador virtual. Como a geração e manipulação de imagens está no centro do negócio, os clientes também têm interesse em usar o sistema para gerar imagens de sessões de fotos “in store”, para economizar nas despesas com os vários tipos de serviços fotográficos que utilizam.

Embora a experimentação virtual baseada em imagens seja um campo de pesquisa ativo na academia, a transição da pesquisa para o produto não é trivial. Gerar imagens realistas e precisas de pessoas e roupas em alta fidelidade é mais difícil do que parece. Quaisquer imprecisões são simplesmente inaceitáveis ​​para os clientes. A start-up demorou um ano para obter resultados satisfatórios.

Neste ponto, percebemos que esse exercício aparentemente acadêmico pode realmente ser uma ferramenta que usuários reais desejam usar. É uma grande inovação, capaz de trazer movimento para esse mercado tão significativo para a economia brasileira, especialmente neste momento de crescimento das compras online.

Nosso estúdio [Vox Leone] se mantém sempre atualizado sobre essa linha de pesquisa, que acompanhamos de perto há quase duas décadas. Se você quiser saber mais sobre o sistema, ou experimentar a tecnologia em seu site ou plataforma, entre em contato. Esta é uma das nossas linhas de trabalho favoritas.

Uma demonstração ao vivo pode ser vista e experimentada [em inglês] neste link: https://revery.ai/demo.html

Reações Mistas à ‘Nova’ Música do Nirvana

Se estivesse vivo, o vocalista do Nirvana Kurt Cobain teria de 52 anos de idade. Todos os anos, nas proximidades de seu aniversário, 20 de fevereiro, os fãs se perguntam que tipo de música ele estaria escrevendo se não tivesse morrido de suicídio há quase 30 anos. Nunca poderemos saber a resposta para essa pergunta, mas um experimento em Aprendizagem de Máquna está tentando preencher a lacuna.

Uma organização dedicada à saúde mental chamada Over The Bridge usou a “AI” Magenta do Google e uma rede neural genérica para examinar mais de duas dúzias de músicas do Nirvana, com o objetivo de criar uma faixa ‘nova’ da banda. O resultado, a faixa “Drowned in The Sun”, abre com um ‘plucking’ encharcado de reverb antes de se transformar em um ataque de ‘power-chords’ distorcidos. “I don’t care/I feel as one, drowned in the sun”, canta no refrão Eric Hogan, cantor de uma banda-tributo do Nirvana envolvida no projeto. Na execução ela não parece tão diferente de “You Know You’re Right”, uma das últimas músicas que o Nirvana registrou antes da morte de Cobain em 1994.

A voz de Hogan é o único elemento “real” na produção. Todo o resto foi gerado pelos dois programas de “AI” que a Over The Bridge usou. A organização do projeto primeiro alimentou o Magenta com as canções da banda em arquivos MIDI, para que o software pudesse aprender as notas e harmonias específicas que tornaram essas músicas tão memoráveis. Um fato engraçado é que o estilo solto e furioso de Cobain dificultou o trabalho da AI, fazendo com que o sistema inicialmente emitisse uma parede de distorção, em vez de algo realmente parecido com a assinatura de suas melodias. “Foi muita tentativa e erro para chegar ao resultado satisfatório”, diz o membro da Over The Bridge, Sean O’Connor. Uma vez obtidas as amostras musicais e líricas, a equipe criativa escolheu os melhores bits para finalizar o processo de produção. A maior parte da instrumentação que você ouve no resultado final são faixas MIDI com diferentes ajustes e efeitos em camadas sobrepostas.

Uma coisa que a AI não conseguiu captar é como exatamente Cobain teria cantado a música. Fora do tempo e do tom, Hogan teve que interpretar a música imaginando como o astro do grunge (que entre muitas dores sofria de dor de estômago crônica) teria canalizado sua angústia nas letras.

Over The Bridge não é o primeiro grupo a usar AI para imitar um artista morto. Mas a intenção aqui é diferente de projetos passados ​​semelhantes. “Drowned in the Sun” é parte da iniciativa “Fitas Perdidas do Clube dos 27“. Eles decidiram registrar músicas geradas por “AI”, simulando o trabalho dos artistas que morreram com a idade de 27 anos, para aumentar a conscientização sobre os recursos de saúde mental aos quais músicos e público geral podem recorrer quando sentirem que precisam de ajuda.

As reações foram mistas, variando de “A música tem um refrão de hino, e tem uma evocativa qualidade Cobain-esca…” até “uma perfeita ilustração da injustiça de se desenvolver Inteligência Artificial através da ingestão de trabalhos culturais sem a autorização de seu criador, e de como isso força criadores a serem escravos na produção de um futuro fora de seu controle”. Eu, pessoalmente, reservo minha opinião.

A organização sem fins lucrativos baseada em Toronto tem uma página no Facebook onde oferece suporte. Também oferece sessões online e workshops. Em https://www.facebook.com/OTBnonprofit

(*) Se você está experimentando pensamentos de suicídio ou auto-agressão, peça ajuda ao Centro de Valorização da Vida, CVV, no fone 188

Pare de Chamar Tudo de ‘Inteligência Artificial’!

Não existe na Neurociência uma Teoria Geral da Mente, que suporte de forma objetiva os esforços da engenharia para construir uma máquina que simule as funcionalidades do cérebro biológico. Não há sequer um esboço dessa teoria. Por esta razão, os sistemas de inteligência artificial geral ainda estão muito longe de ser avançados o suficiente para substituir os humanos em muitas tarefas envolvendo o raciocínio, o conhecimento do mundo real e a interação social.

A versão contemporânea da Inteligência Artificial é apenas um algoritmo, propriamente chamado de Aprendizagem de Máquina.

Sem dúvida eles têm mostrado competência de nível aparentemente humano em habilidades repetitivas de reconhecimento de baixo nível, mas no nível cognitivo eles estão apenas imitando a inteligência humana, obedecendo a um rígido algoritmo clássico; uma máquina eletrônica incapaz de qualquer pensamento, raso ou profundo, ou criatividade, diz Michael I. Jordan, um pesquisador líder em AI e aprendizagem de máquinas.

Jordan é professor no Departamento de Engenharia Elétrica e Ciência da Computação, e do Departamento de Estatística, na Universidade da Califórnia, Berkeley. Ele ressalta que a imitação do pensamento humano não é o único objetivo da aprendizagem de máquina – o campo da engenharia de software que sustenta o progresso recente na busca da AI – ou mesmo o melhor objetivo. Em vez disso, a aprendizagem de máquina pode servir para estender a inteligência humana, via análise meticulosa de grandes conjuntos de dados, da mesma maneira que um mecanismo de busca aumenta o conhecimento humano organizando a Web. A aprendizagem de máquina também pode fornecer novos serviços aos seres humanos, em domínios como saúde, comércio e transporte, reunindo informações armazenadas em vários conjuntos de dados, encontrando padrões e propondo novos cursos de ação.

“As pessoas estão ficando confusas com o significado de AI nas discussões sobre tendências de tecnologia – existe uma noção de que há nos computadores algum tipo de pensamento inteligente responsável ​​pelo progresso, e que essa inteligência está competindo com os humanos”, diz ele. “Nós não temos isso, mas as pessoas falam como se tivéssemos.” Jordan deve saber. Afinal, o Fellow da IEEE é uma das autoridades líderes do mundo em aprendizado de máquina. Em 2016, ele foi considerado o mais influente cientista de computação por um programa que analisou publicações de pesquisa, informou a revista Science.

Jordan ajudou a transformar o campo da aprendizagem de máquina não supervisionada [que pode encontrar padrões e estruturas em massas de dados não indexados], de uma coleção de algoritmos não relacionados a um campo intelectualmente coerente. A aprendizagem não supervisionada desempenha um papel importante em aplicações científicas, especialmente onde não há dados uniformemente formatados sobre um problema (como o tráfego da Internet, por exemplo).

“Embora as extrapolações da ficção científica sobre AI e super inteligência sejam divertidas, elas são apenas uma distração “, diz ele. “Não tem havido foco suficiente no problema real, que é construir sistemas baseados em aprendizagem de máquina em escala planetária que realmente funcionem, ofereçam valor para os seres humanos e não ampliem as desigualdades.

Na íntegra em spectrum.ieee.org (em inglês)

E lá vamos nós!

Bem-vindo ao lançamento do meu primeiro blog! Meu nome é Eraldo Marques, Analista de Sistemas, e estou animado para compartilhar com você o que o mundo da computação tem a oferecer. A quantidade de ideias, girando em minha cabeça é enorme.

O que você estará vendo mais em meus posts? A Tecnologia da Informação será o pilar onde tudo se escora, Mas não me furtarei a comentar assuntos que me são caros desde a tenra idade. Trarei novidades do mundo da Internet de fala inglesa; falarei de minhas explorações no mundo da Segurança Digital, das redes sociais, dos algoritmos, da Internet das Coisas. Falarei também de música, política e artes. Uma mistura de estilo de vida, incluindo minhas descobertas de serviços e produtos de grandes e pequenas empresas.

A escrita nunca foi meu forte, e eu vou te dizer, não sou especialista em nada.. Eu posso ser um “perfeccionista”, mas estou longe de ser perfeito. Eu estouu certo de que aqui haverá muita tentativa e erro. Por favor, tenha paciência comigo em qualquer erro gramatical / ortografia (aviso legal – eu gosto de falar com muitos traços e parênteses) e, por favor, sinta-se livre para compartilhar seu conselho e se comunicar comigo à medida em que caminhamos. Espero inspirar você porque, sinceramente, tudo neste mundo me inspira.

E aqui vamos nós!