O matemático Clive Humby afirmou pela primeira vez em 2006 que “os dados são o novo petróleo”: valiosos, mas inúteis se não forem refinados. Assim como o petróleo, os dados também têm um equivalente sintético que impulsionará o futuro da inteligência artificial, de acordo com o co-fundador e CTO da Gretel, John Myers.
“Acredito que os dados sintéticos serão basicamente o combustível subjacente que alimentará o desenvolvimento de sistemas de inteligência artificial e, especificamente, os dados que o compõem”, afirmou Myers no último episódio do Quartz AI Factor, uma série de vídeos realizada no Nasdaq MarketSite.
A Gretel fornece dados sintéticos para empresas a fim de melhorar os modelos de inteligência artificial e machine learning. Os dados são a base para o desenvolvimento de sistemas e treinamento de modelos para tornar a inteligência artificial mais eficiente e precisa a cada uso.
“Eu vejo os dados sintéticos muito parecidos com o óleo sintético”, disse. “Todos que dirigem um carro hoje estão usando óleo sintético. Eles sabem que é algo semelhante ao óleo real, mas é fabricado e tem qualidades garantidas que garantem que o motor funcione sem problemas.”
Os dados sintéticos funcionam de forma semelhante. Há duas maneiras de criar dados sintéticos. A primeira é pegar dados existentes e torná-los seguros para uso – reduzindo o volume, tornando-os portáteis e eliminando riscos de privacidade. A outra é criá-los “do zero”, gerando dados que não existem para resolver problemas e construir novos produtos.
A consultoria Gartner estimou que 60% dos dados utilizados para inteligência artificial e análises serão gerados sinteticamente até 2024. O mercado de geração de dados sintéticos é previsto para crescer para 2,1 bilhões de dólares em 2028, a partir de 381,3 milhões de dólares em 2022, de acordo com a BCC Research.
A privacidade é um dos maiores pontos de venda para os dados sintéticos, especialmente em setores altamente regulamentados, como serviços financeiros e saúde, que lidam com muitas informações pessoais sensíveis. Mas os dados sintéticos também podem preencher lacunas onde os dados do mundo real são limitados e complementar os dados produzidos organicamente que estão desatualizados ou de baixa qualidade.
No entanto, Myers não vê os dados sintéticos substituindo os dados brutos. Em vez disso, servirão como complemento aos dados reais e registros.
“Eu acho que vamos encontrar uma fronteira bastante grande que dirá que, quando quisermos construir aplicativos ou colocar esses dados para funcionar, vamos pegar uma versão sintética desses dados e usá-la”, disse Myers. “E é aí que seus aplicativos serão construídos na camada empresarial, enquanto os dados brutos são usados para refiná-los em dados sintéticos.”
Assista ao último episódio do Quartz AI Factor acima.