A obtenção de massa de dados é o primeiro obstáculo para a criação de um modelo de inteligência artificial. Só com um volume significativo de dados é que se torna possível a análise da existência de exemplos suficientes para o treinamento e criação de uma solução de inteligência artificial.

O desenvolvimento e registro de modelos na Plataforma Sinapses sempre envolve a criação de uma massa de dados de exemplos. E, em muitos casos, da anotação e classificação dessa massa. Pelas vias usuais, isso demanda um grande esforço por parte da equipe de desenvolvimento, englobando a seleção e compilação de dados, levantamento de dados estruturados, tratamento de dados não estruturados, saneamento e normalização, além de reconhecimento de caracteres de dados textuais em imagens e PDFs.

Além da Plataforma Sinapses, é disponibilizado como parte do ecossistema de inteligência artificial o sistema Codex, que engloba um módulo extrator e conversor, além de ferramentas de reconhecimento de caracteres, que asseguraram que os dados constem de um repositório de dados processuais, englobando metadados, movimentações processuais e os documentos devidamente convertidos em formato de texto simples, aptos a serem prontamente consumidos por ferramentas de ciências de dados e por modelos de inteligência artificial.

Com a utilização do Codex, os dados utilizados para treinamento no modelo serão disponibilizados junto aos recursos do modelo.