Está em curso um ciclo tecnológico que vai mudar radicalmente a vida das pessoas. Esse momento de transição movimenta os mercados, inclusive o jurídico, dentro e fora do Brasil e algo já ficou bem claro: é preciso pensar na transformação digital da advocacia corporativa.

Esse post é o primeiro de uma série de três, que tem como objetivo compartilhar aprendizados sobre a transformação digital e mercado jurídico. Neste aqui, descreveremos o agora; no segundo, falaremos dos prognósticos para os próximos dez anos e o terceiro post será sobre pessoas, a chave para lidar com isso tudo.
Nessa discrição do momento atual, vamos comentar os ambientes digitais que estão disponível para o setor jurídico corporativo, suas: (1) tecnologias básicas – onde se rodam as operações – plataformas integradas, conectadas e (2) tecnologias emergentes – aquelas ainda não disseminadas no mercado – inteligência artificial e outras.
Esse tema é um oceano, mas vamos restringir nossa abordagem: (1) quanto aos aspectos que consideramos essenciais e (2) quanto às oportunidades que um gestor jurídico deve avaliar ao iniciar seu caminho para o digital.
Esperamos não ter errado feio, mas decidimos partir de presunção de que a maior parte dos advogados não tem uma ideia muito precisa sobre como funcionam as tecnologias e não sabe, ao certo, o que está disponível no mercado brasileiro, então, fomos um pouco descritivos, mesmo correndo o risco de termos sido um pouco prolixos.
1. Dados
No Brasil, em grande parte dos escritórios de advocacia e das empresas, o acervo jurídico gerado no dia a dia das suas respectivas operações está disperso em pastas não organizadas de cada advogado, nos milhares de e-mails, na cabeça de alguém “insubstituível”.
Todo mundo sabe: (1) os dados são fundamentais para o data driven e ter métricas é a melhor forma de aferir geração de valor; (2) dados sobre fluxos e ativos de processos operacionais são premissa da automação e (3) é estratégico gerar ativos de informação, fazer gestão de conhecimento e garantir a governança.
Contudo, a já antiga frase do matemático britânico Clive Humby (2006) – “dados são o novo petróleo” – ganha novos contornos e fica mais vívida por conta da GenAI, uma vez que estratégias de dados impulsionadas por AI podem realizar potenciais até agora inexplorados. Vale ler esse artigo da MIT Technology Review.
Trataremos de prognósticos no próximo post, mas aposta é que os dados de nicho vão dar origem à criação de vários novos produtos e serviços jurídicos. Além disso, mesmo para operações que podem permanecer analógicas, como a advocacia de super especialistas, a GenAI tende a ser uma assistente excepcional e apenas com dados jurídicos estruturados é possível alcançar respostas diretas sobre contextos específicos de cada empresa ou cliente por meio da GenAI. Falaremos mais da relação entre dados e tecnologias emergentes no item 4.
Vale repensar o legal operations para assegurar que ele construa, amplie e mantenha atualizados os acervos de conhecimento jurídico do escritório ou do departamento jurídico. Tratar dados é o primeiro passo.
2. Conectividade e Integração
Na medida que a economia da informação (chamada nova economia) se estabelece de forma mais abrangente no mercado brasileiro, ela vai impondo a sua cultura e obrigando a advocacia corporativa a se conectar com as operações das empresas e seus ambientes de negócios.
A nova economia não é tão nova assim, por isso, o artigo um pouco velho (2002) do Max F. Cohen para a Scielo é nossa a melhor referência para explicar que a mudança fundamental trazida pela economia da informação não foi, especificamente, o resultado de alguma tecnologia, mas sim o resultado de um novo comportamento dos agentes econômicos, que enxergaram na conectividade entre as pessoas novos caminhos, alteraram os seus processos operacionais e repensaram os fundamentos das estratégias empresariais.
Uma vez que se entende que as estratégias empresariais na nova economia estão pautadas na conectividade, fica claro a implantação de tecnologias não conectadas pode até trazer uma melhoria incremental de uma operação analógica, mas não alcança a transformação digital.
Insistimos nesse ponto, porque os softwares mais usados pelo setor jurídico brasileiro são ERPs (Enterprise Resource Planning) desenvolvidos para contencioso, alguns com módulos para outras operações (contratos, consultivo etc), que funcionam quase sempre isolados e sem automação. Entretanto, apenas com conectividade e integração se alcançam:
- eficiência de custo. A automação pressupõe um ambiente que conecte todos envolvidos, onde se possa impulsionar os fluxos por RPA, atribuir e controlar tarefas do respectivo responsável e automatizar documentos;
- riqueza de dados. Isto se constrói por meio de captação e estruturação das informações:
- a partir da rotina operacional de vários usuários conectados – tudo que hoje está nos e-mails e nos diretórios descentralizados devem ir para uma plataforma e
- a partir de outras bases digitais integradas – campos preenchidos por pessoas repetidamente, em várias bases de dados da vertical, devem ser preenchidos automaticamente por integração entre as bases de dados via (API) e
- abordagens transversais e de ecossitema. Falaremos melhor no terceiro post, mas isso também precisa de conectividade.
3. Tecnologia Básica – plataformas integradas e conectadas
Se a chave é conectividade, é imprescindível ter visão de floresta para pensar em ambientes digitais aptos a conectar seu legal operations: (1) na horizontal – com outras plataformas da empresa, do escritório, do ecossistema e (2) na vertical – considerando toda a cadeia de serviços de uma operação, desde o departamento jurídico até os escritórios e terceiros envolvidos.
Um exemplo disso é o ambiente digital que propomos para o contencioso de empresas, na plataforma no code que usamos:

Claro, se uma operação não nasceu numa plataforma, a digitalização é um processo (chamado transformação digital) e isto não acontece de uma dia para o outro. Entretanto, principalmente os escritórios de advocacia, não devem perder de vista que parte das tarefas que compõem pacotes de serviços jurídicos corporativos vendidos hoje já estão sendo prestados por provedores alternativos de serviços jurídicos – ALSP, com operações 100% digitais. Por exemplo, plataformas de acordo de processos judiciais.
É CADA VEZ MAIS SIMPLES, COM PLATAFORMAS NO CODE
Há algum tempo atrás, desenvolver tecnologia internamente era o único caminho para a automação em departamentos jurídicos e escritórios no Brasil. Isso mudou radicalmente com as soluções low-code e no-code, plataformas com interfaces visuais, elementos pré-construídos, blocos tipo “arrastar e soltar”. Essa tecnologia pré-moldada tem por objetivo simplificar o desenvolvimento apor pessoas com habilidades básicas de codificação (low-code) ou que sequer sabem programar(no-code).
Note-se que até mesmo os softwares de mercado tem ferramentas low-code/no-code para que seja possível baratear o preço de configuração das versões personalizadas que constroem internamente. Do mesmo modo, é cada vez mais comum que as software houses construam as soluções encomendadas por empresas ou escritórios a partir de plataformas low-code/no-code próprias ou de terceiros.
O desenvolvimento no-code criou um acesso à tecnologia sem precedentes, ao permitir que qualquer pessoa se torne um desenvolvedor, os chamados citizen developers têm impactado a vida privada, pequenos negócios e empresas de todo os portes. Até mesmo organizações enormes, que adotaram tecnologia de ponta, usam plataformas no-code robustas como estratégia para capilarizar a automação dos fluxos de trabalho mais periféricos. Sobre isso, vale escutar o pessoal da HCL Volt MX no webinar da MIT Sloan Management Review, no qual eles contam como a Lufthansa tornou seus empregados citizen developers usando a plataforma no-code da HCL Volt MX.
Ao pensar em plataformas integradas, não se pode perder de vista que esse acesso entre plataformas abre uma porta, por isso, é imprescindível adotar softwares que siguam padrões de segurança internacionais e tenham uma API adequada. API – Application Programming Interface (Interface de Programação de Aplicação) – é uma série de padrões e protocolos que viabilizam um sistema se integrar a outro e inclusive bloquear acesso e permissões a dados.
No Brasil já existem plataformas no-code que viabilizam automação do legal operations, inclusive algumas próprias para o setor jurídico. Usamos uma delas, o HighQ, da Thomson Reuters e nele criamos ambientes digitais de vários tipos, de forma totalmente personalizada, conectando usuários de toda a cadeia do serviço de cada operação.

Ainda sobre plataformas no code, vale a pena notar que os pacotes do Google e da Microsoft já incluem plataformas para construção de aplicativos mobile (Appsheet, ótima para relatórios) e ferramentas para criar interfaces para captação de dados (Forms do Google) e que a automação de alguns workflows podem ser desenvolvidas em plataformas de gestão de projetos muito acessíveis como Pipefy, Trello e outras.
HÁ MUITAS OPORTUNIDADES DE INOVAÇÃO TECNOLÓGICA NO MERCADO JURÍDICO
Estimam-se mais de mil lawtechs/legaltechs no Brasil hoje, entre fornecedores de tecnologias básicas e emergentes para o setor jurídico e ALSP. Contando apenas as soluções associadas à AB2L, são aproximadamente 600. Não conhecemos todas e não temos a pretensão de recomendar ou ranquear a tecnologia disponível no mercado, além do que, a melhor tecnologia depende muito do contexto. Aqui faremos um recorte muito pequeno, com algumas referências sobre plataformas que incorporam parte do legal operations para dar exemplos. Do mesmo modo, no próximo tópico, daremos exemplos de tecnologias emergentes.
Provavelmente, a operação jurídica em plataforma mais comum do mercado dentro e fora do Brasil é o CLM (contract lifecycle management). Trata-se da gestão do ciclo de vida dos contratos em ambiente digital, que envolve automação do fluxo – solicitação, produção e delivery – além disso, controles de execução e extinção dos contratos. No Brasil, temos excelentes plataformas como Lexio, Linte, Netlex, entre outras.
Outros exemplos – operações de contencioso (gestão de processos judiciais), tem a Forelegal que automatiza a controladoria jurídica ou a Brainlaw que conecta toda a vertical da operação de contencioso; gestão rotinas societárias tem o Basement, Societário Digital e GSI, entre outros.
Os pontos positivos das plataformas de mercado é que muitas delas têm frameworks aprimorados (testados por centenas e até milhares de usuários) e algumas já acoplam as tecnologias emergentes. O o ponto negativo é que a conectividade e automação não são tão abrangentes e/ou específicas e, se for, a customização, normalmente, não é nada barata. Mas é isso mesmo, plataforma no code ou plataforma de mercado, não dá para digitalizar tudo de uma vez só, o importante é que a tecnologia adquirida possa se integrar e que tenha perspectiva de se atualizar, uma vez que as mudanças serão cada vez mais rápidas.
4. Tecnologias emergentes – inteligência artificial
EXPLICAÇÕES INTRODUTÓRIAS SOBRE MODELOS ANALÍTICOS BASEADOS EM APRENDIZADO DE MÁQUINA
Os aplicativos que usamos são o resultado da combinação de tecnologias básicas (como o RPA) e tecnologias emergentes (como AI baseada em machine learning). Entretanto, é importante ter uma ideia mais precisa sobre como essas tecnologias , pois ela estão impactando nossos negócios, nossas vidas.
A primeira distinção a se fazer é a seguinte: a inteligência artificial gerada pelos modelos analíticos é diferente da inteligência artificial focada ou fraca – o RPA (Robotic Process Automation), os chamados bots (redução de robot, robô em inglês).
A inteligência artificial se baseia em algoritmos, o conjunto das regras e procedimentos lógicos que levam à solução de um problema. São “receitas”, que indicam o passo a passo, o processo. Na AI focada ou fraca (RPA) o algoritmo indica a regra que máquina vai seguir diante de cada variável especificada. Na AI complexa (machine learning), o algoritmo tem outro objetivo – analisar dados para construir regras.
Na inteligência artificial complexa, o algoritmo indica como a máquina deve interpretar dados, por meio de um modelo analítico para que, ao interagir com várias bases de dados, a máquina identifique padrões e construa parâmetros ou regras (funções). Quanto mais interagir com bases de dados, mais a máquina é “treinada”, ou seja, novos parâmetros ou regras são criados e o que já existe é aperfeiçoado.
Isso é aprendizado de máquina (machine learning), cuja versão mais complexa, baseada em redes neurais, com modelos analíticos em camadas, é chamado aprendizado profundo (deep learning).
O aprendizado de máquina produz inteligência artificial de vários tipos, sendo que 3 delas são e ainda serão muito usadas no segmento jurídico:
- AI generativa (GenAI), que tem como objetivo criar textos imagens e sons, a partir da transformação dos dados de criações preexistentes;
- AI preditiva (PredAI), que tem como objetivo prever o futuro, identificando padrões históricos de dados e
- ferramentas de mineração de dados (data mining), que extraem dados específicos de uma base de dados enorme, interpretando textos a partir do processamento de linguagem natural.
AI GENERATIVA (GenAI). PROCESSAMENTO DE LINGUAGEM NATURAL (PLN). GRANDES MODELOS DE LINGUAGEM (LLM)
A AI que promete maior impacto no setor jurídico é a GenAI que gera textos, com processamento de linguagem natural – PLN, especialmente sua versão agigantada, o LLM (Large Language Model) – como o Chat GPT, o Gemini, o Claude etc – chats em que a GenAI simula uma conversa, gerando respostas com uma assertividade e uma interatividade nunca vistas antes.
Para se ter uma ideia mais concreta do que é um modelo de linguagem como o Chat GPT (LLM), ele é treinado usando toda a base “raspada” da internet e várias bases de dados de parceiros, operando um gigante circuito de parâmetros que prediz que palavra deve vir depois da outra, algo entre 20 e 30 trilhões de parâmetros, segundo estimativa do cientista de dados Stuart Russell.

Considerando todo esse volume de dados e a essa quantidade de parâmetros não é difícil entender que não tem como controlar, em tempo real, a qualidade dos parâmetros que a máquina cria. Entretanto, ela é resultado de dois elementos sobre o quais é possível controlar a qualidade – as bases de dados e o modelo analítico (os algoritmos).
O Chat GPT, Gemini, Claude e muitas LLM já aprenderam a conversar e parece que os algoritmos estão são no caminho certo, entretanto, ainda falta robustez, a capacidade da AI de atuar de maneira consistente e precisa mesmo diante de dados incompletos ou contraditórios. Robustez é um dos requisitos de desenvolvimento previstos na regulação da AI aprovada pelo Parlamento Europeu e segundo especialistas, como a futurista Amy Webb, há um trabalho a ser feito, que é tratar as bases de dados, porque se você põe dado ruim em algoritmo, vai receber dado ruim do outro lado.
Pensar em um LLM plug and play que possa conversar sobre absolutamente tudo acessando as bases de conhecimento dos nossos interesses ainda é tema de ficção científica (como no filme Ela), provavelmente, o que teremos agora são LLMs de nicho. O já referido Stuart Russell comenta que a robustez da GenAI deve advir da utilização dos LLM como interfaces em plataformas que tenham dados valiosos. De fato, as empresas de tecnologia estão comprando dados a rodo. Por outro lado, a Open AI e outras, por meio de parcerias com empresas, têm disponibilizado as suas plataformas para que as empresas desenvolvam suas aplicações “proprietárias” de GenAI.
Como era previsível, estão surgindo os LLM especializados para o segmento jurídico treinados em grandes acervos dos escritórios e/ou empresas, dos Tribunais, dos repositórios de legislação. Por exemplo, o Dentons, o maior escritório de advocacia global do mundo, está pronto para lançar uma “versão proprietária” do ChatGPT, chamada “fleetAI” que será um assistente dos advogados do escritório para pesquisas, geração de conteúdo, obtenção argumentos e leitura de documentos jurídicos. A GenAI é a nova febre dos grandes escritórios globais em 2024. Segundo pesquisa da LexisNexis, realizada em janeiro deste ano de 2024, 43% dos 200 maiores escritórios de advocacia globais têm orçamento para investir em GenAI em 2024.
No Brasil, já há alguns anos, também são usadas ferramentas de GenAI do mercado global para ler documentos e gerar conteúdos jurídicos, entretanto elas são muito restritas, por serem caras. Por exemplo, o Watson da IBM está no mercado há uma década e é usada por centenas de empresas no Brasil, inclusive em departamentos jurídicos de bancos. Mais recentemente, a Kira, com a qual o HighQ que tem integração nativa, foi implementada por um escritório daqui, treinada com seus dados.
A leitura de documentos em formatos digitais modernos é mais ou menos simples, entretanto, documentos em formatos mais antigos são lidos enquanto imagem e precisam de reconhecimento ótico de caracteres (OCR) para interpretar as imagens que contém texto e converter imagem em texto. A leitura de documentos baseadas machine learning no Brasil é feita por algumas legaltechs, por exemplo a Lexter, usada para automação de análise de data room em diligências de M&A e outras aplicações, que acabou de captar R$ 16 milhões.
A GenAI associada à tecnologia de leitura de documentos (e outras bases de texto) vai permitir: (1) a possibilidade de fazer uma pergunta aberta sobre o documento, por meio do famoso prompt (comando, instrução dada ao modelo a realizar uma tarefa específica) e (2) a possibilidade de obter a resposta em vários formatos de texto – resumo, e-mails, consulta, notificações, defesa etc.
MODELOS PREDITIVOS (PredAI)
Agora vamos falar um pouco dos modelos preditivos (PredAI). O uso mais comum no Brasil é a jurimetria, que consiste na mineração ou garimpagem de decisões judiciais nos Tribunais (data mining) e um modelo analítico que consegue prever duração, estimativas de risco e probabilidade sobre o desfecho dos processos.
Pensar o Direito a partir das decisões daqueles que vão julgar os processos da empresa em um caso concreto é algo bastante assertivo e valioso. No Brasil há soluções desse tipo das próprias empresas de softwares de gestão de projetos ou de legaltechs focadas nesse tema, como a Turivius. Começam a surgir associações entre essa PredAI e a GenAI e ninguém vai estranhar quando aparecerem chats que respondam a questões jurídicas com base na jurisprudência.
MINERAÇÃO OU GARIMPAGEM DE DADOS (data mining)
A mineração ou garimpagem de dados (data mining) serve para preparar, analisar e entender grandes volumes de dados (big data). Data mining está envolvida nos treinamentos de AI de vários tipos, mas também é usada para captar dados relevantes e imputar em plataformas.
Por exemplo, tem plataformas como as da Uplexis, que usam mineração de dados públicos e privados sobre pessoas e empresas, para tornar possível executar as diligências de compliance ou identificar ativos de empresas, facilitando a recuperação de créditos.

Entretanto, a aplicação mais comum de data mining no Brasil é aquela que capta dados bases dos tribunais e os imputa nas plataformas e ERPs de gestão de processos judiciais. Esse serviço é vendido por estas empresas e por algumas legaltechs, como a Oystr. Essas ferramentas tem funcionalidades como: (1) identificar processos relacionados com uma empresa a partir da distribuição, capturar da petição inicial e os dados básicos do processo; (2) obter andamentos de processos específicos. O output desse serviço ainda tende a se aperfeiçoar quanto a interpretação dos dados minerados, com melhoria da filtragem dos andamentos relevantes.
O data mining também já é usado por grandes empresas para obter informações e insights a partir de data lakes. Funciona assim: dados das diversas plataformas em nuvem da empresa (jurídicas, operacionais, financeiras, de marketing etc) e dados de outras bases são convertidos para uma instância em nuvem (data lake). Então eles são lidos e interpretados por data mining. Por exemplo, uma empresa aérea que opera no Brasil sabe dizer o custo de reclamações de consumidores a partir do perfil do vôo, permitindo uma maior precisão na análise de preço e margem. A prévia estruturação de dados de cada uma dessas plataformas facilita o trabalho de seleção e limpeza dos dados, uma das etapas mais demoradas e críticas de um projeto como este, pois apenas isso garante um resultado confiável como se comenta no blog da FIA.
UM CONVITE A EXPERIMENTAR A GEN AI QUE ESTÁ NO MERCADO
Isso muda todo dia, mas até onde sabemos, os modelos de linguagem (LLMs) de mercado não entregam serviços jurídicos prontos ou semi-prontos aos escritórios de advocacia e departamentos jurídicos, no entretanto, experimentar ferramentas de GenAI pode ser uma boa estratégia para treinar pessoas quanto a uma tecnologia que vai ser implementada, com impacto em todos os segmentos. Então, vamos a mais alguns exemplos: a extensão Sider.ai para navegação no Chrome, que acopla várias inteligências artificiais (inclusive o Claude, ainda não disponível no Brasil), o Gemini Advanced no Google One, o Copilot no Microsoft 365 e, claro, o chat GPT-4. Há ainda as ferramentas específicas para o segmento jurídico como TripleAI, Spectter IA, LawX.
A adoção dessas ferramentas por um escritório ou empresa tem um aspecto a ser considerado: a maior parte dos pacotes envolve aceitação do usuário de que seus dados sejam usados para treinar o modelos de linguagem. Agora mesmo, vários dados jurídicos estão sendo disponibilizados por escritórios e departamentos jurídicos de todo o mundo para tratamento da AIGen, elas vão evoluir e isso é inevitável.
Esperamos que tenham gostado da leitura. Aguardem os próximos posts.