silegismg-interpretador-articulacao
v2.2.0
Published
Interpretador de Articulação
Downloads
386
Readme
Interpretador de Articulação
O interpretador de Articulação é uma biblioteca de parser de texto articulado extraído do editor de articulação, ambas elaboradas pela Assembleia Legislativa de Minas Gerais, como parte do Sistema de Informação Legislativa de Minas Gerais (Silegis-MG).
Ele permite a interpretação de texto articulado (texto puro), transformando em um objeto estruturado contendo dispositivos, tais como artigos, parágrafos, incisos, alíneas e itens, bem como as divisões em preâmbulo, títulos, capítulos, seções e subseções. O resultado da interpretação é uma árvore de objetos estruturado, contendo a articulação completa.
Como usar em seu código
npm install --save-prod silegismg-interpretador-articulacao
API do interpretador
Para interpretar um texto puro, transformando em um objeto estruturado, utilize a função interpretar (veja código-fonte), com a seguinte sintaxe:
// nodejs
const interpretador = require('silegismg-interpretador-articulacao');
let resultado = interpretador.interpretarArticulacao(texto);
// typescript
import { interpretarArticulacao } from 'silegismg-interpretador-articulacao';
let resultado = interpretarArticulacao(texto);
onde texto
é uma string
.
O resultado é um objeto contendo a seguinte interface:
/**
* Resultado da interpretação de articulação.
*/
interface IArticulacaoInterpretada {
/**
* Texto que antecede primeiro dispositivo interpretado.
* Se a interpretação compreendeu todo o texto,
* este atributo deve vir vazio.
*/
textoAnterior: string;
/**
* Articulação interpretada.
*/
articulacao: QualquerDispositivo[];
}
type QualquerDispositivo = Artigo | Paragrafo | Inciso | Alinea | Item | Titulo | Capitulo | Secao | Subsecao
abstract class Dispositivo {
public tipo: string;
public numero?: string; // Pois pode ser "123-A"
public descricao: string;
}
class Artigo extends Dispositivo {
incisos: Inciso[];
paragrafos: Paragrafo[]
}
class Inciso extends Dispositivo {
alineas: Alinea[]
}
class Alinea extends Dispositivo {
itens: Item[]
}
class Paragrafo extends Dispositivo {
incisos: Inciso[]
}
abstract class Divisao extends Dispositivo {
subitens: Dispositivo
}
class Titulo extends Divisao { }
class Capitulo extends Divisao { }
class Secao extends Divisao { }
class Subsecao extends Divisao { }
Opções de interpretação
O método interpretarArticulacao(texto: string, opcoes: IOpcoesInterpretacao)
permite estender
a capacidade do parser, seja por meio da introdução de parsers extras de linha ou de escapes
extra de texto.
interface IOpcoesInterpretacao {
parsersExtras?: ParserLinha[];
escapesExtras?: EscapeInterpretacao[];
}
Nesta biblioteca existe apenas a implementação do escape de tags de HTML, por meio da classe
EscapeTags
.
API do validador
Após a interpretação, é possível validar o conteúdo estruturado por meio do método validarArticulacao
.
import { interpretarArticulacao } from 'silegismg-interpretador-articulacao';
const resultado = interpretarArticulacao(texto);
const validacao = validarArticulacao(resultado.articulacao);
if (validacao.length > 0) {
throw new Error('Há erros do conteúdo interpretado.');
}
Os seguintes critérios são avaliados durante a validação:
- formatação do dispositivo, verificando se o padrão adequado é adotado naquele dispositivo;
- sequência numérica;
- conteúdo e pontuação.