Mapa do Site    |    Pesquisa
| Investigação Projectos Internacionais

Projecto Lectio

Projecto de Colaboração entre o Centro de Estudos Clássicos (Univ. Lisboa) e o

Istituto di Linguística Computazionale (CNR), desde 2005.

 

DESCRIÇÃO DA APLICAÇÃO

1. Página inicial de LECTIO

Projecto Lectio_Figura 1

Figura 1

2. Selecção de textos e exportação de resultados

Projecto Lectio_Figura 2
Figura 2
Projecto Lectio_Figura 2b

Figura 2b

Inicialmente, é apresentado ao utilizador a possibilidade de carregar um texto para trabalhar.

As opções são:

  • Escolher um texto digitando o nome;
  • Seleccionar um texto de uma lista (ver figura 3);
  • Apagar um texto de uma lista.

Adicionalmente, poderá o utilizador exportar os resultados da identificação de formas e respectiva etiquetagem (*.mor) e de formas não reconhecidas (*.unk). Isto permite retrabalhar nas formas não reconhecidas, geralmente grafias medievais.

Em ‘Preferências’, define-se uma directoria onde a aplicação, sempre que abrir, começará por procurar os textos que se querem trabalhar.

Projecto Lectio_Figura 3Figura 3

3. Informação sobre o texto e lemas fora do contexto

Projecto Lectio_Figura 4
Figura 4

No segundo painel, o utilizador tem acesso a informação sobre o texto (ver figura 5) e aos lemas e respectiva informação contidos no texto (figura 6).

Projecto Lectio_Figura 5
Figura 5
 

Será aqui que o utilizador terá acesso à estatística.

Projecto Lectio_Figura 5b

Figura 5b

Projecto Lectio_Figura 6

Figura 6

Neste painel, o utilizador pode aceder às formas presentes no texto e respectiva codificação.

Caso não concorde, poderá alterar a análise, ou adicionar lemas. A imagem é suficientemente explícita quanto às possibilidades oferecidas ao utilizador.

Também poderá aceder à mesma informação por intermédio dos lemas das formas presentes no texto.

 

4. Acesso à lematização em contexto, desambiguação e edição do módulo de variantes

O terceiro painel apresenta três opções: lematização em contexto, desambiguação e edição do módulo de variantes.

A lematização em contexto é o cerne da aplicação. A cobertura da língua latina em período clássico dicionarizada é total.

Para o léxico medieval que não conste dos actuais dicionários de latim de época clássica, o utilizador poderá sempre acrescentar em dicionário pessoal.

 Projecto Lectio_Figura 7

Figura 7

 

Antes de iniciar a lematização em contexto, é oferecida ao utilizador a possibilidade de a efectuar com recurso a um dicionário pessoal, ao módulo de identificação de nomes próprios e do módulo de variantes ortográficas (figura 8).

Projecto Lectio_Figura 8
Figura 8

4.1. Lematização e desambiguação

Estes são os resultados da lematização. A vermelho surgem as palavras não reconhecidas, basicamente nomes próprios não identificados e grafias medievais: repare-se em Preterea erehedificationis não incluídos no módulo de grafias para exemplificar este ponto.

Projecto Lectio_Figura 9

Figura 9

Ao accionarmos uma palavra no texto, é identificada a forma na lista de formas, o lema e a codificação morfológica (ver figura 10).

 Projecto Lectio_Figura 10

Figura 10

Quando há uma ambiguidade de etiquetagem, oferece-se ao utilizador as diferentes possibilidades. No primeiro caso acima (figura 11a), o adjectivo maiorum poderá ser genitivo plural masculino, feminino ou neutro. O utilizador deverá assinalar a identificação correcta e a palavra no texto passa a negrita. Na figura 11b será doctrine que deverá ser desambiguada.

Projecto Lectio_Figura 11
Figura 11
 
Projecto Lectio_Figura 11b
Figura 11b

4.2. Módulo de grafias

Uma opção permite ao utilizador modificar, adicionar ou eliminar, ou simplesmente importar de uma lista prévia os equivalentes ortográficos. A partir desta operação, a aplicação reconhecerá as formas e atribuirá lema e classificação.

Esta função é particularmente importante em textos medievais não normalizados.

No caso seguinte, um documento do Cartulário de Lorvão do ano 950, vemos o processo.

Projecto Lectio_Figura 12
Figura 12

Projecto Lectio_Figura 12b

Figura 12b

 

Projecto Lectio_Figura 12c

Figura 12c

Projecto Lectio_Figura 12d

Figura 12d

5. Dicionários do utilizador

Uma quarta opção permite ao utilizador gerir um dicionário específico, que, como vimos na figura 7, pode ser usado pela aplicação para proceder à lematização e etiquetagem.

Projecto Lectio_Figura 13
Figura 13
Projecto Lectio_Figura 14
Figura 14