-
Notifications
You must be signed in to change notification settings - Fork 1
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
análise e geração de diminutivos #78
Comments
@arademaker, seria esta uma boa issue para @analununes? |
Relaciona-se com #77. Comando para executar o script GrammarMatrixTools.py:
|
No arquivo feliz-examples.txt estão sentenças com todas as formas do MorphoBr cujo lema é feliz. O código gerado pelo script permite analisar apenas 14 dos 18 exemplos. As seguintes sentenças não são analisadas:
Os resultados estão no arquivo Para conseguir esses resultados, basta incluir estas entradas no arquivo de formas irregulares
Para comparação, apresento de novo as entradas geradas pelo script:
|
Os resultados acima refletem versão do script com correção do nome do tipo |
Amostra de teste do MorphoBr com todos os casos de formação de feminino e plural e de diminutivos, aumentativos e superlativos que tentei tratar por meio do script GrammarMatrixTools.py: https://github.com/LR-POR/PorGram/blob/main/tools/sample.txt |
Referências sobre a formação de diminutivosMorphoBrALENCAR, Leonel Figueiredo de; CUCONATO, Bruno; RADEMAKER, Alexandre. MorphoBr: an open source large-coverage full-form lexicon for morphological analysis of Portuguese. Texto Livre: Linguagem e Tecnologia, Belo Horizonte, v.11, n. 3, p.1-25, set./dez. 2018. Implementação: https://github.com/LR-POR/MorphoBr/tree/master/tools/fst Principal base teórica da implementação de Alencar, Cuconato e Radeamker (2018)VILLALVA, A.; SILVESTRE, J. P. Introdução ao estudo do léxico: descrição e análise do português. Petrópolis: Vozes, 2014. RIO-TORTO, G. Formação de avaliativos. In: RIO-TORTO, G. et al. (Org.). Gramática derivacional do português. Coimbra: Imprensa da Universidade de Coimbra, 2016. p. 357-389. Explicações para o público geralEstas páginas apresentam uma boa quantidade dos fatos a serem implementados, mas não propõem uma modelagem formal (matemática): https://www.normaculta.com.br/plural-dos-diminutivos/ https://g1.globo.com/educacao/blog/dicas-de-portugues/post/temas-polemicos-3.html AprofundamentoTrabalhos mais técnicos, de leitura mais difícil por conta da terminologia linguística, mas que apresentam um bom conjunto de fatos: http://www.ai.mit.edu/projects/dm/bp/lee-diminutives.pdf Essa última referência é uma tese extremamente abrangente que leva em conta também aspectos históricos. |
NUNES, A. L.; RADEMAKER, A.; ALENCAR, L. F. de: Utilizando um dicionário morfológico para expandir a cobertura lexical de uma gramática do português no formalismo HPSG. In: SIMPÓSIO BRASILEIRO DE TECNOLOGIA DA INFORMAÇÃO Explicando: MORFOTÁTICA: rápido + íssimo MORFOFONOLOGIA (ALTERNÂNCIAS FONOLÓGICAS/ORTOGRÁFICAS): rápido + íssimo => rapidíssimo BEESLEY, K. R.; KARTTUNEN, L. Finite state morphology. Stanford: CSLI, 2003. No LKB, é possível modelar uma parte das alternâncias, substituindo um sufixo x por um sufixo y, como neste exemplo fictício:
No entanto, não é possível formalizar a retirada do acento agudo do a da base rápido, a não ser que se formulasse uma regra desta forma:
O problema é que, praticamente para cada derivado, se teria um novo padrão
|
Vamos tratar esses casos de alternância fonológica/ortográfica como irregularidades na gramática? |
A partir de feliz.txt, amostra do MorphoBr com todas entradas com o lema adjetival feliz, o script em Python GrammarMatrixTools.py gera dois tipos de dados. O primeiro tipo são entradas lexicais no formato
tdl
:O segundo tipo são entradas de formas irregulares, a serem incorporadas ao arquivo
my-irregs.tab
:O objetivo desta issue é corrigir os erros do script:
felizezinha FEM-SUFFIX felizinho
The text was updated successfully, but these errors were encountered: