XXVII Mostra Unisinos de Iniciação Científica e Tecnológica

XXVII MOSTRA UNISINOS DE INICIAÇÃO CIENTÍFICA E TECNOLÓGICA De 19/10/2020 a 24/10/2020 Unisinos São Leopoldo e Porto Alegre 340 situações tratadas, tais como perguntas e respostas, classificação de textos, extração de informações, entre outras. Com base destes do- cumentos anotados, é possível treinar e testar algoritmos para a exe- cução automática destas atividades. Sendo assim, observa-se esfor- ços na construção de corpus compartilhados destinados a fomentar as iniciativas neste campo e benchmarking de eventos para promo- ver comparação entre as técnicas. Para contribuir como o desenvol- vimento e teste de aplicações de Inteligência artificial e de Processa- mento de Linguagem Natural que utilizem a língua portuguesa, foi desenvolvido um corpus anotado de perguntas e respostas em portu- guês. O corpus é baseado em corpus multilíngüe existente do even- to QALD de 2017 e compreende 258 sentenças. Um segundo corpus foi construído para permitir a comparação direta com o conteúdo do DBPEDIA PT. Os principais tópicos a serem destacados são a meto- dologia adotada, que resulta em um corpus relacionado ao uso usual da língua portuguesa no Brasil, e o trabalho de adaptação das respos- tas à base de conhecimento da DBPedia PT, proporcionando possi- bilidades adicionais de avaliação de sistemas. O corpus está disponí- vel no Github (https://github.com/ag-sc/QALD/tree/master/7/data ). Este trabalho foi aceito no evento PROPOR 2020, com o título “A Portuguese Dataset for Evaluation of Semantic Question Answering” (https://doi.org/10.1007/978-3-030-41505-1_21) .

RkJQdWJsaXNoZXIy MjEzNzYz