Página 1 dos resultados de 155 itens digitais encontrados em 0.009 segundos

Criação de um ambiente para o processamento de córpus de Português Histórico; Creation of an environment for processing of Historical Porrtuguese Corpora

Candido Junior, Arnaldo
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Dissertação de Mestrado Formato: application/pdf
Publicado em 02/04/2008 Português
Relevância na Pesquisa
98.55654%
A utilização de córpus tem crescido progressivamente em áreas como Lingüística e Processamento de Língua Natural. Como resultado, temos a compilação de novos e grandes córpus e a criação de sistemas processadores de córpus e de padrões para codificação e intercâmbio de textos eletrônicos. Entretanto, a metodologia para compilação de córpus históricos difere das metodologias usadas em córpus contemporâneos. Outro problema é o fato de a maior parte dos processadores de córpus proverem poucos recursos para o tratamento de córpus históricos, apesar de tais córpus serem numerosos. Da mesma forma, os sistemas para criação de dicionários não atendem satisfatoriamente necessidades de dicionários históricos. A motivação desta pesquisa é o projeto do Dicionário Histórico do Português do Brasil (DHPB) que tem como base a construção de um córpus de Português do Brasil dos séculos XVI a XVIII (incluindo alguns textos do começo do século XIX). Neste trabalho são apresentados os desafios encontrados para o processamento do córpus do projeto do projeto DHPB e os requisitos para redação de verbetes do dicionário histórico. Um ambiente computacional para processamento de córpus, criação de glossários e redação de verbetes foi desenvolvido para o projeto DHPB sendo possível adaptá-lo para ser aplicado a outros projetos de criação de dicionários históricos; Corpora has been increasingly used within the areas of Linguistics and Natural Language Processing. As a result...

e-Termos: Um ambiente colaborativo web de gestão terminológica; e-Termos: a web collaborative environment of terminology management

Oliveira, Leandro Henrique Mendonça de
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Tese de Doutorado Formato: application/pdf
Publicado em 22/09/2009 Português
Relevância na Pesquisa
118.64753%
Em uma de suas definções, a Terminologia representa o conjunto de princípios e métodos adotados no processo de gestão e criação de produtos terminológicos, tais como glossários e dicionários de termos. A sistematização desses métodos envolve a aplicação de ferramentas computacionais específicas e compatíveis com as tarefas terminológicas, contribuindo para o desenvolvimento desses produtos e a difusão de conhecimento especializado. Entretanto, principalmente no Brasil, a combinação da Terminologia e Informática é incipiente, e dentre as atividades do trabalho terminológico é comum a utilização de várias ferramentas não especializados para esse fim. Isso torna o trabalho dos terminólogos muito moroso, pois esse trabalho geralmente é feito por uma equipe multidisciplinar que deve ter acesso, a todo o momento, à versão mais atual das várias etapas da geração de um produto terminológico. Além disso, deixa o gerenciamento dos dados mais complicado, pois não existe um padrão de entrada e saída definido para os programas. Apoiado nos pressupostos da Teoria Comunicativa da Terminologia (TCT), este trabalho apresenta a proposta de desenvolvimento e avaliação do e- Termos, um Ambiente ColaborativoWeb composto por seis módulos de trabalho bem definidos...

Auxílio à leitura de textos em português facilitado: questões de acessibilidade; Reading assistance for texts in facilitated portuguese: accessibility issues

Watanabe, Willian Massami
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Dissertação de Mestrado Formato: application/pdf
Publicado em 05/08/2010 Português
Relevância na Pesquisa
118.75698%
A grande capacidade de disponibilização de informações que a Web possibilita se traduz em múltiplas possibilidades e oportunidades para seus usuários. Essas pessoas são capazes de acessar conteúdos provenientes de todas as partes do planeta, independentemente de onde elas estejam. Mas essas possibilidades não são estendidas a todos, sendo necessário mais que o acesso a um computador e a Internet para que sejam realizadas. Indivíduos que apresentem necessidades especiais (deficiência visual, cognitiva, dificuldade de locomoção, entre outras) são privados do acesso a sites e aplicações web que façam mal emprego de tecnologias web ou possuam o conteúdo sem os devidos cuidados para com a acessibilidade. Um dos grupos que é privado do acesso a esse ambiente é o de pessoas com dificuldade de leitura (analfabetos funcionais). A ampla utilização de recursos textuais nas aplicações pode tornar difícil ou mesmo impedir as interações desses indivíduos com os sistemas computacionais. Nesse contexto, este trabalho tem por finalidade o desenvolvimento de tecnologias assistivas que atuem como facilitadoras de leitura e compreensão de sites e aplicações web a esses indivíduos (analfabetos funcionais). Essas tecnologias assistivas utilizam recursos de processamento de língua natural visando maximizar a compreensão do conteúdo pelos usuários. Dentre as técnicas utilizadas são destacadas: simplificação sintática...

Elaboração textual via definição de entidades mencionadas e de perguntas relacionadas aos verbos em textos simplificados do português; Text elaboration through named entities definition and questions related to verbs in simplified portuguese texts

Amancio, Marcelo Adriano
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Dissertação de Mestrado Formato: application/pdf
Publicado em 15/06/2011 Português
Relevância na Pesquisa
108.64133%
Esta pesquisa aborda o tema da Elaboração Textual para um público alvo que tem letramento nos níveis básicos e rudimentar, de acordo com a classificação do Indicador Nacional de Alfabetismo Funcional (INAF, 2009). A Elaboração Textual é definida como um conjunto de técnicas que acrescentam material redundante em textos, sendo tradicionalmente usadas a adição de definições, sinônimos, antônimos, ou qualquer informação externa com o objetivo de auxiliar na compreensão do texto. O objetivo deste projeto de mestrado foi a proposta de dois métodos originais de elaboração textual: (1) via definição das entidades mencionadas que aparecem em um texto e (2) via definições de perguntas elaboradas direcionadas aos verbos das orações de um texto. Para a primeira tarefa, usou-se um sistema de reconhecimento de entidades mencionadas da literatura, o Rembrandt, e definições curtas da enciclopédia Wikipédia, sendo este método incorporado no sistema Web FACILITA EDUCATIVO, uma das ferramentas desenvolvidas no projeto PorSimples. O método foi avaliado de forma preliminar com um pequeno grupo de leitores com baixo nível de letramento e a avaliação foi positiva, indicando que este auxílio facilitou a leitura dos usuários da avaliação. O método de geração de perguntas elaboradas aos verbos de uma oração é uma tarefa nova que foi definida...

Anotação automática semissupervisionada de papéis semânticos para o português do Brasil; Automatic semi-supervised semantic role labeling for Brazilian Portuguese

Manchego, Fernando Emilio Alva
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Dissertação de Mestrado Formato: application/pdf
Publicado em 22/01/2013 Português
Relevância na Pesquisa
98.38146%
A anotac~ao de papeis sem^anticos (APS) e uma tarefa do processamento de lngua natural (PLN) que permite analisar parte do signicado das sentencas atraves da detecc~ao dos participantes dos eventos (e dos eventos em si) que est~ao sendo descritos nelas, o que e essencial para que os computadores possam usar efetivamente a informac~ao codicada no texto. A maior parte das pesquisas desenvolvidas em APS tem sido feita para textos em ingl^es, considerando as particularidades gramaticais e sem^anticas dessa lngua, o que impede que essas ferramentas e resultados sejam diretamente transportaveis para outras lnguas como o portugu^es. A maioria dos sistemas de APS atuais emprega metodos de aprendizado de maquina supervisionado e, portanto, precisa de um corpus grande de senten cas anotadas com papeis sem^anticos para aprender corretamente a tarefa. No caso do portugu^es do Brasil, um recurso lexical que prov^e este tipo de informac~ao foi recentemente disponibilizado: o PropBank.Br. Contudo, em comparac~ao com os corpora para outras lnguas como o ingl^es, o corpus fornecido por este projeto e pequeno e, portanto, n~ao permitiria que um classicador treinado supervisionadamente realizasse a tarefa de anotac~ao com alto desempenho. Para tratar esta diculdade...

Uma abordagem conexionista para anotação de papéis semânticos; A connectionist approach to semantic role labeling

Fonseca, Erick Rocha
Fonte: Biblioteca Digitais de Teses e Dissertações da USP Publicador: Biblioteca Digitais de Teses e Dissertações da USP
Tipo: Dissertação de Mestrado Formato: application/pdf
Publicado em 10/04/2013 Português
Relevância na Pesquisa
89.16206%
A anotação de papéis semânticos (APS) é uma subárea do Processamento de Línguas Naturais (PLN) que começou a ser explorada para a língua inglesa a partir de 2002. Seu objetivo é detectar estruturas de predicador e argumentos em sentenças escritas, que correspondem a descrições de eventos (normalmente feitas por verbos); seus participantes, como agente e paciente; e circunstâncias, como tempo, local, etc. Diversas aplicações de PLN, como tradução automática e recuperação de informação, têm obtido melhorias em seu desempenho ao empregar a APS como uma etapa de pré-processamento. Para a língua portuguesa, os avanços na pesquisa de APS são ainda muito incipientes. Dado que a grande maioria dos trabalhos encontrados na literatura desta área emprega aprendizado de máquina supervisionado, um fator limitante tem sido a ausência de dados rotulados em português, problema que apenas recentemente foi parcialmente resolvido com a criação do PropBank-Br. Este recurso segue o modelo de anotação usado no Prop- Bank, o principal conjunto de dados rotulados empregado na tarefa de APS para a língua inglesa. Ainda assim, o PropBank-Br contém menos de um décimo do total de instâncias de dados presentes no PropBank original. Outro ponto a ser observado é que a abordagem mais comum para a APS baseia-se na extração de uma grande quantidade de informação linguística das sentenças de entrada para ser usada por classificadores automáticos. Tal abordagem mostra-se extremamente dependente de outras ferramentas de PLN...

Processamento de língua natural e níveis de proficiência do português : um estudo de produções textuais do exame Celpe-Bras

Evers, Aline
Fonte: Universidade Federal do Rio Grande do Sul Publicador: Universidade Federal do Rio Grande do Sul
Tipo: Dissertação Formato: application/pdf
Português
Relevância na Pesquisa
99.40691%
Este trabalho trata dos temas da proficiência em português como língua adicional e da detecção de padrões lexicais e coesivos a partir de um enfoque computacional, situando o tema em meio à descrição de textos produzidos no contexto do exame de proficiência Celpe- Bras de 2006-1. Fazendo uso de pressupostos teórico-metodológicos da Linguística de Corpus, da Linguística Textual e do Processamento de Língua Natural, investigou-se a hipótese de que seria possível classificar, de modo automático, textos submetidos ao exame conforme níveis de proficiência pré-estabelecidos. Por meio do processamento de 177 textos previamente avaliados por corretores humanos em seis níveis (Iniciante, Básico, Intermediário, Intermediário Superior, Avançado e Avançado Superior), usou-se o Aprendizado de Máquina (AM) supervisionado para cotejar padrões lexicais e coesivos capazes de distinguir os níveis sob estudo. Para o cotejo dos padrões, a ferramenta Coh-Metrix-Port – que calcula parâmetros de coesão, coerência e inteligibilidade textual – foi utilizada. Cada um dos textos foi processado na ferramenta; para o AM, os resultados da ferramenta Coh-Metrix-Port foram usados como atributos, os níveis de proficiência como classes e os textos como instâncias. As etapas de processamento do corpus foram: 1) digitação do corpus; 2) processamento individual dos textos na ferramenta Coh-Metrix-Port; 3) análise usando AM – Algoritmo J48 – e os seis níveis de proficiência; 4) nova análise usando AM e duas novas classes: textos sem certificação (Iniciante e Básico) e com certificação (Intermediário...

Redes neurais e logica formal em processamento de linguagem natural

João Luis Garcia Rosa
Fonte: Biblioteca Digital da Unicamp Publicador: Biblioteca Digital da Unicamp
Tipo: Dissertação de Mestrado Formato: application/pdf
Publicado em 22/09/1993 Português
Relevância na Pesquisa
98.54486%
Esta dissertação de mestrado é sobre Processamento de Linguagem Natural (PLN). O PLN consiste de uma série de tarefas que a máquina deve executar para analisar um texto. Na literatura existem vários trabalhos em diversas abordagens. Este trabalho faz uma combinação de abordagens baseadas em lógica e de abordagens conexionistas. O trabalho proposto tem três partes. A primeira parte faz a análise sintática de frases da língua portuguesa. É baseada em lógica. A segunda parte faz a análise semântica, ou a verificação do significado das palavras numa frase. Isto é feito através de redes neurais artificiais, que "aprendem" a representação binária das palavras (suas microcaracterísticas semânticas). Esta abordagem é chamada de conexionismo. Sua grande vantagem é a habilidade de generalização, ou seja, a rede é capaz de reconhecer uma palavra, mesmo que esta não tenha sido mostrada a ela. A terceira, e última, parte deste trabalho trata da utilização de redes recorrentes para análise de frases. Este tipo de rede serve para "ligar" as palavras em uma frase, pois a rede recorrente tem memória. Ela é capaz de "lembrar" da última palavra vista numa seqüência. É útil para ligar as palavras em uma sentença...

Utilização de um sistema multiagentes para resolução de referencias em lingua natural

Leonardo Shiguemi Dinnouti
Fonte: Biblioteca Digital da Unicamp Publicador: Biblioteca Digital da Unicamp
Tipo: Dissertação de Mestrado Formato: application/pdf
Publicado em 05/04/1999 Português
Relevância na Pesquisa
89.11296%
Esta tese contribui para a Área de Inteligência Artificial trazendo uma abordagem alternativa para o processamento de Língua Natural utilizando Sistemas Multiagentes. O fenômeno lingüístico a ser analisado é a referência, e em particular a referência definida. O fenômeno é amplamente conhecido como anáfora definida e vem sendo trabalhado por diversos pesquisadores na área de lingüística computacional. Nesta tese o problema é divido e tratado de forma distribuída, através de um sistema multiagentes projetado especificamente para este caso. Um protocolo de comunicação é proposto e alguns testes são feitos com agentes em funcionamento. A implementação do sistema utiliza bibliotecas de livre distribuição, como o SWI-Prolog e o PVM (Parallel Virtual Machine), tornando o sistema passível de ser distribuído livremente. Este trabalho contribui com mais um tipo de abordagem para o Processamento de Língua Natural e abre perspectivas para novos tipos de tratamentos utilizando Sistemas Multiagentes; This thesis contributes to the field of Artificial Intelligence by providing an alternative approach to Natural Language Processing using a Multi-Agent System. The linguistic phenomenon which is analyzed is reference, in particular...

PLIM : processamento de lingua natural utilizando o paradigma multi-agentes

Ivan Santa Maria Filho
Fonte: Biblioteca Digital da Unicamp Publicador: Biblioteca Digital da Unicamp
Tipo: Dissertação de Mestrado Formato: application/pdf
Publicado em 30/06/2000 Português
Relevância na Pesquisa
88.78591%
O processamento automático da língua natural é um problema multidisciplinar que envolve aspectos computacionais e lingüísticos, dentre outros. Neste trabalho analisamos algumas das teorias lingüísticas centradas na sintaxe que já foram utilizadas com sucesso em sistemas computacionais. A análise destas teorias e dos sistemas que as implementam considera a adequação lingüística e a complexidade computacional associada. Também são analisados os paradigmas de programação utilizados na implementação destes sistemas, identificando suas limitações. Apresentamos também um sistema distribuído baseado em multi-agentes que é capaz de se utilizar dos mecanismos lingüísticos tradicionais ao mesmo tempo em que supera parte das limitações dos sistemas que os implementam; Natural language processing is a multidisciplinar problem that covers, but is not limited to, Computer Science and Linguistics. This master thesis presents a survey on some of the syntactic-centered linguistic theories that have been successfuly used in computer systems. An analysis of the linguistic adequacy and the computational complexity of each formalism is also presented. An analysis of the programming paradigms which were used to implement these systems and their limitations is also shown. Finally a distributed system based on the multi-agent paradigm is presented. This system is able to mimic many of the traditional system features while overcoming some of their limitations

Aprendizagem de língua assistida por computador : uma abordagem baseada em HPSG

Costa, Flávio Maico Vaz da; Ralha, José Carlos Loureiro; Ralha, Célia Ghedini
Fonte: Comissão Especial de Informática na Educação da Sociedade Brasileira de Computação Publicador: Comissão Especial de Informática na Educação da Sociedade Brasileira de Computação
Tipo: Artigo de Revista Científica
Português
Relevância na Pesquisa
98.8%
Este trabalho analisa fundamentos e métodos pertinentes para o planejamento e desenvolvimento de sistemas de Processamento de Linguagem Natural (PLN) com o objetivo de auxiliar a aprendizagem de línguas. O foco principal é a correção sintática baseada no formalismo HPSG conforme implementado no sistema LKB (Linguistic Knowledge Building). Foi implementado um analisador em linguagem Java que, juntamente com uma gramática da língua espanhola de médio porte, permite experimentar a técnica de correção através de regras de malformação. A partir dos resultados obtidos discute-se alguns aspectos práticos e a viabilidade do PLN aplicado à educação. _________________________________________________________________________________ ABSTRACT; This work analyses principles and methods relevant to the planning and development of Natural Language Processing (NLP) systems, whose goal is to assist in language learning. Syntax checking based on the HPSG formalism as implemented in the LKB (Linguistic Knowledge Building) system is the main focus. Java language was used to implement a parser that, together with a Spanish grammar of moderate coverage, allows us to experiment with mal-rule based checking. From the results obtained practical issues and the viability of NLP applied to education are discussed.

Processamento de linguagem natural para indexação automática semântico-ontológica

Câmara Júnior, Auto Tavares da
Fonte: Universidade de Brasília Publicador: Universidade de Brasília
Tipo: Tese
Português
Relevância na Pesquisa
98.8323%
Tese (doutorado)—Universidade de Brasília, Faculdade de Ciência da Informação, Programa de Pós-Graduação em Ciência da Informação, 2013.; A pesquisa propõe uma arquitetura de indexação automática de documentos utilizando mecanismos de processamento de linguagem natural em nível semântico. Por meio do arranjo de ferramentas e recursos existentes, agregado ao desenvolvimento de software para integração, é construído um sistema de indexação automática que utiliza conhecimento modelado em uma ontologia para análise semântica. A aplicação da arquitetura é exemplificada e posta à prova em um conjunto de laudos periciais de crimes cibernéticos produzidos pela Perícia Criminal da Polícia Federal. Os resultados de pesquisa apontam para a melhoria que o aprofundamento à análise semântica do processamento de linguagem natural oferece para a seleção automática de descritores e, por extensão, para a recuperação da informação. Dentre as contribuições inéditas desta tese incluem-se a arquitetura de sistema de informação para indexação automática proposta, a ontologia construída para a análise semântica e as implementações em linguagem de programação Python. Por fim, o trabalho insere-se em uma área de pesquisa que tem sido cada vez mais investigada...

Proposta de dicionário informatizado analógico de língua portuguesa

Vilarinho, Michelle Machado de Oliveira
Fonte: Universidade de Brasília Publicador: Universidade de Brasília
Tipo: Tese
Português
Relevância na Pesquisa
109.09695%
Tese (doutorado)—Universidade de Brasília, Instituto de Letras, Departamento de Linguística, Português e Línguas Clássicas, Programa de Pós-Graduação em Linguística, 2013.; O tema desta tese se insere na linha de pesquisa Léxico e Terminologia, desenvolvida no Centro de Estudos Lexicais e Terminológicos (Centro Lexterm), da Universidade de Brasília. O objeto de estudo é o dicionário analógico, entendido como um tipo de repertório lexicográfico de caráter onomasiológico, no qual os lexemas são organizados partindo das ideias ou dos conceitos para chegar às unidades lexicais. Os lexemas são agrupados em um mesmo verbete por possuírem identidade de relações. A motivação para a realização deste trabalho é identificar como as analogias podem ser delimitadas no dicionário analógico, uma vez que constatamos que os dicionários analógicos não possuem critérios claros para o estabelecimento das relações analógicas na composição dos verbetes. O objetivo principal desta pesquisa é a criação de uma proposta de Dicionário Informatizado Analógico de Língua Portuguesa, por meio do uso de ferramentas de Processamento das Línguas Naturais (PLN). A metodologia que seguimos para a análise do Dicionário analógico da língua portuguesa de Azevedo (2010)...

Verbos do domínio jurídico: uma proposta de organização ontológica com vistas ao PLN

Alves, Isa; Chishman, Rove; Quaresma, Paulo
Fonte: Universidade de Évora Publicador: Universidade de Évora
Tipo: Artigo de Revista Científica Formato: 267690 bytes; application/pdf
Português
Relevância na Pesquisa
88.50741%
Apresenta-se, neste artigo, uma proposta de estruturação ontológica de verbos do domínio jurídico co m vistas ao aperfeiçoamento de sistemas de Processamento Automático da Língua Natural (PLN), mais especificamente, ao sistema de busca e extração de informações da Procuradoria Geral da República de Portugal. As relações lógico-semânticas, os papéis semânticos e os frames foram as abordagens semânticas que se mostraram mais produtivas para a construção da ontologia proposta.

Desenvolvimento e Integração de Recursos para Pesquisa de Informação -- um Processo Interdisciplinar e Interinstitucional

Leal, Ana Luísa; Quaresma, Paulo
Fonte: Associação das Universidades de Língua Portuguesa Publicador: Associação das Universidades de Língua Portuguesa
Tipo: Artigo de Revista Científica Formato: 120327 bytes; application/pdf
Português
Relevância na Pesquisa
98.15331%
Este artigo apresenta o Projecto de Cooperação Interinstitucional Interdisciplinar – DIRPI, na área de linguística computacional. O projecto DIRPI, que incorpora outras investigações, é constituído pela interacção de grupos de pesquisas de instituições de países de Língua Portuguesa, são elas Universidade de Évora – Portugal e as Universidades Unisinos e PUCRS no Brasil. Além disso, neste trabalho, são apresentados os objectivos, os recursos e resultados, bem como, a importância dos projectos de cooperação entre diferentes instituições de pesquisa.

Developing reliability metrics and validation tools for datasets with deep linguistic information

Castro, Sérgio Ricardo de, 1981-
Fonte: Universidade de Lisboa Publicador: Universidade de Lisboa
Tipo: Dissertação de Mestrado
Publicado em //2011 Português
Relevância na Pesquisa
88.78815%
Tese de mestrado em Engenharia Informática, apresentada à Universidade de Lisboa, através da Faculdade de Ciências, 2011; Grande parte das ferramentas de processamento de linguagem natural utilizadas hoje em dia, desde os anotadores morfossintácticos (POS taggers) até aos analisadores sintáticos (parsers), necessita de corpora anotados com a informação linguística necessária para efeitos de treino e avaliação. A qualidade dos resultados obtidos por estas ferramentas está directamente ligada à qualidade dos corpora utilizados no seu treino ou avaliação. Como tal, é do mais alto interesse construir corpora anotados para treino ou avaliação com o maior nível de qualidade. Tal como as técnicas e as ferramentas da área do processamento de linguagem natural se vão tornando mais sofisticadas e tecnicamente mais complexas, também a quantidade e profundidade da informação contida nos corpora anotados tem vindo a crescer. O estado da arte actual consiste em corpora anotados com informação gramatical profunda, isto é anotação que contém não só a função ou tipo de cada elemento mas também os tipos das relações entre os diferentes elementos, sejam estas directas ou de longa distância. Esta quantidade crescente de informação contida na anotação dos corpora torna a tarefa da sua anotação crescentemente mais complexa...

Gramática e Processamento da Linguagem Natural: Fundamentos

Branco, António Horta; Costa, Francisco
Fonte: Department of Informatics, University of Lisbon Publicador: Department of Informatics, University of Lisbon
Tipo: Relatório
Publicado em /09/2008 Português
Relevância na Pesquisa
89.13235%
O presente documento tem o objectivo didáctico de apresentar uma breve introdução à área do processamento de linguagem natural que pode ser utilizada por estudantes ou investigadores interessados. Esta introdução é elaborada do ponto de vista do processamento linguístico profundo com base na gramática das línguas naturais. Adopta como enquadramento metodológico a Head-Driven Phrase Structure Grammar (HPSG). O presente documento serve também de introdução metodológica ao documento TR-2008-17, que descreve a concretização de um fragmento da gramática para a língua portuguesa de acordo com os princípios aqui apresentados. Embora possam ser usados autonomamente, estes dois documentos devem ser vistos como constituindo duas partes de um mesmo texto. O presente documento foi escrito em português por forma a tornar os seus temas disponíveis pela primeira vez para um público de falantes desta língua --- outros textos em língua inglesa já existem com objectivos aproximados. O documento TR-2008-17, por sua vez, foi escrito em inglês por forma a que os resultados aí apresentados possam ser utilizados por toda a comunidade científica

Recursos do processamento da língua natural aplicados na recuperação semântica de documentos de caso de uso

Silva Júnior, Custódio Gastão da
Fonte: Pontifícia Universidade Católica do Rio Grande do Sul; Porto Alegre Publicador: Pontifícia Universidade Católica do Rio Grande do Sul; Porto Alegre
Tipo: Dissertação de Mestrado
Português
Relevância na Pesquisa
88.87363%
A engenharia de requisitos trata fundamentalmente de como descobrir, analisar, documentar e verificar as funções e restrições que um software deve contemplar. Neste processo o projetista se concentra em entender as necessidades, metas e convicções dos interessados e em como transformá-las em artefatos de software. Isso é conhecido como ciclo de desenvolvimento e é realizado até que o software atenda todos os requisitos dos interessados. Este trabalho descreve como os recursos do processamento da língua natural foram utilizados na construção de uma solução para recuperação semântica de documentos de caso de uso e apresenta os resultados alcançados. Para a construção da solução, foi especificado um método que organiza os trabalhos de preparação e recuperação em duas fases. A primeira descreve a forma como o corpus deve ser preparado e como os termos utilizados na preparação podem ser utilizados na definição das palavras-chave do domínio. A segunda fase explica como a recuperação de documentos é realizada, e mostra como os relacionamentos descritos na ontologia são utilizados para melhorar os resultados da recuperação. Os resultados apresentados mostram que o método descrito neste trabalho é promissor...

Resolução de anafora pronominal em portugues utilizando o algoritmo de Hobbs; Hobbs' algorithm for pronomin resolution in portuguese

Denis Neves de Arruda Santos
Fonte: Biblioteca Digital da Unicamp Publicador: Biblioteca Digital da Unicamp
Tipo: Dissertação de Mestrado Formato: application/pdf
Publicado em 20/06/2008 Português
Relevância na Pesquisa
98.69777%
Anáfora é uma referência abreviada a uma entidade, esperando que o receptor do discurso possa compreender a referência. A automatização da resolução de anáforas pode melhorar o desempenho de vários sistemas de processamento de língua natural, como tradutores, geradores e sumarizadores. A dificuldade no processo de resolução acontece nos casos em que existe mais de um referente possível. Pesquisas sobre a resolução de anáforas na língua portuguesa ainda são escassas, quando comparadas com as pesquisas para outras línguas, como por exemplo, o inglês. Este trabalho descreve uma adaptação para o português do algoritmo sintático proposto por Hobbs para resolução de anáfora pronominal. A avaliação foi feita comparando os resultados com os obtidos por outro algoritmo sintático para resolução de pronomes, o algoritmo de Lappin e Leass. Os mesmos corpora foram utilizados e uma melhora significativa foi obtida com o algoritmo de Hobbs; Anaphora is an abreviated reference to an entity expecting the receiver of the discourse can understand the reference. Automatic pronoun resolution may improve the performance of natural language systems, such as translators, generators and summarizers. Difficulties may arise when there is more than one potential candidate for a referent. There has been little research on pronoun resolution for Portuguese...

Resolução de anafora pronominal em portugues utilizando o algoritmo de Lappin e Leass; Lappin and Leass' algorithm for pronominal anaphora resolution in portuguese

Thiago Thomes Coelho
Fonte: Biblioteca Digital da Unicamp Publicador: Biblioteca Digital da Unicamp
Tipo: Dissertação de Mestrado Formato: application/pdf
Publicado em 16/12/2005 Português
Relevância na Pesquisa
88.97819%
Um dos problemas do processamento de língua natural é a resolução de anáforas, fenômeno que ocorre quando duas ou mais expressões de um texto se referem a uma mesma entidade do discurso. Diversos algoritmos foram propostos para fazer a identificação do antecedente anafórico de pronomes, como o algoritmo de Lappin e Leass (1994), Hobbs (1978) e Grosz et aI. (1995). A resolução de anáforas pode melhorar consideravelmente a qualidade do resultado em diversas aplicações de processamento de língua natural, como por exemplo a recuperação e extração de informações, geração automática de resumos, traduções automáticas, entre outros. A pesquisa envolvendo o processamento automático do português ainda é limitada, se comparada a outras línguas, como inglês, francês e espanhol. Este trabalho visa implementar e avaliar o algoritmo de Lappin e Leass para a resolução de anáforas pronominais em terceira pessoa e pronomes reflexivos e recíprocos, em português. O algoritmo é baseado em um sistema de pesos, atribuídos de acordo com a estrutura sintática da sentença, e utiliza apenas conhecimento sintático na resolução das anáforas; One of the most challenging problems in naturallanguage processing is anaphora resolution. This phenomenon occurs when one or more expressions in a text refer to the same entity previously mentioned in the discourse. Several approaches to anaphora resolution have been proposed...