Aqui vão duas dicas de sistemas online que podem ajudar em processos de preparação de textos:
- Stemming: é um processo de reduzir palavras a seus radicais
(exemplo: casamento ==> cas, carro ==> carr).
Isto permite encontrar mais textos sobre um mesmo assunto sem precisar usar variações linguísticas (plurais, aumentativo, masculino/feminino).
Siga o link para utilizar um serviço online de stemming para a língua portuguesa
(link alternativo = http://gpsi.ucpel.tche.br/~evandro/stemming/stem.php).
- Análise Sintática: é um processo de quebrar textos em partes (parser), analisando as relações entre as palavras (sujeito, verbo, complemento, etc) e tb inclui análise léxico-morfológica (função da palavra na frase, tipo adjetivo, substantivo, etc.)
Siga o link para utilizar um serviço online de análise sintática para o português.
terça-feira, 25 de novembro de 2008
Assinar:
Postar comentários (Atom)
2 comentários:
Muito bom o uso do metodo "Stemming" para agilizar o processo da leitura de uma stream de entrada.
Amigo, você conhece a pessoa que desenvolveu esse stemmer em php?
Gostaria de ter acesso ao código fonte.
[]´s
Postar um comentário