terça-feira, 25 de novembro de 2008

Text Mining e Information Retrieval (IR) - e outras áreas relacionadas

Text Mining é uma evolução (ou uma especialização) da área de Information Retrieval - IR.
IR está relacionada a processos de encontrar fontes de informações, ou seja, documentos ou textos que podem contar a informação desejada. Veja neste link mais detalhes sobre técnicas de Information Retrieval (incluindo técnicas de indexação, modelos de match e tipos de organizações de arquivos e índices).
Outra área relacionada é a Information Extraction (Extração de Informações), cujo objetivo é extrair dados a partir de textos (encontrar valores para atributos). Por exemplo, num texto que fale sobre uma pessoa, encontrar seu nome, endereço, idade, sexo, etc.
Também há relações de Text Mining com as seguintes áreas:
- Resumos de textos (sumarização)
- Busca de Informações na Web
- além é claro de Data Mining.

2 comentários:

Tato disse...

Muito bom o texto, bem fácil entender o que é Text Mining.

Parabéns mais uma vez pela iniciativa, mestre.

Unknown disse...

Muito bom este blog... será minha fonte de informação na minha dissertação em Extração de Informação em Documentos.

Quais ferramenas realizam mineração de texto realizando preparando o arquivo para a descoberta de conhecimento?

Parabéns por esta fonte de informação1