README
Pretendo fazer uma longa série de posts sobre NLP, não sou especialista nisso e podemos considerar os posts mais como anotações de estudo do que tutoriais ou manuais. O Índice abaixo será atualizado à medida que eu for publicando novos conteúdos, a idéia é seguir o andamento histórico de cada parte, na 1ª parte começaremos com o tf-idf para depois seguirmos para o word2vec e glove:
- parte 1: vetorização
- estatística: tf-idf
- word2vec 1: introdução
- word2vec 2: cbow
- word2vec 3: skip-gram
- glove
- seq2seq: introdução
- notas finais e comparações entre métodos
- parte 3: modelagem
- resumos 0: pagerank
- seq2seq: introdução
- seq2seq: implementação
- utils
Obs1.: O pré-processamento é a etapa inicial de praticamente todos os conteúdos aqui escritos, é realmente muito importante, por isso antes de partir para qualquer outro conteúdo, leia ele primeiro.
Obs2.: O que estiver em itálico é que ainda não escrevi mas devo fazer ao longo dessas semanas.
obs3.: Com excessão da parte 1, usarei o cbow, skip-gram e glove já computados, fontes recomendadas:
Comentários
Comments powered by Disqus