Já está começando a pesquisar

As funções principais já estão ok, que são:

  • Criar o índice
  • Salvar documentos
  • Pesquisar

Por enquanto só busca no Blog daqui, mesmo, e com atualização manual, pois ainda falta um crawler eficiente para que possa começar a indexar outros blogs. O algoritmo de ordenação, ainda é uma prova de conceito, preciso refiná-lo para ser algo que ajude a encontrar os melhores posts.

O que ainda falta fazer:

  • Criar o crawler
  • Refinar o algoritmo de rankeamento
  • Suportar o robots.txt
  • Ler sitemaps
  • Melhorar as descrições (utf-8 sempre dá problema)
  • Criar painel para que os donos de blogs possam configurar seus blogs

Com os 2 primeiros itens resolvidos, já será possível usar o Acha Blog, mas só começará a indexar vários blogs quando o terceiro item estiver ok, e vou colocar o nome do robô, aqui, para quem quiser bloquear já poder bloquear logo. Dá última vez, sem a opção de bloqueio pelo robots, tiveram algumas reclamações da indexação.

Deixe um comentário

Categorias
Arquivos
Links: