Arquivo do autor
Já está começando a pesquisar
As funções principais já estão ok, que são:
- Criar o índice
- Salvar documentos
- Pesquisar
Por enquanto só busca no Blog daqui, mesmo, e com atualização manual, pois ainda falta um crawler eficiente para que possa começar a indexar outros blogs. O algoritmo de ordenação, ainda é uma prova de conceito, preciso refiná-lo para ser algo que ajude a encontrar os melhores posts.
O que ainda falta fazer:
- Criar o crawler
- Refinar o algoritmo de rankeamento
- Suportar o robots.txt
- Ler sitemaps
- Melhorar as descrições (utf-8 sempre dá problema)
- Criar painel para que os donos de blogs possam configurar seus blogs
Com os 2 primeiros itens resolvidos, já será possível usar o Acha Blog, mas só começará a indexar vários blogs quando o terceiro item estiver ok, e vou colocar o nome do robô, aqui, para quem quiser bloquear já poder bloquear logo. Dá última vez, sem a opção de bloqueio pelo robots, tiveram algumas reclamações da indexação.
Primeiro protótipo pronto
Ainda não faz busca, mas a parte visual já está completa e funcional (com dados fictícios). Mais alguns ajustes de CSS e estará tudo pronto para começar a programação da busca propriamente dita.
Acho que é a primeira vez que começo pela parte visual, mas como o Acha Blog já existia e o conceito é muito bem entendido, acho que vale a pena começar pelo que estava menos resolvido.