O “cano” do OpenMoko
Cansei-me de andar à procura de notícias do OpenMoko em não sei quantas fontes, e criei um filtro agregador automatizado para o efeito.
Chama-se “OpenMoko world agregator” e está disponível para quem quiser usar.
Já inclui ele próprio fontes agregadas como Slashdot, PlanetGeek, e outros Planetas, e portanto será difícil falhar qualquer nova notícia – mas se conhecerem algum blog que fale do OpenMoko e não apareça aqui, avisem!!
O “cano” agrega as fontes, busca pela palavra openmoko tanto no título como no corpo, filtra os repetidos pelo título, ordena pela data de publicação, e publica. Não é garantido que não haja repetidos por causa das maroscas que os planetas fazem com os títulos, mas já é um começo.
Enjoy!!
_________EDIT_____________
Já levou uma série de alterações e aperfeiçoamentos.
As fontes estão separadas em dois grupos: planetas e outros. Os planetas costumam acrescentar o nome do blog de origem ao título do artigo, e eu removo isso através de uma expressão regular, deixando o título original do autor.
O planetgeek.org, por ser o único cujo “character set” não é UTF-8, acaba triturado pelo yahoo pipes. Lá está então também um outro conjunto de expressões regulares para servir de tabela de tradução e inserir os caracteres em falta. Não tenho a certeza que funcione 100% bem, é possível que nalguns browsers esses caracteres apareçam mal.
Depois é tudo unido num só conjunto de itens, ordenado pela data de publicação, remove-se os duplicados usando o link como chave, remove-se tudo o que não tenha “openmoko” ou “freerunner”, e volta-se a ordenar pela data de publicação, desta vez inversamente. A primeira ordenação é apenas uma mariquice para garantir que o filtro de repetidos remove os posteriores e não os originais.

Porreiro
Eu dou mais uso ao:
http://www.google.com/alerts
Assim diariamente (ou semanalmente, ou em “tempo-real”) fico a estar ao corrente do que se passa sobre determinado assunto.
Parabéns Vasco
Não haja duvida que o yahoo pipes é poderoso
Obrigado. Só é pena o yahoo pipes lixar os caracteres acentuados portugueses de algumas origens… tenho de ver como dar a volta ao problema.
Acabei por remover o http://www.planetgeek.org do conjunto, pois parece ser o único que usa um “charset” que o pipes não gosta…
Eles lá no yahoo pipes já foram avisados do erro há 4 meses atrás, mas como sempre andam a arrastar os pés…
Enfiei uma valente martelada nos pipes, e lá consegui voltar a meter o planetgeek.org na lista.
Foi a aproximação de força bruta: já que eles não corrigem o código deles, eu acrescentei uma cambada filtros “regexp” para substituir os caracteres marados pelos correctos… não garante 100% resultados, mas é melhor que nada.
Só é pena ainda não ter descoberto como reutilizar pipes como parte de outro pipe (e não apenas como fonte para outro pipe). era bom reutilizar este “substituidor de caracteres marados” em outras situações.
Carlos:
Pois, o Google Alerts é fixe, mas tenho visto que leva muuuuito tempo a reagir.
Mas concordo que tem o potencial de apanhar praticamente tudo o que aparece na web.
Por outro lado, com o pipes temos controlo sobre as fontes.
É uma questão de escolha.
[...] fica uma ferramenta bastante util para quem quer seguir os desenvolvimentos do openmoko: o openmoko world agregator (trata-se de um pipe da [...]
In The Woods Of Eryn Vorn » Blog Archive » noticias do OpenMoko - RDF said this on Julho 30, 2008 às 10:24 pm |
Finalmente consegui atinar com a filtragem de repetidos.
Mais “regexp” ao barulho.
O pipe está a ficar grandinho…
http://pipes.yahoo.com/pipes/pipe.info?_id=dHAWWide3RGqqI70w0muhA