MeuProvedor de Dados » Blog » Raspadores de notícias. Situação estranha no mercado

Raspadores de notícias. Situação estranha no mercado

  • by

É uma situação estranha sobre a raspagem de notícias. Eu queria encontrar um software para News Scraping e entendi que essa tarefa não é tão trivial.
Todos os meus amigos me disseram que você pode pegar qualquer leitor de RSS ou Atom. Ok, eu tentei várias soluções TOP como feedly (saas) e RSSOwl para Windows Desktop.
E o que descobri:

Feedly:
- interface legal
– baseado na web
– não permite adicionar fonte não popular
– Não consigo adicionar @minha fonte importante

RSOwl:
– permite adicionar qualquer fonte
– cada fonte tem que ter um link RSS ou Atom
– Não consigo adicionar fontes sem link RSS ou Atom

Por quê? Por que não existe software como RSSOwl ou Feedly ou qualquer leitor de RSS com adição de nova fonte de dados com configuração por XPATH?
é tão simples adicionar essa função para eles! oh, situação estranha.

Então, na vida real, não posso usar Feedly ou RSSOwl como News Scraper para mim.
Nesse caso, eu mesmo tenho que desenvolver esse software.