Go webcrawler

This Go-based webcrawler uses a Breadth-First Search (BFS) strategy to crawl the web.

The crawler requires three command-line arguments:

-d : Maximum depth for BFS traversal
-l : Limit of requests per domain (helps avoid spamming frequently referenced domains)
-s : Starting URL

MongoDB Each crawled page is stored in MongoDB with the following fields:

URL   string
Title string
Body  string

Neo4j Discovered links between web pages are saved in Neo4j, enabling powerful graph-based analysis.

(w1:Website {url: $url1})-[:CONNECTS_TO]-(w2:Website {url: $url2})

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
classfier		classfier
docs		docs
src		src
.gitignore		.gitignore
README.md		README.md
dc		dc
docker-compose.yml		docker-compose.yml

Provide feedback