- [ ] updateSimilarity : link1-link2 쌍으로 중복 체크 - [ ] collect.py : (크롤링되는 기사들) - (collectedArticle의 기사들) link로 중복 체크 - [ ] MongoDB 인덱싱 추가 - [ ] 기사 upload, update날짜 완벽하게 추출 - [ ] 기자 이름 완벽하게 추출