LLAMA-quantized

TheBloke/Llama-2-7B-Chat-GGML Quantized model use case on RAG

#CPU Optimized ue of CTransformers library to run on CPU/Local machine

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
.gitignore		.gitignore
Ctransformers LLAMA on cpu.ipynb		Ctransformers LLAMA on cpu.ipynb
LICENSE		LICENSE
README.md		README.md

Provide feedback