这是一个用于批量上传文件夹中的文件到 Dify 知识库的 Python 脚本。
- 支持批量上传整个文件夹中的文件到 Dify 知识库
- 自动识别文件类型并应用相应的处理规则
- 支持多种文件格式(PDF、TXT、DOC、DOCX、MD)
- 提供详细的上传进度和结果反馈
- 支持代理配置
- Python 3.6+
- requests 库
pip install requests在使用前,您需要修改 Dify_folder_upload.py 中的以下配置项:
-
API_KEY: 您的 Dify API 密钥
API_KEY = "YOUR_API_KEY_HERE" # 替换为您的实际API密钥
-
API_URL: Dify API 地址
API_URL = "YOUR_API_URL_HERE" # 例如: "https://api.dify.ai/v1"
-
数据集ID: 在 main() 函数中配置
dataset_id = "YOUR_DATASET_ID_HERE" # 替换为您的数据集ID
-
文件夹路径: 在 main() 函数中配置
folder_path = "YOUR_FOLDER_PATH_HERE" # 替换为您要上传的文件夹路径
相关配置请进入DIfy数据库后在左下角点击服务API后查看相关数据,数据集ID可以通过url查看,例如:https://api.dify.ai/v1/datasets/199745b2-23ad-47a9-92XXXXXXXXX
- 修改配置参数
- 运行脚本:
python Dify_folder_upload.py
from Dify_folder_upload import upload_folder_files
# 上传文件夹中的所有文件
results = upload_folder_files("your_dataset_id", "/path/to/your/folder")- PDF 文件 (.pdf)
- 文本文件 (.txt)
- Word 文档 (.doc, .docx)
- Markdown 文件 (.md)
如果需要使用代理,可以修改以下配置:
USE_PROXY = True # 启用代理
PROXIES = {
'http': 'http://127.0.0.1:7890',
'https': 'http://127.0.0.1:7890'
} # 根据您的代理设置进行修改🚀 开始上传文件夹中的所有文件到知识库...
数据集ID: your_dataset_id
文件夹路径: /path/to/your/folder
📁 找到 5 个文件,开始上传...
📊 上传结果: 成功 5 / 5
✅ 成功上传的文件:
- document1.pdf (ID: abc123)
- document2.txt (ID: def456)
- document3.docx (ID: ghi789)
- document4.md (ID: jkl012)
- document5.pdf (ID: mno345)
✅ 文件夹上传完成!
- 确保您的 API 密钥有足够的权限访问指定的数据集
- 大文件上传可能需要较长时间,请耐心等待
- 如果上传失败,请检查网络连接和 API 配置
- 建议在上传大量文件前先进行小规模测试