当前位置：网站首页 > 编程网 > 正文

基于Ollama与RAGFlow搭建本地化(RAG)系统的详细部署指南

yuyutoo 2025-04-06 00:08 4 浏览 0 评论

以下是基于Ollama与RAGFlow搭建本地化检索增强生成（RAG）系统的详细部署指南

部署前置条件

硬件要求

CPU：≥4核（建议Intel i5及以上）

内存：≥16GB（推荐32GB以支持大模型加载）

硬盘：≥50GB（用于存储模型、文档及向量索引）

GPU（可选）：支持CUDA的NVIDIA显卡可加速处理（如RTX 3060及以上）

软件依赖

Docker ≥24.0.0 + Docker Compose ≥v2.26.1

Ollama：本地大模型运行时（支持Windows/macOS/Linux）

Ollama本地部署与模型配置

安装Ollama

Windows：下载安装包并运行

启动服务与加载模型

# 启动Ollama服务 ollama serve

# 拉取模型（如Qwen2或DeepSeek-R1）

ollama pull qwen2:7b# 或 deepseek-r1:8b

验证模型运行
访问 http://localhost:11434，输入测试问题验证模型响应。

三、RAGFlow部署与集成配置

拉取RAGFlow镜像并启动容器

bash

git clone https://github.com/infiniflow/ragflow.git cd ragflow/docker

chmod +x ./entrypoint.sh

docker compose -f docker-compose-CN.yml up -d

解决端口冲突（可选）
修改docker-compose-CN.yml中端口映射（如将80改为8000）：

yaml

ports:

- "8000:80"

- "4433:443"

配置Ollama连接

登录RAGFlow（http://localhost:80），进入模型提供商设置：

API地址：
http://host.docker.internal:11434（Docker内部通信）

模型名称：填写已下载的模型（如qwen2:7b）

构建本地知识库

文档处理与上传

支持格式：PDF、Markdown、Word、Excel等（实测Markdown兼容性良好）

上传后自动完成分块、OCR（扫描件）、表格解析及向量化处理

索引构建优化

分块策略：按语义段落或固定字符长度分割（默认1024 tokens）

嵌入模型：内置nomic-embed-text或自定义Ollama嵌入模型

检索参数：调整Top-K（检索数量）和相似度阈值（建议≥0.75）

五、验证与优化

问答测试

在RAGFlow聊天界面输入问题，观察是否引用知识库内容：

plaintext

Q: Mac触控板如何开启三指拖拽？

A: [根据知识库文档]进入系统偏好设置→辅助功能→指针控制→触控板选项→启用三指拖拽

性能调优

GPU加速：使用docker-compose-gpu.yml配置CUDA支持

资源分配：通过Docker Desktop限制CPU/内存占用

模型切换：尝试更大参数量模型（如mistral:7b）提升生成质量

六、常见问题解决

容器启动失败

检查端口冲突：lsof -i:80

查看日志：docker logs -f ragflow-server

模型未响应

确认Ollama服务运行：ps aux | grep ollama

测试API连通性：curl
http://host.docker.internal:11434/api/chat

文件解析异常

更新RAGFlow至最新版本：git pull origin main

转换复杂文档为PDF/TXT格式再上传

plaintext

上一篇：脸书6亿用户密码“裸奔”，科技巨头还有多少安全漏洞?
下一篇：Linux 查看硬件磁盘存储大小和磁盘阵列(RAID)的组合方式

基于Ollama与RAGFlow搭建本地化(RAG)系统的详细部署指南

部署前置条件

Ollama本地部署与模型配置

三、RAGFlow部署与集成配置

构建本地知识库

五、验证与优化

六、常见问题解决

相关推荐

取消回复欢迎你发表评论:

前端面试:iframe 的优缺点? iframe有那些缺点

带斜线的表头制作好了，如何填充内容?这几种方法你更喜欢哪个?

漫学笔记之PHP.ini常用的配置信息

其实模版网站在开发工作中很重要，推荐几个参考站给大家

推荐7个模板代码和其他游戏源码下载的网址

[干货] JAVA - JVM - 2 内存两分 [干货]+java+-+jvm+-+2+内存两分吗

正在学习使用python搭建自动化测试框架?这个系统包你可能会用到

织梦(Dedecms)建站教程织梦建站详细步骤

【开源分享】2024PHP在线客服系统源码(搭建教程+终身使用)

2024PHP在线客服系统源码+完全开源带详细搭建教程

基于Ollama与RAGFlow搭建本地化(RAG)系统的详细部署指南

部署前置条件

Ollama本地部署与模型配置

三、RAGFlow部署与集成配置

构建本地知识库

五、验证与优化

六、常见问题解决

相关推荐

取消回复欢迎 你 发表评论:

前端面试:iframe 的优缺点? iframe有那些缺点

带斜线的表头制作好了，如何填充内容?这几种方法你更喜欢哪个?

漫学笔记之PHP.ini常用的配置信息

其实模版网站在开发工作中很重要，推荐几个参考站给大家

推荐7个模板代码和其他游戏源码下载的网址

[干货] JAVA - JVM - 2 内存两分 [干货]+java+-+jvm+-+2+内存两分吗

正在学习使用python搭建自动化测试框架?这个系统包你可能会用到

织梦(Dedecms)建站教程 织梦建站详细步骤

【开源分享】2024PHP在线客服系统源码(搭建教程+终身使用)

2024PHP在线客服系统源码+完全开源 带详细搭建教程

取消回复欢迎你发表评论:

织梦(Dedecms)建站教程织梦建站详细步骤

2024PHP在线客服系统源码+完全开源带详细搭建教程