分类 AI使用下的文章

为离线设备安装语言对话大模型流程(LM-Studio qwen3vl-4b)

0. 准备工作

0.1 下载LM Studio安装包

a. 访问LM Studio官方网站
b. 下载适用于Windows 64位系统的安装包

下载链接： https://lmstudio.ai/download/latest/win32/x64
文件名示例： LM-Studio-0.3.36-1-x64.exe
注意： 版本号可能随时间更新，请下载最新版本

0.2 下载模型文件

a. 访问LM Studio模型目录

访问链接： https://lmstudio.ai/models
推荐模型： DeepSeek-Coder-V2-Lite-Instruct-GGUF
推荐模型： deepseek-coder-6.7B-instruct-GGUF
推荐模型： Qwen3-VL-4B-Instruct-GGUF
推荐模型： Qwen2.5-Coder-7B-Instruct

b. 选择并下载推荐的模型：

模型名称	推荐版本	适用场景	预估大小
Qwen3-VL-4B	Q4_K_M	多模态、图文理解	2.5-3GB
Deepseek Coder 6.7B	Q4_K_S	代码生成与理解	3.5-4GB

c. 下载模型所需的全部文件：

GGUF主模型文件（必需）：模型名-量化版本.gguf
投影文件（如有）：模型名-F16.gguf 或 mmproj-模型名-F16.gguf
配置文件（如有）：config.json
分词器文件（如有）：tokenizer.json

0.3 文件整理与打包

a. 创建文件夹结构

   离线模型安装包/
   ├── LM-Studio-0.3.36-1-x64.exe
   └── models/
       └── lmstudio-community/
           ├── Qwen3-VL-4B-Instruct-GGUF/
           │   ├── Qwen3-VL-4B-Instruct-Q4_K_M.gguf
           │   └── mmproj-Qwen3-VL-4B-Instruct-F16.gguf
           └── deepseek-coder-6.7B-instruct-GGUF/
               ├── deepseek-coder-6.7B-instruct-Q4_K_S.gguf
               └── tokenizer.json

b. 模型选择建议

内存12GB以下设备： 选择4-7B参数量的Q4_K_S版本
内存16GB设备： 选择7-14B参数量的Q4_K_M版本
内存32GB以上设备： 可考虑Q8或更高精度的量化版本

0.4 系统要求检查

项目	最低要求	推荐配置
操作系统	Windows 10 64位	Windows 11 64位
处理器	4核心CPU	8核心及以上CPU
内存	8GB RAM	16GB RAM或更高
存储空间	10GB可用空间	50GB可用空间
显卡	集成显卡	NVIDIA显卡（支持CUDA）

1. 安装 LM Studio

双击运行下载好的 LM-Studio-0.3.36-1-x64.exe（版本号可能不同）。
若系统提示“是否允许此应用对设备进行更改？”，点击是。
按照安装向导提示完成安装：
- 选择安装语言（通常为英文或自动识别系统语言）。
- 点击 Next，接受许可协议。
- 选择安装路径（建议保持默认，或自定义至空间充足的磁盘）。
- 点击 Install 开始安装。
- 安装完成后，勾选“Launch LM Studio”（启动 LM Studio），点击 Finish。

2. 放置模型文件

找到 LM Studio 的模型默认存储路径（通常在以下位置之一）：
- C:\Users\[用户名]\AppData\Local\lm-studio\models
- 或在 LM Studio 设置中查看“Model Directory”路径。
将您打包好的 lmstudio-community 文件夹（内含整理好的模型文件夹）整体复制到上述模型存储路径中。
若您下载了多个模型（例如 Qwen3-VL-4B 和 Deepseek-Coder-6.7B），请确保每个模型文件夹都按照以下结构放置：

lm-studio/models/
    ├── lmstudio-community/
    │   ├── Qwen3-VL-4B-Instruct-GGUF/
    │   │   ├── Qwen3-VL-4B-Instruct-Q4_K_M.gguf
    │   │   └── mmproj-Qwen3-VL-4B-Instruct-F16.gguf
    │   └── deepseek-coder-6.7B-GGUF/
    │       ├── deepseek-coder-6.7B-instruct-Q4_K_M.gguf
    │       └── config.json（如有）

3. 在 LM Studio 中加载模型

打开 LM Studio 软件。
点击左侧菜单栏中的 “Select a model”（选择模型）。
在模型列表中，找到您放置的模型文件夹（如 lmstudio-community），点击进入，选择对应的 .gguf 模型文件（如 Qwen3-VL-4B-Instruct-Q4_K_M.gguf）。
点击 “Load model”（加载模型）。
加载成功后，右侧对话界面会显示“Model loaded successfully”提示。

4. 配置模型参数（可选）

在加载模型后，可点击右上角 “Settings”（设置）调整运行参数：
- GPU Offload：如果有独立显卡，可适当分配显存以加速推理。
- Context Length：根据内存大小调整上下文长度（建议初次保持默认）。
- Threads：设置 CPU 线程数（通常自动检测，可手动调整以提高性能）。
调整后点击 “Save” 保存设置。

5. 测试模型运行

在右侧对话框输入问题，例如：“请用 Python 写一个 Hello World 程序。”
点击发送或按 Enter，观察模型回复是否正常。
如无响应或报错，请检查：
- 模型文件是否完整、未损坏。
- 内存是否足够（任务管理器中查看内存占用）。
- 是否选择了正确的 .gguf 文件。

6. 常见问题与解决

问题	可能原因	解决方案
模型加载失败	模型文件路径错误	确认模型文件是否放在 LM Studio 默认模型路径中
运行速度极慢	内存不足或未启用 GPU	关闭其他程序，或在设置中开启 GPU Offload
对话无响应	模型未成功加载	重新启动 LM Studio，重新加载模型
提示“Out of Memory”	模型过大，内存不足	更换更小量化版本的模型（如 Q4_K_S）

分类 AI使用下的文章

AI使用-为离线设备安装语言对话大模型流程(LM-Studio qwen3vl-4b)

为离线设备安装语言对话大模型流程(LM-Studio qwen3vl-4b)

0. 准备工作

1. 安装 LM Studio

2. 放置模型文件

3. 在 LM Studio 中加载模型

4. 配置模型参数（可选）

5. 测试模型运行

6. 常见问题与解决

最新文章

最近回复

分类

归档

分类 AI使用 下的文章

AI使用-为离线设备安装语言对话大模型流程(LM-Studio qwen3vl-4b)

为离线设备安装语言对话大模型流程(LM-Studio qwen3vl-4b)

0. 准备工作

1. 安装 LM Studio

2. 放置模型文件

3. 在 LM Studio 中加载模型

4. 配置模型参数（可选）

5. 测试模型运行

6. 常见问题与解决

最新文章

最近回复

分类

归档

分类 AI使用下的文章