跳到主要内容

开发实验室使用示例

场景

  • 使用私有适配器微调开源模型
  • 使用公开或私有数据集对开源大模型进行微调
  • 使用 JupyterLab 调试代码

以上是常见的使用场景,在算想云通过『开发实验室』功能,可以快速实现以上场景。

覆盖:

  • 数据集上传
  • 适配器上传
  • 创建『开发实验室』实例
  • 使用 JupyterLab 环境调试代码
  • 使用 LlamaFactory 进行模型微调
  • 『开发实验室』实例暂停、启动
  • 镜像管理

上传数据

安装 sxwlctl

sxwlctl(文档 https://sxwl.ai/docs/cloud/sxwlctl-guide)是算想云命令行工具,用于模型、数据集、适配器的上传、下载管理。

安装sxwlctl。

wget -qO- https://sxwl-ai.oss-cn-beijing.aliyuncs.com/artifacts/tools/install.sh | bash

配置sxwlctl,把自己的AccessToken写入配置文件~/.sxwlctl.yaml

token: "eyJhb..."

上传数据集

使用sxwlctl,上传私有数据集,假设数据集文件夹是 /home/work/datasets/my-dataset

sxwlctl upload -r dataset -d /home/work/datasets/my-dataset

上传适配器

上传适配器同样使用 sxwlctl 工具,使用如下参数上传,假设适配文件夹为 /home/work/adapters/my-adapter

sxwlctl upload -r adapter -d /home/work/adapters/my-adapter

检查上传结果

检查一下是否上传成功

创建『开发实验室』实例

登录算想云,左侧菜单选择『开发实验室』,点击右上角的“创建实例”按钮。

选择需要的配置,并选择所需用到的模型以及上面上传的数据集和适配器,点击『确定』按钮。

等待实例创建完成.

使用 JupyterLab 环境调试代码

点击列表中实例右侧的『JupyterLab』按钮,进入 JupyterLab 环境。

在 JupyterLab 环境中,可以进行代码编写、调试、运行,还可以安装第三方库,进行模型微调。

开启一个『笔记本』,编写代码,点击左上角的运行按钮,即可运行代码。

开启『终端』,可以进入命令行环境进行操作。

使用 LlamaFactory 进行模型微调

『开发实验室』实例中已经预装了 LlamaFactory,点击实例右侧的『LlamaFactory』按钮,进入 LlamaFactory 页面。

在 LlamaFactory 页面,可以进行模型微调,包括数据集、模型、超参数等的调整。

创建实例时选择的模型、数据集,都可以在 LlamaFactory 页面中相应的下拉列表中进行选择。

上传的适配器暂时只能在模型选择『Custom』时使用。

选择相应的模型、数据集、超参数,点击『开始』按钮,即可开始模型微调。

实例暂停、启动

点击实例右侧的『暂停』按钮,可以暂停实例,暂停实例后,实例状态会变成『已暂停』,此时实例将释放资源,停止计费,但安装的环境、数据将被保留。

当实例处于『已暂停』状态时,通过右侧的『修改配置』按钮,可以修改实例配置,包括CPU、内存、GPU数量、GPU类型等。 点击实例右侧的『启动』按钮,可以启动实例,启动实例后,实例状态会变成『运行中』,此时实例将重新启动,恢复计费,并恢复环境、数据、模型等。

镜像管理

当通过 JupyterLab 环境调试代码完成后,可以点击实例右侧的『构建镜像』按钮,将环境镜像保存为私有镜像。

点击实例右侧的『镜像管理』按钮,可以查看、删除私有镜像。

私有镜像可以在『任务提交』时使用,用于提交需要长时间运行的任务。