Mind Lab Toolkit (MinT)

Mind Lab Toolkit (MinT)

安装 FAQ 文档导航

快速开始

快速开始 FAQ

我应该做 SFT 还是 RL？

如果你已经知道目标输出，并且有标注样本，使用 SFT。

如果你没有唯一标准答案，但能用 reward、verifier、测试或环境反馈给模型行为打分，使用 RL。

如果两者都有，可以组合使用。常见做法是用 SFT 建立基础行为，再用 RL 做目标优化，但这不是所有任务都必须遵守的固定顺序。

MinT 支持 SFT 吗？

支持。MinT 直接支持 SFT。

标准 SFT 路径就是：

forward_backward(..., loss_fn="cross_entropy")
optim_step(...)

应该用境外还是境内域名？

按你的网络路径来选：

境内 -> https://mint-cn.macaron.xin/
境外 -> https://mint.macaron.xin/

如果不确定，先用与你所在区域一致的域名。最实际的判断标准是延迟更低、连接更稳定。

`MINT_API_KEY` 从哪里获取？

MINT_API_KEY 目前由 Mind Lab 团队发放。

申请方式：

访问 https://macaron.im/mindlab
使用 Schedule a Demo
或发邮件到 contact@mindlab.ltd

安装

上一页

文档导航

下一页

本页目录

快速开始 FAQ 我应该做 SFT 还是 RL？MinT 支持 SFT 吗？应该用境外还是境内域名？MINT_API_KEY 从哪里获取？