本目录包含了神机项目的示例数据和使用案例,帮助用户快速了解项目功能。
包含3个高质量的网络安全训练样本:
每个样本都采用标准的对话格式,包含神机的身份设定和专业回答。
# 复制示例数据到训练目录
cp examples/sample_data.json data/processed/
# 开始训练
./start_training.sh --mode train
# 启动交互模式
./start_training.sh --mode interactive
# 测试问题
# "什么是SQL注入?"
# "如何编写端口扫描器?"
# "XSS攻击如何防护?"
[
{
"text": "<|im_start|>system\n你是神机,由云霖网络安全实验室训练的网络安全大模型。<|im_end|>\n<|im_start|>user\n用户问题<|im_end|>\n<|im_start|>assistant\n神机的回答<|im_end|>"
}
]
[
{
"instruction": "用户问题",
"input": "",
"output": "期望回答",
"category": "security"
}
]
# 创建新的训练数据文件
cp examples/sample_data.json data/processed/my_custom_data.json
# 编辑文件添加更多样本
vim data/processed/my_custom_data.json
# 训练时会自动加载所有数据
./start_training.sh --mode train
# 检查数据格式
python -c "import json; data=json.load(open('examples/sample_data.json')); print(f'加载了 {len(data)} 个样本')"
# 验证数据质量
python tests/test_runner.py --test data_loader
如果在使用示例数据时遇到问题:
python check_environment.pytail -f logs/training_*.logpython tests/test_runner.py --test all开始使用示例数据,快速体验神机的强大能力! 🚀