HF中国镜像站

Grogros
/

dmWM-llama-3.2-1B-Instruct-OWT-1WT-DistillationWM-Al4-WT-v4

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

dmWM-llama-3.2-1B-Instruct-OWT-1WT-DistillationWM-Al4-WT-v4

Ctrl+K

Ctrl+K

1 contributor

History: 6 commits

Grogros's picture

Training in progress, step 3000

1a90543 verified 21 days ago

checkpoint-1000
Training in progress, step 1000, checkpoint 21 days ago
checkpoint-2000
Training in progress, step 2000, checkpoint 21 days ago
.gitattributes

1.52 kB

Training in progress, step 3000 21 days ago
config.json

927 Bytes

Training in progress, step 1000 21 days ago
model.safetensors

2.47 GB
LFS

Training in progress, step 3000 21 days ago
training_args.bin
Detected Pickle imports (9)
- "accelerate.utils.dataclasses.DistributedType",
- "transformers.training_args.OptimizerNames",
- "transformers.trainer_utils.IntervalStrategy",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "transformers.trainer_utils.SchedulerType",
- "accelerate.state.PartialState",
- "torch.device",
- "transformers.training_args.TrainingArguments",
- "transformers.trainer_utils.HubStrategy"
How to fix it?
5.37 kB
LFS

Training in progress, step 1000 21 days ago