Upload RetNetForCausalLM

Files changed (4) hide show

README.md CHANGED Viewed

@@ -8,4 +8,4 @@ license: mit
 datasets:
 - cerebras/SlimPajama-627B
 library_name: fla
----

 datasets:
 - cerebras/SlimPajama-627B
 library_name: fla
+---

config.json CHANGED Viewed

@@ -3,6 +3,7 @@
   "architectures": [
     "RetNetForCausalLM"
   ],
   "attn_mode": "chunk",
   "bos_token_id": 1,
   "conv_size": 4,
@@ -28,7 +29,7 @@
   "share_conv_kernel": true,
   "tie_word_embeddings": false,
   "torch_dtype": "bfloat16",
-  "transformers_version": "4.40.2",
   "use_cache": true,
   "use_output_gate": true,
   "use_short_conv": false,

   "architectures": [
     "RetNetForCausalLM"
   ],
+  "attn": null,
   "attn_mode": "chunk",
   "bos_token_id": 1,
   "conv_size": 4,
   "share_conv_kernel": true,
   "tie_word_embeddings": false,
   "torch_dtype": "bfloat16",
+  "transformers_version": "4.48.2",
   "use_cache": true,
   "use_output_gate": true,
   "use_short_conv": false,

generation_config.json CHANGED Viewed

@@ -2,5 +2,5 @@
   "_from_model_config": true,
   "bos_token_id": 1,
   "eos_token_id": 2,
-  "transformers_version": "4.40.2"
 }

   "_from_model_config": true,
   "bos_token_id": 1,
   "eos_token_id": 2,
+  "transformers_version": "4.48.2"
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0692b44dbc3850d56fa98aceaeb15529852eb0c49b7cb98986000ad3d708e189
-size 2703481256

 version https://git-lfs.github.com/spec/v1
+oid sha256:de46d5e8ce1d524ac790776abfc8c3293e1c42df86a461a719a101197e8af4bd
+size 2703483944