Spaces:

deepapaikar
/

KatzLLaMA

Sleeping

deepapaikar commited on Aug 7, 2024

Commit

1a4cca4

verified ·

1 Parent(s): b56227c

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -3,13 +3,16 @@ from transformers import AutoTokenizer, AutoModelForCausalLM
 import torch
 import spaces
 # Load model and tokenizer only once, outside the function
 model_name = "deepapaikar/Katzbot_Llama_7b_QA_10eps"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForCausalLM.from_pretrained(model_name,  device_map='auto')
-@spaces
 def generate_text(input_text):
     """Generates text using the LlamaKatz-3x8B model.
@@ -19,7 +22,7 @@ def generate_text(input_text):
     Returns:
         str: The generated text.
     """
-    inputs = tokenizer(input_text, return_tensors="pt").to(model.device)
     outputs = model.generate(**inputs)
     generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
     return generated_text

 import torch
 import spaces
+zero = torch.Tensor([0]).cuda()
 # Load model and tokenizer only once, outside the function
 model_name = "deepapaikar/Katzbot_Llama_7b_QA_10eps"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForCausalLM.from_pretrained(model_name,  device_map='auto')
+@spaces.GPU
 def generate_text(input_text):
     """Generates text using the LlamaKatz-3x8B model.
     Returns:
         str: The generated text.
     """
+    inputs = tokenizer(input_text, return_tensors="pt").to(zero.device)
     outputs = model.generate(**inputs)
     generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
     return generated_text