|
import gradio as gr |
|
import spaces |
|
import torch |
|
from transformers import pipeline |
|
|
|
|
|
zero = torch.Tensor([0]).cuda() |
|
print(zero.device) |
|
|
|
|
|
pipe = pipeline("text-generation", model="aaditya/Llama3-OpenBioLLM-70B", device=0) |
|
|
|
@spaces.GPU |
|
def generate_response(prompt): |
|
print(zero.device) |
|
|
|
result = pipe(prompt, max_length=100) |
|
return result[0]['generated_text'] |
|
|
|
|
|
iface = gr.Interface( |
|
fn=generate_response, |
|
inputs=gr.Textbox(label="Introduce tu prompt", placeholder="Escribe aquí tu pregunta o indicación..."), |
|
outputs=gr.Textbox(label="Respuesta generada"), |
|
title="Generador de Texto con Llama3-OpenBioLLM-70B", |
|
description="Ingresa un prompt y obtén una respuesta generada por el modelo Llama3-OpenBioLLM-70B." |
|
) |
|
|
|
iface.launch() |