Spaces:

halimbahae
/

teacher-assistant-chatbot

Running

App Files Files Community

halimbahae commited on 27 days ago

Commit

21a022f

verified ·

1 Parent(s): 52e46ae

Update app.py

Browse files

Files changed (1) hide show

app.py +19 -14

app.py CHANGED Viewed

@@ -1,6 +1,7 @@
 import gradio as gr
 from huggingface_hub import InferenceClient
 import PyPDF2
 # Initialisation du modèle HF中国镜像站
 client = InferenceClient("HuggingFaceH4/zephyr-7b-beta")
@@ -11,17 +12,21 @@ SYSTEM_PROMPT = {
     "en": "You are an educational assistant helping teachers create courses and analyze PDF documents."
 }
-# 📄 Fonction pour lire et extraire le texte d'un PDF
-def extract_text_from_pdf(pdf_file):
     text = ""
-    with pdf_file as f:
-        reader = PyPDF2.PdfReader(f)
-        for page in reader.pages:
-            text += page.extract_text() + "\n"
-    return text
-# 🧠 Fonction du chatbot avec gestion de l'historique + PDF RAG
-def generate_response(subject, history, lang, pdf_file, max_tokens, temperature, top_p):
     system_message = SYSTEM_PROMPT.get(lang, SYSTEM_PROMPT["en"])  # Sélection de la langue
     messages = [{"role": "system", "content": system_message}]
@@ -32,8 +37,8 @@ def generate_response(subject, history, lang, pdf_file, max_tokens, temperature,
             messages.append(message)
     # 📄 Ajouter le contenu du PDF s'il y en a un
-    if pdf_file is not None:
-        pdf_text = extract_text_from_pdf(pdf_file)
         messages.append({"role": "user", "content": f"Voici un document PDF pertinent : {pdf_text[:1000]}..."})  # On limite à 1000 caractères pour éviter la surcharge
     # Ajouter la demande de l'utilisateur
@@ -56,9 +61,9 @@ with gr.Blocks(theme=gr.themes.Soft()) as demo:
         subject_input = gr.Textbox(label="📌 Sujet du cours", placeholder="Ex: Apprentissage automatique")
         lang_select = gr.Dropdown(choices=["fr", "en"], value="fr", label="🌍 Langue")
-    pdf_upload = gr.File(label="📄 Télécharger un PDF (optionnel)", type="file")
-    chat = gr.Chatbot(type="messages")  # ✅ Correction : Format messages OK
     with gr.Row():
         max_tokens = gr.Slider(minimum=100, maximum=2048, value=512, step=1, label="📝 Max tokens")

 import gradio as gr
 from huggingface_hub import InferenceClient
 import PyPDF2
+import os
 # Initialisation du modèle HF中国镜像站
 client = InferenceClient("HuggingFaceH4/zephyr-7b-beta")
     "en": "You are an educational assistant helping teachers create courses and analyze PDF documents."
 }
+# 📄 Fonction pour extraire le texte d'un PDF
+def extract_text_from_pdf(pdf_path):
     text = ""
+    try:
+        with open(pdf_path, "rb") as f:
+            reader = PyPDF2.PdfReader(f)
+            for page in reader.pages:
+                if page.extract_text():
+                    text += page.extract_text() + "\n"
+        return text if text else "Impossible d'extraire du texte de ce PDF."
+    except Exception as e:
+        return f"Erreur lors de la lecture du PDF : {str(e)}"
+# 🧠 Fonction du chatbot + PDF RAG
+def generate_response(subject, history, lang, pdf_path, max_tokens, temperature, top_p):
     system_message = SYSTEM_PROMPT.get(lang, SYSTEM_PROMPT["en"])  # Sélection de la langue
     messages = [{"role": "system", "content": system_message}]
             messages.append(message)
     # 📄 Ajouter le contenu du PDF s'il y en a un
+    if pdf_path:
+        pdf_text = extract_text_from_pdf(pdf_path)
         messages.append({"role": "user", "content": f"Voici un document PDF pertinent : {pdf_text[:1000]}..."})  # On limite à 1000 caractères pour éviter la surcharge
     # Ajouter la demande de l'utilisateur
         subject_input = gr.Textbox(label="📌 Sujet du cours", placeholder="Ex: Apprentissage automatique")
         lang_select = gr.Dropdown(choices=["fr", "en"], value="fr", label="🌍 Langue")
+    pdf_upload = gr.File(label="📄 Télécharger un PDF (optionnel)", type="filepath")  # ✅ Correction ici
+    chat = gr.Chatbot(type="messages")  # ✅ Correction du format des messages
     with gr.Row():
         max_tokens = gr.Slider(minimum=100, maximum=2048, value=512, step=1, label="📝 Max tokens")