Spaces:

km1lo
/

LEGALFAMI

Paused

App Files Files Community

km1lo commited on Jun 9

Commit

d76c50d

verified ·

1 Parent(s): 2009494

Upload 2 files

Browse files

Files changed (2) hide show

app.py +136 -0
requirements.txt +20 -0

app.py ADDED Viewed

	@@ -0,0 +1,136 @@

+# -*- coding: utf-8 -*-
+"""app.ipynb
+Automatically generated by Colab.
+Original file is located at
+    https://colab.research.google.com/drive/1e3y3OTjQnNFZ7FLgs2elviYcG7ptj2fI
+"""
+from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
+from sentence_transformers import SentenceTransformer, util
+import numpy as np
+import joblib
+import torch
+import gradio as gr
+from transformers import TextGenerationPipeline
+# === Cargar modelos entrenados ===
+modelo_riesgo = joblib.load("modelo_riesgo.pkl")
+modelo_violencia = joblib.load("modelo_tipo_violencia.pkl")
+modelo_medida = joblib.load("modelo_tipo_medida.pkl")
+codificadores = joblib.load("codificadores_label_encoder.pkl")
+modelo_vector = SentenceTransformer("Snowflake/snowflake-arctic-embed-xs")
+# === Cargar modelo de lenguaje OpenHermes-2.5 ===
+model_id = "teknium/OpenHermes-2.5-Mistral-7B"
+tokenizer = AutoTokenizer.from_pretrained(model_id, trust_remote_code=True)
+model = AutoModelForCausalLM.from_pretrained(
+    model_id,
+    trust_remote_code=True,
+    torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32,
+    device_map="auto"
+)
+modelo_llm = TextGenerationPipeline(
+    model=model,
+    tokenizer=tokenizer,
+    max_new_tokens=300,
+    temperature=0.5,
+    do_sample=True,
+    device=0 if torch.cuda.is_available() else -1
+)
+# === Frases prototipo para verificador semántico ===
+frases_fisica = [
+    "Me golpeó con el puño cerrado", "Me pateó", "Me lanzó contra la pared",
+    "Me estranguló", "Me fracturó una costilla", "Me tiró al piso violentamente"
+]
+frases_sexual = [
+    "Me obligó a tener relaciones sexuales", "Me tocó sin consentimiento",
+    "Me violó", "Me forzó a tener sexo", "Me agredió sexualmente"
+]
+embeds_fisica = modelo_vector.encode(frases_fisica)
+embeds_sexual = modelo_vector.encode(frases_sexual)
+# === FUNCIÓN PRINCIPAL ===
+def predecir_con_recomendacion(edad, genero, hijos, convivencia_agresor, consumo_sustancias, apoyo_familiar, descripcion):
+    # Codificar variables
+    vector_tabular = np.array([
+        int(edad),
+        int(hijos),
+        codificadores["genero"].transform([genero])[0],
+        0, 0, 0,
+        codificadores["convivencia_agresor"].transform([convivencia_agresor])[0],
+        codificadores["consumo_sustancias"].transform([consumo_sustancias])[0],
+        codificadores["apoyo_familiar"].transform([apoyo_familiar])[0]
+    ])
+    # Vectorizar descripción
+    vector_desc = modelo_vector.encode([descripcion])[0]
+    entrada = np.concatenate([vector_tabular, vector_desc])
+    # Predicciones
+    riesgo_cod = modelo_riesgo.predict([entrada])[0]
+    tipo_violencia_cod = modelo_violencia.predict([entrada])[0]
+    tipo_medida_cod = modelo_medida.predict([entrada])[0]
+    # Decodificar
+    riesgo = codificadores["riesgo"].inverse_transform([riesgo_cod])[0]
+    tipo_violencia = codificadores["tipo_violencia"].inverse_transform([tipo_violencia_cod])[0]
+    tipo_medida = codificadores["tipo_medida"].inverse_transform([tipo_medida_cod])[0]
+    # Verificador semántico
+    emb_desc = modelo_vector.encode(descripcion)
+    sim_fisica = max(util.cos_sim(emb_desc, embeds_fisica)[0])
+    sim_sexual = max(util.cos_sim(emb_desc, embeds_sexual)[0])
+    if sim_fisica > 0.7:
+        tipo_violencia = "física"
+    elif sim_sexual > 0.7:
+        tipo_violencia = "sexual"
+    # PROMPT legal
+    prompt = f"""[INSTRUCCIÓN]
+Como asistente legal, tu tarea es determinar qué medida de protección debe aplicarse en un caso de violencia intrafamiliar, de acuerdo al Artículo 5 de la Ley 575 de 2000 (modificado por la Ley 1257 de 2008 y la Ley 2126 de 2021).
+[CASO]
+Tipo de violencia: {tipo_violencia}
+Nivel de riesgo: {riesgo}
+Tipo de medida cautelar: {tipo_medida}
+Descripción del caso: {descripcion}
+[OBJETIVO]
+Con base en la descripción del caso y la ley, indica:
+- Qué literal(es) del Artículo 5 (a-n) deben aplicarse.
+- Justifica legalmente tu elección con argumentos claros y precisos.
+[RESPUESTA]
+"""
+    respuesta = modelo_llm(prompt, max_new_tokens=350, temperature=0.5)[0]["generated_text"]
+    razonamiento = respuesta.split("[RESPUESTA]")[-1].strip()
+    return tipo_violencia, riesgo, tipo_medida, razonamiento
+# === Gradio UI ===
+gr.Interface(
+    fn=predecir_con_recomendacion,
+    inputs=[
+        gr.Slider(18, 65, value=30, label="Edad"),
+        gr.Radio(["F", "M"], label="Género"),
+        gr.Slider(0, 5, step=1, value=1, label="Número de hijos"),
+        gr.Radio(["sí", "no"], label="¿Convive con el agresor?"),
+        gr.Radio(["sí", "no"], label="¿Hay consumo de sustancias?"),
+        gr.Radio(["sí", "no"], label="¿Tiene apoyo familiar?"),
+        gr.Textbox(lines=4, label="Descripción del caso")
+    ],
+    outputs=[
+        gr.Textbox(label="🛑 Tipo de violencia predicho"),
+        gr.Textbox(label="⚠️ Nivel de riesgo"),
+        gr.Textbox(label="🧾 Tipo de medida cautelar"),
+        gr.Textbox(label="📜 Recomendación legal razonada")
+    ],
+    title="LEGALFAMI – Asistente Legal con Razonamiento Jurídico",
+    description="Predice tipo de violencia, nivel de riesgo y medida cautelar según Ley 575 Artículo 5, y recomienda la acción legal correspondiente.",
+    theme="default"
+).launch()

requirements.txt ADDED Viewed

	@@ -0,0 +1,20 @@

+# Interfaz
+gradio>=4.17.0
+# Modelos y NLP
+transformers>=4.39.0
+sentence-transformers>=2.2.2
+sentencepiece>=0.1.99
+# ML clásico
+scikit-learn>=1.3.0
+pandas>=1.5.3
+numpy>=1.24.3
+joblib>=1.3.2
+# Backend de deep learning
+torch>=2.1.0
+# Adicionales recomendados para compatibilidad con modelos pesados
+accelerate>=0.21.0
+safetensors>=0.3.3