Upload 6 files
Browse files- app.py +125 -0
- codificadores_label_encoder.pkl +3 -0
- modelo_riesgo.pkl +3 -0
- modelo_tipo_medida.pkl +3 -0
- modelo_tipo_violencia.pkl +3 -0
- requirements.txt +7 -0
app.py
ADDED
@@ -0,0 +1,125 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
# -*- coding: utf-8 -*-
|
2 |
+
"""app.ipynb
|
3 |
+
|
4 |
+
Automatically generated by Colab.
|
5 |
+
|
6 |
+
Original file is located at
|
7 |
+
https://colab.research.google.com/drive/1e3y3OTjQnNFZ7FLgs2elviYcG7ptj2fI
|
8 |
+
"""
|
9 |
+
|
10 |
+
from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
|
11 |
+
from sentence_transformers import SentenceTransformer, util
|
12 |
+
import numpy as np
|
13 |
+
import joblib
|
14 |
+
|
15 |
+
# === Cargar modelos previos ===
|
16 |
+
modelo_riesgo = joblib.load("modelo_riesgo.pkl")
|
17 |
+
modelo_violencia = joblib.load("modelo_tipo_violencia.pkl")
|
18 |
+
modelo_medida = joblib.load("modelo_tipo_medida.pkl")
|
19 |
+
codificadores = joblib.load("codificadores_label_encoder.pkl")
|
20 |
+
modelo_vector = SentenceTransformer("Snowflake/snowflake-arctic-embed-xs")
|
21 |
+
|
22 |
+
# === Cargar modelo de lenguaje OpenHermes 2.5 ===
|
23 |
+
modelo_llm = pipeline(
|
24 |
+
"text-generation",
|
25 |
+
model="teknium/OpenHermes-2.5-Mistral-7B",
|
26 |
+
tokenizer="teknium/OpenHermes-2.5-Mistral-7B",
|
27 |
+
max_new_tokens=300,
|
28 |
+
temperature=0.5,
|
29 |
+
do_sample=True
|
30 |
+
)
|
31 |
+
|
32 |
+
# === Frases prototipo para verificador semántico ===
|
33 |
+
frases_fisica = [
|
34 |
+
"Me golpeó con el puño cerrado", "Me pateó", "Me lanzó contra la pared",
|
35 |
+
"Me estranguló", "Me fracturó una costilla", "Me tiró al piso violentamente"
|
36 |
+
]
|
37 |
+
frases_sexual = [
|
38 |
+
"Me obligó a tener relaciones sexuales", "Me tocó sin consentimiento",
|
39 |
+
"Me violó", "Me forzó a tener sexo", "Me agredió sexualmente"
|
40 |
+
]
|
41 |
+
embeds_fisica = modelo_vector.encode(frases_fisica)
|
42 |
+
embeds_sexual = modelo_vector.encode(frases_sexual)
|
43 |
+
|
44 |
+
# === FUNCIÓN ACTUALIZADA ===
|
45 |
+
def predecir_con_recomendacion(edad, genero, hijos, convivencia_agresor, consumo_sustancias, apoyo_familiar, descripcion):
|
46 |
+
# Vector tabular
|
47 |
+
vector_tabular = np.array([
|
48 |
+
int(edad),
|
49 |
+
int(hijos),
|
50 |
+
codificadores["genero"].transform([genero])[0],
|
51 |
+
0, 0, 0,
|
52 |
+
codificadores["convivencia_agresor"].transform([convivencia_agresor])[0],
|
53 |
+
codificadores["consumo_sustancias"].transform([consumo_sustancias])[0],
|
54 |
+
codificadores["apoyo_familiar"].transform([apoyo_familiar])[0]
|
55 |
+
])
|
56 |
+
|
57 |
+
# Vectorizar la descripción
|
58 |
+
vector_desc = modelo_vector.encode([descripcion])[0]
|
59 |
+
entrada = np.concatenate([vector_tabular, vector_desc])
|
60 |
+
|
61 |
+
# Predicciones
|
62 |
+
riesgo_cod = modelo_riesgo.predict([entrada])[0]
|
63 |
+
tipo_violencia_cod = modelo_violencia.predict([entrada])[0]
|
64 |
+
tipo_medida_cod = modelo_medida.predict([entrada])[0]
|
65 |
+
|
66 |
+
# Decodificación
|
67 |
+
riesgo = codificadores["riesgo"].inverse_transform([riesgo_cod])[0]
|
68 |
+
tipo_violencia = codificadores["tipo_violencia"].inverse_transform([tipo_violencia_cod])[0]
|
69 |
+
tipo_medida = codificadores["tipo_medida"].inverse_transform([tipo_medida_cod])[0]
|
70 |
+
|
71 |
+
# Verificador semántico
|
72 |
+
emb_desc = modelo_vector.encode(descripcion)
|
73 |
+
sim_fisica = max(util.cos_sim(emb_desc, embeds_fisica)[0])
|
74 |
+
sim_sexual = max(util.cos_sim(emb_desc, embeds_sexual)[0])
|
75 |
+
|
76 |
+
if sim_fisica > 0.7:
|
77 |
+
tipo_violencia = "física"
|
78 |
+
elif sim_sexual > 0.7:
|
79 |
+
tipo_violencia = "sexual"
|
80 |
+
|
81 |
+
# PROMPT optimizado
|
82 |
+
prompt = f"""[INSTRUCCIÓN]
|
83 |
+
Como asistente legal, tu tarea es determinar qué medida de protección debe aplicarse en un caso de violencia intrafamiliar, de acuerdo al Artículo 5 de la Ley 575 de 2000 (modificado por la Ley 1257 de 2008 y la Ley 2126 de 2021).
|
84 |
+
|
85 |
+
[CASO]
|
86 |
+
Tipo de violencia: {tipo_violencia}
|
87 |
+
Nivel de riesgo: {riesgo}
|
88 |
+
Tipo de medida cautelar: {tipo_medida}
|
89 |
+
Descripción del caso: {descripcion}
|
90 |
+
|
91 |
+
[OBJETIVO]
|
92 |
+
Con base en la descripción del caso y la ley, indica:
|
93 |
+
- Cuál(es) literal(es) del Artículo 5 son aplicables (a-n)
|
94 |
+
- Justifica legalmente tu elección en lenguaje claro y formal.
|
95 |
+
|
96 |
+
[RESPUESTA]
|
97 |
+
"""
|
98 |
+
|
99 |
+
salida = modelo_llm(prompt)[0]["generated_text"].split("[RESPUESTA]")[-1].strip()
|
100 |
+
|
101 |
+
return tipo_violencia, riesgo, tipo_medida, salida
|
102 |
+
|
103 |
+
import gradio as gr
|
104 |
+
|
105 |
+
gr.Interface(
|
106 |
+
fn=predecir_con_recomendacion,
|
107 |
+
inputs=[
|
108 |
+
gr.Slider(18, 65, value=30, label="Edad"),
|
109 |
+
gr.Radio(["F", "M"], label="Género"),
|
110 |
+
gr.Slider(0, 5, step=1, value=1, label="Número de hijos"),
|
111 |
+
gr.Radio(["sí", "no"], label="¿Convive con el agresor?"),
|
112 |
+
gr.Radio(["sí", "no"], label="¿Hay consumo de sustancias?"),
|
113 |
+
gr.Radio(["sí", "no"], label="¿Tiene apoyo familiar?"),
|
114 |
+
gr.Textbox(lines=4, placeholder="Describa aquí el caso de violencia", label="Descripción del caso")
|
115 |
+
],
|
116 |
+
outputs=[
|
117 |
+
gr.Textbox(label="🛑 Tipo de violencia predicho"),
|
118 |
+
gr.Textbox(label="⚠️ Nivel de riesgo"),
|
119 |
+
gr.Textbox(label="🧾 Tipo de medida cautelar"),
|
120 |
+
gr.Textbox(label="📜 Recomendación legal razonada")
|
121 |
+
],
|
122 |
+
title="LEGALFAMI – Asistente Legal con Razonamiento Jurídico",
|
123 |
+
description="Este asistente predice el tipo de violencia, nivel de riesgo y tipo de medida cautelar, y sugiere una medida específica del Art. 5 con justificación legal automatizada.",
|
124 |
+
theme="default"
|
125 |
+
).launch(debug=True)
|
codificadores_label_encoder.pkl
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:ad512b489aab1c643491545cf4c83c1d70fca1046be77d14f6e086311be9fe4e
|
3 |
+
size 2675
|
modelo_riesgo.pkl
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:a77a4d0e276b74988acfe154cfafa4c134cd4d0bcb8d899b990b7394d01c5a63
|
3 |
+
size 833729
|
modelo_tipo_medida.pkl
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:660b0a1006f814e7b791653ab6da0a658e914eda1be4b229c1137b794aa8053e
|
3 |
+
size 5779049
|
modelo_tipo_violencia.pkl
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:f7fff6310bd6f3fa5b8666f0fad9bab7afa631e6ca49feda214b64c053d04088
|
3 |
+
size 1350153
|
requirements.txt
ADDED
@@ -0,0 +1,7 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
gradio
|
2 |
+
transformers
|
3 |
+
sentence-transformers
|
4 |
+
scikit-learn
|
5 |
+
pandas
|
6 |
+
numpy
|
7 |
+
joblib
|