km1lo commited on
Commit
c430a90
·
verified ·
1 Parent(s): 0bd697a

Upload 6 files

Browse files
app.py ADDED
@@ -0,0 +1,125 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ # -*- coding: utf-8 -*-
2
+ """app.ipynb
3
+
4
+ Automatically generated by Colab.
5
+
6
+ Original file is located at
7
+ https://colab.research.google.com/drive/1e3y3OTjQnNFZ7FLgs2elviYcG7ptj2fI
8
+ """
9
+
10
+ from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
11
+ from sentence_transformers import SentenceTransformer, util
12
+ import numpy as np
13
+ import joblib
14
+
15
+ # === Cargar modelos previos ===
16
+ modelo_riesgo = joblib.load("modelo_riesgo.pkl")
17
+ modelo_violencia = joblib.load("modelo_tipo_violencia.pkl")
18
+ modelo_medida = joblib.load("modelo_tipo_medida.pkl")
19
+ codificadores = joblib.load("codificadores_label_encoder.pkl")
20
+ modelo_vector = SentenceTransformer("Snowflake/snowflake-arctic-embed-xs")
21
+
22
+ # === Cargar modelo de lenguaje OpenHermes 2.5 ===
23
+ modelo_llm = pipeline(
24
+ "text-generation",
25
+ model="teknium/OpenHermes-2.5-Mistral-7B",
26
+ tokenizer="teknium/OpenHermes-2.5-Mistral-7B",
27
+ max_new_tokens=300,
28
+ temperature=0.5,
29
+ do_sample=True
30
+ )
31
+
32
+ # === Frases prototipo para verificador semántico ===
33
+ frases_fisica = [
34
+ "Me golpeó con el puño cerrado", "Me pateó", "Me lanzó contra la pared",
35
+ "Me estranguló", "Me fracturó una costilla", "Me tiró al piso violentamente"
36
+ ]
37
+ frases_sexual = [
38
+ "Me obligó a tener relaciones sexuales", "Me tocó sin consentimiento",
39
+ "Me violó", "Me forzó a tener sexo", "Me agredió sexualmente"
40
+ ]
41
+ embeds_fisica = modelo_vector.encode(frases_fisica)
42
+ embeds_sexual = modelo_vector.encode(frases_sexual)
43
+
44
+ # === FUNCIÓN ACTUALIZADA ===
45
+ def predecir_con_recomendacion(edad, genero, hijos, convivencia_agresor, consumo_sustancias, apoyo_familiar, descripcion):
46
+ # Vector tabular
47
+ vector_tabular = np.array([
48
+ int(edad),
49
+ int(hijos),
50
+ codificadores["genero"].transform([genero])[0],
51
+ 0, 0, 0,
52
+ codificadores["convivencia_agresor"].transform([convivencia_agresor])[0],
53
+ codificadores["consumo_sustancias"].transform([consumo_sustancias])[0],
54
+ codificadores["apoyo_familiar"].transform([apoyo_familiar])[0]
55
+ ])
56
+
57
+ # Vectorizar la descripción
58
+ vector_desc = modelo_vector.encode([descripcion])[0]
59
+ entrada = np.concatenate([vector_tabular, vector_desc])
60
+
61
+ # Predicciones
62
+ riesgo_cod = modelo_riesgo.predict([entrada])[0]
63
+ tipo_violencia_cod = modelo_violencia.predict([entrada])[0]
64
+ tipo_medida_cod = modelo_medida.predict([entrada])[0]
65
+
66
+ # Decodificación
67
+ riesgo = codificadores["riesgo"].inverse_transform([riesgo_cod])[0]
68
+ tipo_violencia = codificadores["tipo_violencia"].inverse_transform([tipo_violencia_cod])[0]
69
+ tipo_medida = codificadores["tipo_medida"].inverse_transform([tipo_medida_cod])[0]
70
+
71
+ # Verificador semántico
72
+ emb_desc = modelo_vector.encode(descripcion)
73
+ sim_fisica = max(util.cos_sim(emb_desc, embeds_fisica)[0])
74
+ sim_sexual = max(util.cos_sim(emb_desc, embeds_sexual)[0])
75
+
76
+ if sim_fisica > 0.7:
77
+ tipo_violencia = "física"
78
+ elif sim_sexual > 0.7:
79
+ tipo_violencia = "sexual"
80
+
81
+ # PROMPT optimizado
82
+ prompt = f"""[INSTRUCCIÓN]
83
+ Como asistente legal, tu tarea es determinar qué medida de protección debe aplicarse en un caso de violencia intrafamiliar, de acuerdo al Artículo 5 de la Ley 575 de 2000 (modificado por la Ley 1257 de 2008 y la Ley 2126 de 2021).
84
+
85
+ [CASO]
86
+ Tipo de violencia: {tipo_violencia}
87
+ Nivel de riesgo: {riesgo}
88
+ Tipo de medida cautelar: {tipo_medida}
89
+ Descripción del caso: {descripcion}
90
+
91
+ [OBJETIVO]
92
+ Con base en la descripción del caso y la ley, indica:
93
+ - Cuál(es) literal(es) del Artículo 5 son aplicables (a-n)
94
+ - Justifica legalmente tu elección en lenguaje claro y formal.
95
+
96
+ [RESPUESTA]
97
+ """
98
+
99
+ salida = modelo_llm(prompt)[0]["generated_text"].split("[RESPUESTA]")[-1].strip()
100
+
101
+ return tipo_violencia, riesgo, tipo_medida, salida
102
+
103
+ import gradio as gr
104
+
105
+ gr.Interface(
106
+ fn=predecir_con_recomendacion,
107
+ inputs=[
108
+ gr.Slider(18, 65, value=30, label="Edad"),
109
+ gr.Radio(["F", "M"], label="Género"),
110
+ gr.Slider(0, 5, step=1, value=1, label="Número de hijos"),
111
+ gr.Radio(["sí", "no"], label="¿Convive con el agresor?"),
112
+ gr.Radio(["sí", "no"], label="¿Hay consumo de sustancias?"),
113
+ gr.Radio(["sí", "no"], label="¿Tiene apoyo familiar?"),
114
+ gr.Textbox(lines=4, placeholder="Describa aquí el caso de violencia", label="Descripción del caso")
115
+ ],
116
+ outputs=[
117
+ gr.Textbox(label="🛑 Tipo de violencia predicho"),
118
+ gr.Textbox(label="⚠️ Nivel de riesgo"),
119
+ gr.Textbox(label="🧾 Tipo de medida cautelar"),
120
+ gr.Textbox(label="📜 Recomendación legal razonada")
121
+ ],
122
+ title="LEGALFAMI – Asistente Legal con Razonamiento Jurídico",
123
+ description="Este asistente predice el tipo de violencia, nivel de riesgo y tipo de medida cautelar, y sugiere una medida específica del Art. 5 con justificación legal automatizada.",
124
+ theme="default"
125
+ ).launch(debug=True)
codificadores_label_encoder.pkl ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:ad512b489aab1c643491545cf4c83c1d70fca1046be77d14f6e086311be9fe4e
3
+ size 2675
modelo_riesgo.pkl ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:a77a4d0e276b74988acfe154cfafa4c134cd4d0bcb8d899b990b7394d01c5a63
3
+ size 833729
modelo_tipo_medida.pkl ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:660b0a1006f814e7b791653ab6da0a658e914eda1be4b229c1137b794aa8053e
3
+ size 5779049
modelo_tipo_violencia.pkl ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:f7fff6310bd6f3fa5b8666f0fad9bab7afa631e6ca49feda214b64c053d04088
3
+ size 1350153
requirements.txt ADDED
@@ -0,0 +1,7 @@
 
 
 
 
 
 
 
 
1
+ gradio
2
+ transformers
3
+ sentence-transformers
4
+ scikit-learn
5
+ pandas
6
+ numpy
7
+ joblib