|
|
|
"""app.ipynb |
|
|
|
Automatically generated by Colab. |
|
|
|
Original file is located at |
|
https://colab.research.google.com/drive/1e3y3OTjQnNFZ7FLgs2elviYcG7ptj2fI |
|
""" |
|
|
|
from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline |
|
from sentence_transformers import SentenceTransformer, util |
|
import numpy as np |
|
import joblib |
|
import torch |
|
import gradio as gr |
|
from transformers import TextGenerationPipeline |
|
|
|
|
|
modelo_riesgo = joblib.load("modelo_riesgo.pkl") |
|
modelo_violencia = joblib.load("modelo_tipo_violencia.pkl") |
|
modelo_medida = joblib.load("modelo_tipo_medida.pkl") |
|
codificadores = joblib.load("codificadores_label_encoder.pkl") |
|
modelo_vector = SentenceTransformer("Snowflake/snowflake-arctic-embed-xs") |
|
|
|
|
|
model_id = "teknium/OpenHermes-2.5-Mistral-7B" |
|
|
|
tokenizer = AutoTokenizer.from_pretrained(model_id, trust_remote_code=True) |
|
model = AutoModelForCausalLM.from_pretrained( |
|
model_id, |
|
trust_remote_code=True, |
|
torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32, |
|
device_map="auto" |
|
) |
|
|
|
modelo_llm = TextGenerationPipeline( |
|
model=model, |
|
tokenizer=tokenizer, |
|
max_new_tokens=300, |
|
temperature=0.5, |
|
do_sample=True, |
|
) |
|
|
|
|
|
frases_fisica = [ |
|
"Me golpeó con el puño cerrado", "Me pateó", "Me lanzó contra la pared", |
|
"Me estranguló", "Me fracturó una costilla", "Me tiró al piso violentamente" |
|
] |
|
frases_sexual = [ |
|
"Me obligó a tener relaciones sexuales", "Me tocó sin consentimiento", |
|
"Me violó", "Me forzó a tener sexo", "Me agredió sexualmente" |
|
] |
|
embeds_fisica = modelo_vector.encode(frases_fisica) |
|
embeds_sexual = modelo_vector.encode(frases_sexual) |
|
|
|
|
|
def predecir_con_recomendacion(edad, genero, hijos, convivencia_agresor, consumo_sustancias, apoyo_familiar, descripcion): |
|
|
|
vector_tabular = np.array([ |
|
int(edad), |
|
int(hijos), |
|
codificadores["genero"].transform([genero])[0], |
|
0, 0, 0, |
|
codificadores["convivencia_agresor"].transform([convivencia_agresor])[0], |
|
codificadores["consumo_sustancias"].transform([consumo_sustancias])[0], |
|
codificadores["apoyo_familiar"].transform([apoyo_familiar])[0] |
|
]) |
|
|
|
|
|
vector_desc = modelo_vector.encode([descripcion])[0] |
|
entrada = np.concatenate([vector_tabular, vector_desc]) |
|
|
|
|
|
riesgo_cod = modelo_riesgo.predict([entrada])[0] |
|
tipo_violencia_cod = modelo_violencia.predict([entrada])[0] |
|
tipo_medida_cod = modelo_medida.predict([entrada])[0] |
|
|
|
|
|
riesgo = codificadores["riesgo"].inverse_transform([riesgo_cod])[0] |
|
tipo_violencia = codificadores["tipo_violencia"].inverse_transform([tipo_violencia_cod])[0] |
|
tipo_medida = codificadores["tipo_medida"].inverse_transform([tipo_medida_cod])[0] |
|
|
|
|
|
emb_desc = modelo_vector.encode(descripcion) |
|
sim_fisica = max(util.cos_sim(emb_desc, embeds_fisica)[0]) |
|
sim_sexual = max(util.cos_sim(emb_desc, embeds_sexual)[0]) |
|
if sim_fisica > 0.7: |
|
tipo_violencia = "física" |
|
elif sim_sexual > 0.7: |
|
tipo_violencia = "sexual" |
|
|
|
|
|
prompt = f"""[INSTRUCCIÓN] |
|
Como asistente legal, tu tarea es determinar qué medida de protección debe aplicarse en un caso de violencia intrafamiliar, de acuerdo al Artículo 5 de la Ley 575 de 2000 (modificado por la Ley 1257 de 2008 y la Ley 2126 de 2021). |
|
|
|
[CASO] |
|
Tipo de violencia: {tipo_violencia} |
|
Nivel de riesgo: {riesgo} |
|
Tipo de medida cautelar: {tipo_medida} |
|
Descripción del caso: {descripcion} |
|
|
|
[OBJETIVO] |
|
Con base en la descripción del caso y la ley, indica: |
|
- Qué literal(es) del Artículo 5 (a-n) deben aplicarse. |
|
- Justifica legalmente tu elección con argumentos claros y precisos. |
|
|
|
[RESPUESTA] |
|
""" |
|
|
|
respuesta = modelo_llm(prompt, max_new_tokens=350, temperature=0.5)[0]["generated_text"] |
|
razonamiento = respuesta.split("[RESPUESTA]")[-1].strip() |
|
|
|
return tipo_violencia, riesgo, tipo_medida, razonamiento |
|
|
|
|
|
gr.Interface( |
|
fn=predecir_con_recomendacion, |
|
inputs=[ |
|
gr.Slider(18, 65, value=30, label="Edad"), |
|
gr.Radio(["F", "M"], label="Género"), |
|
gr.Slider(0, 5, step=1, value=1, label="Número de hijos"), |
|
gr.Radio(["sí", "no"], label="¿Convive con el agresor?"), |
|
gr.Radio(["sí", "no"], label="¿Hay consumo de sustancias?"), |
|
gr.Radio(["sí", "no"], label="¿Tiene apoyo familiar?"), |
|
gr.Textbox(lines=4, label="Descripción del caso") |
|
], |
|
outputs=[ |
|
gr.Textbox(label="🛑 Tipo de violencia predicho"), |
|
gr.Textbox(label="⚠️ Nivel de riesgo"), |
|
gr.Textbox(label="🧾 Tipo de medida cautelar"), |
|
gr.Textbox(label="📜 Recomendación legal razonada") |
|
], |
|
title="LEGALFAMI – Asistente Legal con Razonamiento Jurídico", |
|
description="Predice tipo de violencia, nivel de riesgo y medida cautelar según Ley 575 Artículo 5, y recomienda la acción legal correspondiente.", |
|
theme="default" |
|
).launch() |