# -*- coding: utf-8 -*- """app.ipynb Automatically generated by Colab. Original file is located at https://colab.research.google.com/drive/1WQ2YqAcXFp-14DglIYkV4rawVDSbyhCe """ from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline from sentence_transformers import SentenceTransformer, util import numpy as np import joblib import torch import gradio as gr from transformers import TextGenerationPipeline # === Cargar modelos entrenados === modelo_riesgo = joblib.load("modelo_riesgo.pkl") modelo_violencia = joblib.load("modelo_tipo_violencia.pkl") modelo_medida = joblib.load("modelo_tipo_medida.pkl") codificadores = joblib.load("codificadores_label_encoder.pkl") modelo_vector = SentenceTransformer("Snowflake/snowflake-arctic-embed-xs") # === Cargar modelo de lenguaje OpenHermes-2.5 === model_id = "teknium/OpenHermes-2.5-Mistral-7B" tokenizer = AutoTokenizer.from_pretrained(model_id, trust_remote_code=True) model = AutoModelForCausalLM.from_pretrained( model_id, trust_remote_code=True, torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32, device_map="auto" ) modelo_llm = TextGenerationPipeline( model=model, tokenizer=tokenizer, max_new_tokens=1000, temperature=0.5, do_sample=True, ) # === Frases prototipo para verificador semántico === frases_fisica = [ "Me golpeó con el puño cerrado", "Me pateó", "Me lanzó contra la pared", "Me estranguló", "Me fracturó una costilla", "Me tiró al piso violentamente" ] frases_sexual = [ "Me obligó a tener relaciones sexuales", "Me tocó sin consentimiento", "Me violó", "Me forzó a tener sexo", "Me agredió sexualmente" ] embeds_fisica = modelo_vector.encode(frases_fisica) embeds_sexual = modelo_vector.encode(frases_sexual) # === Verificador semántico === def verificar_semantico(descripcion): emb_desc = modelo_vector.encode(descripcion) tipos_detectados = [] if max(util.cos_sim(emb_desc, embeds_fisica)[0]) > 0.7: tipos_detectados.append("física") if max(util.cos_sim(emb_desc, embeds_sexual)[0]) > 0.7: tipos_detectados.append("sexual") return tipos_detectados # === FUNCIÓN PRINCIPAL MODIFICADA === def predecir_con_recomendacion(edad, genero, hijos, convivencia_agresor, consumo_sustancias, apoyo_familiar, descripcion): # Codificar variables tabulares vector_tabular = np.array([ int(edad), int(hijos), codificadores["genero"].transform([genero])[0], 0, 0, 0, codificadores["convivencia_agresor"].transform([convivencia_agresor])[0], codificadores["consumo_sustancias"].transform([consumo_sustancias])[0], codificadores["apoyo_familiar"].transform([apoyo_familiar])[0] ]) # Vectorizar descripción vector_desc = modelo_vector.encode([descripcion])[0] entrada = np.concatenate([vector_tabular, vector_desc]) # Modelos clásicos riesgo_cod = modelo_riesgo.predict([entrada])[0] tipo_violencia_cod = modelo_violencia.predict([entrada])[0] tipo_medida_cod = modelo_medida.predict([entrada])[0] # Decodificación riesgo = codificadores["riesgo"].inverse_transform([riesgo_cod])[0] tipo_violencia_pred = codificadores["tipo_violencia"].inverse_transform([tipo_violencia_cod])[0] tipo_medida = codificadores["tipo_medida"].inverse_transform([tipo_medida_cod])[0] # Verificador semántico tipos_semantico = verificar_semantico(descripcion) # Unir modelo + semántico sin duplicados tipos_combinados = list(set([tipo_violencia_pred] + tipos_semantico)) tipos_str = ", ".join(tipos_combinados) # PROMPT legal ajustado con decisión motivada para Comisario prompt = f"""[INSTRUCCIÓN] Eres un Comisario/a de Familia en Colombia. Con base en los hechos relatados, el nivel de riesgo y el tipo de violencia identificado, debes emitir un Auto de Medida Provisional claro, completo y con redacción profesional jurídica. Utiliza la siguiente estructura detallada: 1. **CONSIDERACIONES:** - Realiza un resumen claro y detallado de los hechos narrados por la parte denunciante, destacando las circunstancias de tiempo, modo y lugar. - Analiza el riesgo actual y el contexto familiar con referencias a la Ley 575 de 2000, Ley 1257 de 2008 y Ley 2126 de 2021. - Cita expresamente los literales del Artículo 5 de la Ley 575 de 2000 (letras a-n) que resultan aplicables al caso. - Justifica cada literal aplicado explicando detalladamente las razones jurídicas, la finalidad protectora de la medida y su proporcionalidad frente a los hechos denunciados. 2. **RESUELVE:** - **PRIMERO:** Admitir la solicitud y avocar conocimiento, con mención expresa de la normativa que habilita esta decisión. - **SEGUNDO:** Adoptar las medidas de protección, enumerando cada una de manera individual, describiendo su contenido y fundamento legal. - **TERCERO:** Advertir al presunto agresor sobre las consecuencias legales de incumplir estas medidas, citando expresamente el Artículo 5 parágrafo 3 de la Ley 575 de 2000 y el Artículo 38 de la Ley 1257 de 2008. - **CUARTO:** Disponer que cualquier cambio de domicilio deberá ser informado oportunamente al Juzgado competente, conforme a lo dispuesto en el Artículo 5 de la Ley 575 de 2000. - **QUINTO:** Ordenar, en caso necesario, acompañamiento policial para hacer efectivas las medidas de protección y prevenir nuevos actos de violencia. - **SEXTO:** Citar al presunto agresor a audiencia pública con el fin de tramitar el proceso y resolver sobre la confirmación, modificación o levantamiento de las medidas adoptadas, indicando que su inasistencia no suspende el procedimiento. [DATOS DEL CASO] - Tipos de violencia detectados: {tipos_str} - Nivel de riesgo: {riesgo} - Medida cautelar sugerida: {tipo_medida} - Descripción del caso: {descripcion} [OBJETIVO] Redacta el Auto de Medida Provisional completo siguiendo estrictamente la estructura detallada, con lenguaje jurídico profesional y argumentos amplios que fundamenten cada decisión. Indica expresamente el año de cada ley citada. Limita la respuesta a máximo 600 tokens, priorizando claridad y rigor legal. [RESPUESTA] """ respuesta = modelo_llm(prompt)[0]["generated_text"] razonamiento = respuesta.split("[RESPUESTA]")[-1].strip() return tipos_str, riesgo, tipo_medida, razonamiento # === Interfaz Gradio (sin cambios) === with gr.Blocks(theme=gr.themes.Soft()) as interfaz: gr.Markdown("