Spaces:

JoachimVC
/

gaia-enhanced-agent

Running

File size: 7,382 Bytes

9a6a4dc

#!/usr/bin/env python3
"""
Demonstration of the response_formatter.py utility.

This script shows how to integrate the ResponseFormatter with BasicAgent
to ensure HF evaluation format compliance.
"""

import sys
import os
sys.path.append(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))

from utils.response_formatter import (
    ResponseFormatter, ResponseType, FormatStandard, FormatConfig,
    format_for_hf_evaluation, validate_answer_format, BasicAgentFormatter
)


def demonstrate_basic_formatting():
    """Demonstrate basic response formatting capabilities."""
    print("🔧 Basic Response Formatting Demo")
    print("=" * 50)
    
    # Sample problematic responses that need formatting
    test_responses = [
        "FINAL ANSWER: The capital of France is Paris",
        "**RESULT:** 25 + 37 = 62",
        "## Answer\n\nThe temperature is 212°F",
        "`Answer:` The solar system has 8 planets",
        "CONCLUSION: Machine learning is a subset of AI",
    ]
    
    for response in test_responses:
        formatted = format_for_hf_evaluation(response)
        print(f"📝 Original: '{response}'")
        print(f"✅ Formatted: '{formatted}'")
        print()


def demonstrate_validation():
    """Demonstrate response validation capabilities."""
    print("🔍 Response Validation Demo")
    print("=" * 50)
    
    test_cases = [
        ("Paris", "Valid simple answer"),
        ("FINAL ANSWER: 42", "Contains forbidden prefix"),
        ("The result is 212 degrees Fahrenheit", "Good quality with units"),
        ("", "Empty answer"),
        ("I don't know", "Uncertain response"),
    ]
    
    for answer, description in test_cases:
        is_valid, issues, quality_score = validate_answer_format(answer)
        print(f"📝 Testing: {description}")
        print(f"   Answer: '{answer}'")
        print(f"   Valid: {is_valid}")
        print(f"   Quality Score: {quality_score:.2f}")
        if issues:
            print(f"   Issues: {', '.join(issues)}")
        print()


def demonstrate_agent_integration():
    """Demonstrate BasicAgent integration."""
    print("🤖 BasicAgent Integration Demo")
    print("=" * 50)
    
    agent_formatter = BasicAgentFormatter()
    
    # Simulate responses from BasicAgent with metadata
    scenarios = [
        {
            "answer": "FINAL ANSWER: 25 + 37 = 62",
            "metadata": {"question_type": "mathematical"},
            "description": "Mathematical calculation"
        },
        {
            "answer": "**Research Result:** Paris is the capital of France because it's the political center.",
            "metadata": {"use_web_search": True},
            "description": "Web research response"
        },
        {
            "answer": "ANSWER: The human heart has four chambers.",
            "metadata": {"question_type": "simple_factual"},
            "description": "Simple factual answer"
        }
    ]
    
    for scenario in scenarios:
        formatted = agent_formatter.format_agent_response(
            scenario["answer"], 
            scenario["metadata"]
        )
        print(f"📝 Scenario: {scenario['description']}")
        print(f"   Original: '{scenario['answer']}'")
        print(f"   Metadata: {scenario['metadata']}")
        print(f"   Formatted: '{formatted}'")
        print()


def demonstrate_advanced_features():
    """Demonstrate advanced formatting features."""
    print("⚡ Advanced Features Demo")
    print("=" * 50)
    
    # Create custom formatter with specific configuration
    custom_config = FormatConfig(
        format_standard=FormatStandard.HF_EVALUATION,
        remove_markdown=True,
        remove_prefixes=True,
        max_length=1000,
        ensure_period=True
    )
    
    formatter = ResponseFormatter(custom_config)
    
    # Batch processing demo
    answers = [
        "FINAL ANSWER: The speed of light is 299,792,458 m/s",
        "**Result:** Converting 100°C to Fahrenheit: (100 × 9/5) + 32 = 212°F",
        "## Conclusion\n\nThe Earth orbits the Sun",
        "ANSWER: Machine learning algorithms learn from data",
    ]
    
    response_types = [
        ResponseType.SIMPLE_ANSWER,
        ResponseType.CALCULATION,
        ResponseType.SIMPLE_ANSWER,
        ResponseType.EXPLANATION,
    ]
    
    print("📊 Batch Processing Results:")
    results = formatter.batch_format(answers, response_types)
    
    for i, result in enumerate(results):
        print(f"\n{i+1}. Original: '{answers[i][:50]}...'")
        print(f"   Formatted: '{result.answer}'")
        print(f"   Type: {result.response_type.value}")
        print(f"   Valid: {result.validation.is_valid}")
        print(f"   Quality: {result.validation.quality_score:.2f}")
    
    # Statistics demo
    stats = formatter.get_format_statistics(results)
    print(f"\n📈 Statistics:")
    print(f"   Total Responses: {stats['total_responses']}")
    print(f"   Valid Responses: {stats['valid_responses']}")
    print(f"   Validity Rate: {stats['validity_rate']:.2f}")
    print(f"   Avg Quality Score: {stats['average_quality_score']:.2f}")


def demonstrate_integration_example():
    """Show how to integrate with existing BasicAgent code."""
    print("🔗 Integration Example")
    print("=" * 50)
    
    # Example of how to modify BasicAgent to use ResponseFormatter
    example_code = '''
# In your BasicAgent class:
from utils.response_formatter import BasicAgentFormatter

class BasicAgent:
    def __init__(self):
        self.response_formatter = BasicAgentFormatter()
        # ... other initialization
    
    def __call__(self, question):
        # ... existing processing logic
        raw_answer = self.process_question(question)
        
        # Format for HF evaluation compliance
        metadata = {
            "question_type": self.classify_question(question),
            "use_web_search": self.used_web_search,
        }
        
        formatted_answer = self.response_formatter.format_agent_response(
            raw_answer, metadata
        )
        
        return formatted_answer
    '''
    
    print("📝 Integration Code Example:")
    print(example_code)
    
    print("\n✅ Benefits of Integration:")
    benefits = [
        "✓ Automatic removal of 'FINAL ANSWER:' prefixes",
        "✓ Clean markdown formatting removal",
        "✓ Response quality validation and scoring",
        "✓ Consistent HF evaluation format compliance",
        "✓ Comprehensive logging and debugging support",
        "✓ Configurable formatting options",
        "✓ Batch processing capabilities for testing"
    ]
    
    for benefit in benefits:
        print(f"   {benefit}")


if __name__ == "__main__":
    print("🧪 Response Formatter Comprehensive Demo")
    print("=" * 60)
    print()
    
    demonstrate_basic_formatting()
    print()
    
    demonstrate_validation()
    print()
    
    demonstrate_agent_integration()
    print()
    
    demonstrate_advanced_features()
    print()
    
    demonstrate_integration_example()
    print()
    
    print("🎉 Demo completed! The ResponseFormatter is ready for Phase 2A integration.")
    print("📁 Files created:")
    print("   - utils/response_formatter.py (Main utility)")
    print("   - utils/test_response_formatter.py (Test suite)")
    print("   - utils/demo_response_formatter.py (This demo)")