Value-Props / tabs /chatbot_tab.py
Demosthene-OR's picture
....
711ffac
raw
history blame
11.1 kB
import streamlit as st # type: ignore
import os
from datetime import datetime
from extra_streamlit_components import tab_bar, TabBarItemData
import io
import base64
from gtts import gTTS
import soundfile as sf
import sounddevice as sd
import numpy as np
import scipy.io.wavfile as wav
import speech_recognition as sr
import time
from sentence_transformers import SentenceTransformer
from translate_app import tr
import getpass
from langchain_mistralai import ChatMistralAI
from langgraph.checkpoint.memory import MemorySaver
from langgraph.graph import START, END, MessagesState, StateGraph
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from typing import Sequence
from langchain_core.messages import BaseMessage, SystemMessage, HumanMessage, AIMessage, trim_messages
from langgraph.graph.message import add_messages
from typing_extensions import Annotated, TypedDict
from dotenv import load_dotenv
import warnings
warnings.filterwarnings('ignore')
title = "Sales coaching"
sidebar_name = "Sales coaching"
dataPath = st.session_state.DataPath
os.environ["LANGCHAIN_TRACING_V2"] = "true"
os.environ["LANGCHAIN_ENDPOINT"]="https://api.smith.langchain.com"
os.environ["LANGCHAIN_HUB_API_URL"]="https://api.smith.langchain.com"
os.environ["LANGCHAIN_PROJECT"] = "Sales Coaching Chatbot"
if st.session_state.Cloud != 0:
load_dotenv()
os.getenv("LANGCHAIN_API_KEY")
os.getenv("MISTRAL_API_KEY")
model = ChatMistralAI(model="mistral-large-latest")
language = "French"
prompt = ChatPromptTemplate.from_messages(
[
(
"system",
"Répond à toutes les questions du mieux possible en {language}.",
),
MessagesPlaceholder(variable_name="messages"),
]
)
class State(TypedDict):
messages: Annotated[Sequence[BaseMessage], add_messages]
language: str
def call_model(state: State):
chain = prompt | model
response = chain.invoke(state)
return {"messages": [response]}
# Define a new graph
workflow = StateGraph(state_schema=State)
# Define the (single) node in the graph
workflow.add_edge(START, "model")
workflow.add_node("model", call_model)
workflow.add_edge("model", END)
# Add memory
memory = MemorySaver()
app = workflow.compile(checkpointer=memory)
# @st.cache_data
def init():
global config,thread_id, context,human_message1,ai_message1,language, app
thread_id = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
config = {"configurable": {"thread_id": thread_id}}
context = """Tu es un Directeur Commercial, mal organisé, d'une entreprise qui commercialise une solution technologique B2B. """
human_message1 = """Je souhaites que nous ayons une conversation verbale entre un commercial de mon entreprise, Marc (moi), et toi que je prospecte.
Mon entreprise propose une solution logicielle pour gérer la proposition de valeur d’entreprises B2B qui commercialises des solutions technologiques.
Les problématiques adressées par ma solution sont:
- Il est difficile pour les startups de concevoir et formaliser une proposition de valeur unique et pertinente
- Il est difficile pour les forces de vente d'articuler clairement les messages de la proposition de valeur
- Il est chronophage pour les scale-ups de former leur forces de ventes sur les évolutions de la proposition de valeur et de ses messages Valeur ajoutée de ma solution
- Augmenter les performances commerciales
- Réduction du cycle de vente
- Accelerer la croissance du chiffre d'affaires
- Concentrer les ressources sur les opportunités qualifiées
- Réduction temps de monté en compétence des nouvelles embauches
- Augmenter le taux de conversion d'affaires gagnées
- Améliorer l'efficacité globale des ventes
- Améliorer l'efficience et la confiance des forces de ventes
- Optimiser les processus commerciaux pour réduire les cycles de vente, fidéliser les clients et augmenter la productivité
- Favoriser le développement personnel des forces de vente
Les cas d’usages adressés par ma solution sont :
- Affiner et modéliser la proposition de valeur
- Décliner les messages marketing & commerciaux
- Former la force de vente sur la proposition de valeur
- Orchestrer les conversations clients
- Partager les retours terrain
- Mettre en oeuvre des meilleures pratiques commerciales
- Identifier et reproduire les messages de vente gagnants
Je suis Marc, le vendeur.
Répond à mes questions en tant que Directeur commercial désorganisé, connaissant mal le concept de proposition de valeur,
et mon équipe de vente n'est pas performante.
Attention: Ce n'est pas toi qui m'aide, c'est moi qui t'aide avec ma solution.
"""
ai_message1 = "J'ai bien compris, je suis un Directeur Commercial prospecté et je réponds seulement à mes questions"
context = st.text_area(label=tr("Contexte:"), value=context)
human_message1 = st.text_area(label=tr("Consigne"), value=human_message1,height=300)
messages = [
SystemMessage(content=context),
HumanMessage(content=human_message1),
AIMessage(content=ai_message1),
HumanMessage(content="")
]
app.invoke(
{"messages": messages, "language": language},
config,
)
'''
st.write("**Contexte:** "+context)
st.write("")
st.write("**Human Message:** "+human_message1)
st.write("")
st.write("**AI Message:** "+ai_message1)
'''
st.write("")
return config, thread_id
# Fonction pour générer et jouer le texte en speech
def play_audio(custom_sentence, Lang_target, speed=1.0):
# Générer le speech avec gTTS
audio_stream_bytesio_src = io.BytesIO()
tts = gTTS(custom_sentence, lang=Lang_target)
# Revenir au début du flux audio
audio_stream_bytesio_src.seek(0)
audio_stream_bytesio_src.truncate(0)
tts.write_to_fp(audio_stream_bytesio_src)
audio_stream_bytesio_src.seek(0)
# Charger l'audio dans un tableau numpy
data, samplerate = sf.read(audio_stream_bytesio_src)
# Modifier la vitesse de lecture en ajustant le taux d'échantillonnage
new_samplerate = int(samplerate * speed)
new_audio_stream_bytesio = io.BytesIO()
# Enregistrer l'audio avec la nouvelle fréquence d'échantillonnage
sf.write(new_audio_stream_bytesio, data, new_samplerate, format='wav')
new_audio_stream_bytesio.seek(0)
# Lire l'audio dans Streamlit
st.audio(new_audio_stream_bytesio, autoplay=True)
def is_silent(data, threshold=0.01):
"""Vérifie si le niveau audio est inférieur à un certain seuil (silence)"""
return np.abs(data).mean() < threshold
def record_audio_until_silence(fs=44100, silence_duration=2):
# st.write("Enregistrement en cours... Parlez maintenant.")
audio_data = []
silence_start = None
while True:
# Enregistre un petit bout de son
data = sd.rec(int(fs * 2), samplerate=fs, channels=1, dtype='float32')
sd.wait()
# Ajoute le morceau au tableau d'audio
audio_data.append(data)
# Vérifie si le morceau est en silence
if is_silent(data):
if silence_start is None:
silence_start = time.time() # Démarre le chronomètre du silence
elif time.time() - silence_start > silence_duration:
print("Silence détecté. Fin de l'enregistrement.")
break # Arrête l'enregistrement si le silence dure suffisamment longtemps
else:
silence_start = None # Réinitialise le chronomètre si le son est détecté
# Convertit la liste de tableaux en un seul tableau NumPy
audio_data = np.concatenate(audio_data)
audio_data = np.int16(audio_data * 32767)
# Sauvegarde le fichier audio en format WAV
wav.write("enregistrement.wav", fs, audio_data)
st.write("Enregistrement sauvegardé")
def convert_audio_to_text(filename):
recognizer = sr.Recognizer()
with sr.AudioFile(filename) as source:
audio = recognizer.record(source) # Lit le fichier audio
try:
# Utilise l'API Google pour la reconnaissance vocale
text = recognizer.recognize_google(audio, language='fr-FR')
return text
except sr.UnknownValueError:
st.write("Google Speech Recognition n'a pas pu comprendre l'audio.")
return ""
except sr.RequestError as e:
st.write(f"Erreur avec le service Google Speech Recognition; {e}")
return ""
def run():
global thread_id, config
st.write("")
st.write("")
st.title(tr(title))
chosen_id = tab_bar(data=[
TabBarItemData(id="tab1", title=tr("Initialisation"), description=tr("d'une nouvelle conversation")),
TabBarItemData(id="tab2", title=tr("Conversation"), description=tr("avec le prospect"))],
default="tab1")
if (chosen_id == "tab1"):
config,thread_id = init()
query = ""
st.button(label=tr("Validez"), type="primary")
else:
try:
config
# On ne fait rien
except NameError:
config,thread_id = init()
st.write("**thread_id:** "+thread_id)
# query = st.text_area(label=tr("Vendeur:"), value="")
query = ""
if st.button(label=tr("Cliquer pour enregistrer"), type="primary"):
record_audio_until_silence() # Enregistre jusqu'à ce qu'il y ait 2 secondes de silence
query = convert_audio_to_text("enregistrement.wav") # Convertit l'audio en texte
st.write("**Vendeur :** "+query)
# st.button(label=tr("Validez"), type="primary")
input_messages = [HumanMessage(query)]
if query != "":
output = app.invoke(
{"messages": input_messages, "language": language},
config,
)
st.write("**Prospect :** "+output["messages"][-1].content)
# Fonction pour générer et jouer le texte en speech
# Prononciation de la réponse
custom_sentence = output["messages"][-1].content
Lang_target = "fr" # Exemple de langue détectée
# Joue l'audio
play_audio(custom_sentence, Lang_target, 1)
'''
# Créer un espace réservé pour afficher les tokens
placeholder = st.empty()
for chunk, metadata in app.stream(
{"messages": input_messages, "language": language},
config,
stream_mode="messages",
):
if isinstance(chunk, AIMessage): # Filter to just model responses
# st.markdown("<span style='white-space: nowrap;'>"+"/"+chunk.content+"/"+"</span>", unsafe_allow_html=True)
placeholder.markdown(f"<p style='display: inline;'>{chunk.content}</p>", unsafe_allow_html=True)
'''
st.write("")
st.write("")
st.write("")
st.write("")