Spaces:

Demosthene-OR
/

Value-Props

Sleeping

App Files Files Community

Value-Props / tabs /chatbot_tab.py

Demosthene-OR

....

711ffac 10 months ago

raw

history blame

11.1 kB

	import streamlit as st # type: ignore
	import os
	from datetime import datetime
	from extra_streamlit_components import tab_bar, TabBarItemData
	import io
	import base64
	from gtts import gTTS
	import soundfile as sf
	import sounddevice as sd
	import numpy as np
	import scipy.io.wavfile as wav
	import speech_recognition as sr
	import time
	from sentence_transformers import SentenceTransformer
	from translate_app import tr
	import getpass
	from langchain_mistralai import ChatMistralAI
	from langgraph.checkpoint.memory import MemorySaver
	from langgraph.graph import START, END, MessagesState, StateGraph
	from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
	from typing import Sequence
	from langchain_core.messages import BaseMessage, SystemMessage, HumanMessage, AIMessage, trim_messages
	from langgraph.graph.message import add_messages
	from typing_extensions import Annotated, TypedDict
	from dotenv import load_dotenv

	import warnings
	warnings.filterwarnings('ignore')

	title = "Sales coaching"
	sidebar_name = "Sales coaching"
	dataPath = st.session_state.DataPath

	os.environ["LANGCHAIN_TRACING_V2"] = "true"
	os.environ["LANGCHAIN_ENDPOINT"]="https://api.smith.langchain.com"
	os.environ["LANGCHAIN_HUB_API_URL"]="https://api.smith.langchain.com"
	os.environ["LANGCHAIN_PROJECT"] = "Sales Coaching Chatbot"
	if st.session_state.Cloud != 0:
	load_dotenv()
	os.getenv("LANGCHAIN_API_KEY")
	os.getenv("MISTRAL_API_KEY")




	model = ChatMistralAI(model="mistral-large-latest")


	language = "French"
	prompt = ChatPromptTemplate.from_messages(
	[
	(
	"system",
	"Répond à toutes les questions du mieux possible en {language}.",
	),
	MessagesPlaceholder(variable_name="messages"),
	]
	)

	class State(TypedDict):
	messages: Annotated[Sequence[BaseMessage], add_messages]
	language: str

	def call_model(state: State):
	chain = prompt \| model
	response = chain.invoke(state)
	return {"messages": [response]}

	# Define a new graph
	workflow = StateGraph(state_schema=State)

	# Define the (single) node in the graph
	workflow.add_edge(START, "model")
	workflow.add_node("model", call_model)
	workflow.add_edge("model", END)

	# Add memory
	memory = MemorySaver()
	app = workflow.compile(checkpointer=memory)

	# @st.cache_data
	def init():
	global config,thread_id, context,human_message1,ai_message1,language, app

	thread_id = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
	config = {"configurable": {"thread_id": thread_id}}

	context = """Tu es un Directeur Commercial, mal organisé, d'une entreprise qui commercialise une solution technologique B2B. """
	human_message1 = """Je souhaites que nous ayons une conversation verbale entre un commercial de mon entreprise, Marc (moi), et toi que je prospecte.
	Mon entreprise propose une solution logicielle pour gérer la proposition de valeur d’entreprises B2B qui commercialises des solutions technologiques.

	Les problématiques adressées par ma solution sont:
	- Il est difficile pour les startups de concevoir et formaliser une proposition de valeur unique et pertinente
	- Il est difficile pour les forces de vente d'articuler clairement les messages de la proposition de valeur
	- Il est chronophage pour les scale-ups de former leur forces de ventes sur les évolutions de la proposition de valeur et de ses messages Valeur ajoutée de ma solution
	- Augmenter les performances commerciales
	- Réduction du cycle de vente
	- Accelerer la croissance du chiffre d'affaires
	- Concentrer les ressources sur les opportunités qualifiées
	- Réduction temps de monté en compétence des nouvelles embauches
	- Augmenter le taux de conversion d'affaires gagnées
	- Améliorer l'efficacité globale des ventes
	- Améliorer l'efficience et la confiance des forces de ventes
	- Optimiser les processus commerciaux pour réduire les cycles de vente, fidéliser les clients et augmenter la productivité
	- Favoriser le développement personnel des forces de vente

	Les cas d’usages adressés par ma solution sont :
	- Affiner et modéliser la proposition de valeur
	- Décliner les messages marketing & commerciaux
	- Former la force de vente sur la proposition de valeur
	- Orchestrer les conversations clients
	- Partager les retours terrain
	- Mettre en oeuvre des meilleures pratiques commerciales
	- Identifier et reproduire les messages de vente gagnants

	Je suis Marc, le vendeur.
	Répond à mes questions en tant que Directeur commercial désorganisé, connaissant mal le concept de proposition de valeur,
	et mon équipe de vente n'est pas performante.

	Attention: Ce n'est pas toi qui m'aide, c'est moi qui t'aide avec ma solution.
	"""
	ai_message1 = "J'ai bien compris, je suis un Directeur Commercial prospecté et je réponds seulement à mes questions"

	context = st.text_area(label=tr("Contexte:"), value=context)
	human_message1 = st.text_area(label=tr("Consigne"), value=human_message1,height=300)
	messages = [
	SystemMessage(content=context),
	HumanMessage(content=human_message1),
	AIMessage(content=ai_message1),
	HumanMessage(content="")
	]



	app.invoke(
	{"messages": messages, "language": language},
	config,
	)
	'''
	st.write("Contexte: "+context)
	st.write("")
	st.write("Human Message: "+human_message1)
	st.write("")
	st.write("AI Message: "+ai_message1)
	'''
	st.write("")
	return config, thread_id

	# Fonction pour générer et jouer le texte en speech
	def play_audio(custom_sentence, Lang_target, speed=1.0):
	# Générer le speech avec gTTS
	audio_stream_bytesio_src = io.BytesIO()
	tts = gTTS(custom_sentence, lang=Lang_target)

	# Revenir au début du flux audio
	audio_stream_bytesio_src.seek(0)
	audio_stream_bytesio_src.truncate(0)

	tts.write_to_fp(audio_stream_bytesio_src)

	audio_stream_bytesio_src.seek(0)

	# Charger l'audio dans un tableau numpy
	data, samplerate = sf.read(audio_stream_bytesio_src)

	# Modifier la vitesse de lecture en ajustant le taux d'échantillonnage
	new_samplerate = int(samplerate * speed)
	new_audio_stream_bytesio = io.BytesIO()

	# Enregistrer l'audio avec la nouvelle fréquence d'échantillonnage
	sf.write(new_audio_stream_bytesio, data, new_samplerate, format='wav')
	new_audio_stream_bytesio.seek(0)

	# Lire l'audio dans Streamlit
	st.audio(new_audio_stream_bytesio, autoplay=True)

	def is_silent(data, threshold=0.01):
	"""Vérifie si le niveau audio est inférieur à un certain seuil (silence)"""
	return np.abs(data).mean() < threshold

	def record_audio_until_silence(fs=44100, silence_duration=2):
	# st.write("Enregistrement en cours... Parlez maintenant.")
	audio_data = []
	silence_start = None

	while True:
	# Enregistre un petit bout de son
	data = sd.rec(int(fs * 2), samplerate=fs, channels=1, dtype='float32')
	sd.wait()

	# Ajoute le morceau au tableau d'audio
	audio_data.append(data)

	# Vérifie si le morceau est en silence
	if is_silent(data):
	if silence_start is None:
	silence_start = time.time() # Démarre le chronomètre du silence
	elif time.time() - silence_start > silence_duration:
	print("Silence détecté. Fin de l'enregistrement.")
	break # Arrête l'enregistrement si le silence dure suffisamment longtemps
	else:
	silence_start = None # Réinitialise le chronomètre si le son est détecté

	# Convertit la liste de tableaux en un seul tableau NumPy
	audio_data = np.concatenate(audio_data)
	audio_data = np.int16(audio_data * 32767)

	# Sauvegarde le fichier audio en format WAV
	wav.write("enregistrement.wav", fs, audio_data)
	st.write("Enregistrement sauvegardé")

	def convert_audio_to_text(filename):
	recognizer = sr.Recognizer()
	with sr.AudioFile(filename) as source:
	audio = recognizer.record(source) # Lit le fichier audio

	try:
	# Utilise l'API Google pour la reconnaissance vocale
	text = recognizer.recognize_google(audio, language='fr-FR')
	return text
	except sr.UnknownValueError:
	st.write("Google Speech Recognition n'a pas pu comprendre l'audio.")
	return ""
	except sr.RequestError as e:
	st.write(f"Erreur avec le service Google Speech Recognition; {e}")
	return ""


	def run():
	global thread_id, config

	st.write("")
	st.write("")
	st.title(tr(title))

	chosen_id = tab_bar(data=[
	TabBarItemData(id="tab1", title=tr("Initialisation"), description=tr("d'une nouvelle conversation")),
	TabBarItemData(id="tab2", title=tr("Conversation"), description=tr("avec le prospect"))],
	default="tab1")


	if (chosen_id == "tab1"):
	config,thread_id = init()
	query = ""
	st.button(label=tr("Validez"), type="primary")
	else:
	try:
	config
	# On ne fait rien
	except NameError:
	config,thread_id = init()

	st.write("thread_id: "+thread_id)
	# query = st.text_area(label=tr("Vendeur:"), value="")
	query = ""
	if st.button(label=tr("Cliquer pour enregistrer"), type="primary"):
	record_audio_until_silence() # Enregistre jusqu'à ce qu'il y ait 2 secondes de silence
	query = convert_audio_to_text("enregistrement.wav") # Convertit l'audio en texte
	st.write("Vendeur : "+query)
	# st.button(label=tr("Validez"), type="primary")
	input_messages = [HumanMessage(query)]

	if query != "":
	output = app.invoke(
	{"messages": input_messages, "language": language},
	config,
	)
	st.write("Prospect : "+output["messages"][-1].content)
	# Fonction pour générer et jouer le texte en speech


	# Prononciation de la réponse
	custom_sentence = output["messages"][-1].content
	Lang_target = "fr" # Exemple de langue détectée
	# Joue l'audio
	play_audio(custom_sentence, Lang_target, 1)


	'''
	# Créer un espace réservé pour afficher les tokens
	placeholder = st.empty()

	for chunk, metadata in app.stream(
	{"messages": input_messages, "language": language},
	config,
	stream_mode="messages",
	):
	if isinstance(chunk, AIMessage): # Filter to just model responses
	# st.markdown("<span style='white-space: nowrap;'>"+"/"+chunk.content+"/"+"</span>", unsafe_allow_html=True)
	placeholder.markdown(f"<p style='display: inline;'>{chunk.content}</p>", unsafe_allow_html=True)
	'''
	st.write("")
	st.write("")
	st.write("")
	st.write("")