import os
import random
import pathlib

import numpy as np
from PIL import Image
import pydiffvg
import torch
import torch.nn as nn

from libs.modules.edge_map.DoG import XDoG
from methods.diffvg_warp.parse_svg import svg_to_scene


class Painter(nn.Module):

    def __init__(
            self,
            args,
            num_strokes=4,
            num_segments=4,
            imsize=224,
            device=None,
            target_im=None,
            attention_map=None,
            mask=None,
            results_base=None,
    ):
        super(Painter, self).__init__()

        self.args = args
        self.device = device

        self.num_paths = num_strokes
        self.num_segments = num_segments
        self.width = args.width
        self.max_width = args.max_width
        self.optim_width = args.optim_width
        self.control_points_per_seg = args.control_points_per_seg
        self.optim_rgba = args.optim_rgba
        self.optim_alpha = args.optim_opacity
        self.num_stages = args.num_stages
        self.softmax_temp = args.softmax_temp

        self.shapes = []
        self.shape_groups = []
        self.num_control_points = 0
        self.canvas_width, self.canvas_height = imsize, imsize
        self.points_vars = []
        self.points_vars_gt = []
        self.stroke_width_vars = []
        self.color_vars = []
        self.color_vars_threshold = args.color_vars_threshold

        self.results_base = results_base[:results_base.find('stage=' + str(self.args.run_stage))] + 'stage=0'
        self.path_svg = args.path_svg
        self.strokes_per_stage = self.num_paths
        self.optimize_flag = []

        # attention related for strokes initialisation
        self.attention_init = args.attention_init
        self.xdog_intersec = args.xdog_intersec

        self.image2clip_input = target_im
        self.mask = mask
        self.attention_map = attention_map if self.attention_init else None

        self.thresh = self.set_attention_threshold_map() if self.attention_init else None
        self.strokes_counter = 0  # counts the number of calls to "get_path"

    def init_image(self, stage=0):
        if stage > 0:
            # Noting: if multi stages training than add new strokes on existing ones
            # don't optimize on previous strokes
            self.optimize_flag = [False for i in range(len(self.shapes))]
            for i in range(self.strokes_per_stage):
                stroke_color = torch.tensor([0.0, 0.0, 0.0, 1.0])
                path = self.get_path()
                self.shapes.append(path)
                path_group = pydiffvg.ShapeGroup(shape_ids=torch.tensor([len(self.shapes) - 1]),
                                                 fill_color=None,
                                                 stroke_color=stroke_color)
                self.shape_groups.append(path_group)
                self.optimize_flag.append(True)
        else:
            num_paths_exists = 0
            if self.args.run_stage > 0:
                assert self.path_svg != "" and self.path_svg is not None and pathlib.Path(self.path_svg).exists(), self.path_svg
                print(f"-> init svg from `{self.path_svg}` ...")

                self.canvas_width, self.canvas_height, self.shapes, self.shape_groups = self.load_svg(self.path_svg)
                # if you want to add more strokes to existing ones and optimize on all of them
                num_paths_exists = len(self.shapes)
            else:
                assert self.path_svg == "" or self.path_svg is None

            for i in range(num_paths_exists, self.num_paths):
                stroke_color = torch.tensor([0.0, 0.0, 0.0, 1.0])
                path = self.get_path()
                self.shapes.append(path)
                path_group = pydiffvg.ShapeGroup(shape_ids=torch.tensor([len(self.shapes) - 1]),
                                                 fill_color=None,
                                                 stroke_color=stroke_color)
                self.shape_groups.append(path_group)

            if self.args.run_stage > 0 and self.args.vector_local_edit:
                self.optimize_flag = self.set_local_edit_strokes()
            else:
                self.optimize_flag = [True for i in range(len(self.shapes))]

        img = self.render_warp()
        img = img[:, :, 3:4] * img[:, :, :3] + \
              torch.ones(img.shape[0], img.shape[1], 3, device=self.device) * (1 - img[:, :, 3:4])
        img = img[:, :, :3]
        img = img.unsqueeze(0)  # convert img from HWC to NCHW
        img = img.permute(0, 3, 1, 2).to(self.device)  # NHWC -> NCHW

        return img

    def set_local_edit_strokes(self):
        local_edit_mask_img_path = os.path.join(self.results_base,
                                                'cross_attn_local_edit_' + str(self.args.vector_local_edit_attn_res) + "-" + str(self.args.run_stage) + '.png')
        local_edit_mask = Image.open(local_edit_mask_img_path).convert('RGB')
        local_edit_mask = np.array(local_edit_mask, dtype=np.float32)[:, :, 0]
        local_edit_mask /= 255.0  # (224, 224), [0-BG, 1-FG]

        optimize_flag = [False for _ in range(len(self.shapes))]

        stroke_imgs = self.render_warp2()
        stroke_imgs = torch.stack(stroke_imgs, dim=0)  # (N_strokes, H, W, 4)

        opacity = stroke_imgs[:, :, :, 3:4]  # (N_strokes, H, W, 1)
        stroke_imgs = opacity * stroke_imgs[:, :, :, :3] + \
              (1 - opacity) * torch.ones(stroke_imgs.shape[0], stroke_imgs.shape[1], stroke_imgs.shape[2], 3, device=self.device)
        stroke_imgs = stroke_imgs.cpu().data.numpy()[:, :, :, 0]  # (N_strokes, H, W), [0.0, 1.0]

        for si in range(len(stroke_imgs)):
            stroke_img = 1. - stroke_imgs[si]  # (H, W), [0.0-BG, 1.0-stroke]
            stroke_mask = stroke_img > 0  # (H, W), [0.0-BG, 1.0-stroke]
            union = stroke_mask * local_edit_mask

            ## version-1
            # valid = np.sum(union) > 0

            ## version-2
            valid = False
            if np.sum(stroke_mask) > 0 and (np.sum(union) / np.sum(stroke_mask)) >= 0.5:
                valid = True

            if valid:
                optimize_flag[si] = True

        return optimize_flag

    def get_image(self):
        img = self.render_warp()

        opacity = img[:, :, 3:4]
        img = opacity * img[:, :, :3] + torch.ones(img.shape[0], img.shape[1], 3, device=self.device) * (1 - opacity)
        img = img[:, :, :3]
        img = img.unsqueeze(0)  # convert img from HWC to NCHW
        img = img.permute(0, 3, 1, 2).to(self.device)  # NHWC -> NCHW
        return img

    def get_path(self):
        self.num_control_points = torch.zeros(self.num_segments, dtype=torch.int32) + (self.control_points_per_seg - 2)
        points = []
        p0 = self.inds_normalised[self.strokes_counter] if self.attention_init else (random.random(), random.random())
        points.append(p0)

        for j in range(self.num_segments):
            radius = 0.05
            for k in range(self.control_points_per_seg - 1):
                p1 = (p0[0] + radius * (random.random() - 0.5), p0[1] + radius * (random.random() - 0.5))
                points.append(p1)
                p0 = p1
        points = torch.tensor(points).to(self.device)
        points[:, 0] *= self.canvas_width
        points[:, 1] *= self.canvas_height

        path = pydiffvg.Path(num_control_points=self.num_control_points,
                             points=points,
                             stroke_width=torch.tensor(self.width),
                             is_closed=False)
        self.strokes_counter += 1
        return path

    def clip_curve_shape(self):
        if self.optim_width:
            for path in self.shapes:
                path.stroke_width.data.clamp_(1.0, self.max_width)
        if self.optim_rgba:
            for group in self.shape_groups:
                group.stroke_color.data.clamp_(0.0, 1.0)
        else:
            if self.optim_alpha:
                for group in self.shape_groups:
                    # group.stroke_color.data: RGBA
                    group.stroke_color.data[:3].clamp_(0., 0.)  # to force black stroke
                    group.stroke_color.data[-1].clamp_(0., 1.)  # opacity

    def path_pruning(self):
        # stroke pruning
        for group in self.shape_groups:
            group.stroke_color.data[-1] = (group.stroke_color.data[-1] >= self.color_vars_threshold).float()

    def render_warp(self):
        self.clip_curve_shape()

        scene_args = pydiffvg.RenderFunction.serialize_scene(
            self.canvas_width, self.canvas_height, self.shapes, self.shape_groups
        )
        _render = pydiffvg.RenderFunction.apply
        img = _render(self.canvas_width,  # width
                      self.canvas_height,  # height
                      2,  # num_samples_x
                      2,  # num_samples_y
                      0,  # seed
                      None,
                      *scene_args)
        return img

    def render_warp2(self):
        self.clip_curve_shape()

        stroke_imgs = []
        for si, shape_stroke in enumerate(self.shapes):
            shapes = [shape_stroke]

            path_group = pydiffvg.ShapeGroup(shape_ids=torch.tensor([0]),
                                             fill_color=None,
                                             stroke_color=self.shape_groups[si].stroke_color)
            shape_groups = [path_group]

            scene_args = pydiffvg.RenderFunction.serialize_scene(
                self.canvas_width, self.canvas_height, shapes, shape_groups
            )
            _render = pydiffvg.RenderFunction.apply
            img = _render(self.canvas_width,  # width
                          self.canvas_height,  # height
                          2,  # num_samples_x
                          2,  # num_samples_y
                          0,  # seed
                          None,
                          *scene_args)
            stroke_imgs.append(img)
        return stroke_imgs

    def set_points_parameters(self):
        # stoke`s location optimization
        self.points_vars = []
        self.points_vars_gt = []
        for i, path in enumerate(self.shapes):
            path_points_gt = torch.clone(path.points)
            path_points_gt.requires_grad = False
            self.points_vars_gt.append(path_points_gt)
            if self.optimize_flag[i]:
                path.points.requires_grad = True
                self.points_vars.append(path.points)
            else:
                path.points.requires_grad = False

    def get_points_params(self):
        return self.points_vars

    def get_points_params_gt(self):
        return self.points_vars_gt

    def set_width_parameters(self):
        # stroke`s  width optimization
        self.stroke_width_vars = []
        for i, path in enumerate(self.shapes):
            if self.optimize_flag[i]:
                path.stroke_width.requires_grad = True
                self.stroke_width_vars.append(path.stroke_width)

    def get_width_parameters(self):
        return self.stroke_width_vars

    def set_color_parameters(self):
        # for storkes' color optimization (opacity)
        self.color_vars = []
        for i, group in enumerate(self.shape_groups):
            if self.optimize_flag[i]:
                group.stroke_color.requires_grad = True
                self.color_vars.append(group.stroke_color)
            else:
                group.stroke_color.requires_grad = False

    def get_color_parameters(self):
        return self.color_vars

    def save_svg(self, output_dir, fname):
        pydiffvg.save_svg(f'{output_dir}/{fname}.svg',
                          self.canvas_width,
                          self.canvas_height,
                          self.shapes,
                          self.shape_groups)

    def load_svg(self, path_svg):
        canvas_width, canvas_height, shapes, shape_groups = svg_to_scene(path_svg)
        return canvas_width, canvas_height, shapes, shape_groups

    @staticmethod
    def softmax(x, tau=0.2):
        e_x = np.exp(x / tau)
        return e_x / e_x.sum()

    def set_inds_ldm(self):
        attn_map = (self.attention_map - self.attention_map.min()) / \
                   (self.attention_map.max() - self.attention_map.min())

        if self.xdog_intersec:
            xdog = XDoG(k=10)
            im_xdog = xdog(self.image2clip_input[0].permute(1, 2, 0).cpu().numpy())
            print(f"use XDoG, shape: {im_xdog.shape}")
            intersec_map = (1 - im_xdog) * attn_map
            attn_map = intersec_map

        attn_map_soft = np.copy(attn_map)
        attn_map_soft[attn_map > 0] = self.softmax(attn_map[attn_map > 0], tau=self.softmax_temp)

        # select points
        k = self.num_stages * self.num_paths
        self.inds = np.random.choice(range(attn_map.flatten().shape[0]),
                                     size=k,
                                     replace=False,
                                     p=attn_map_soft.flatten())
        self.inds = np.array(np.unravel_index(self.inds, attn_map.shape)).T

        self.inds_normalised = np.zeros(self.inds.shape)
        self.inds_normalised[:, 0] = self.inds[:, 1] / self.canvas_width
        self.inds_normalised[:, 1] = self.inds[:, 0] / self.canvas_height
        self.inds_normalised = self.inds_normalised.tolist()
        return attn_map_soft

    def set_attention_threshold_map(self):
        return self.set_inds_ldm()

    def get_attn(self):
        return self.attention_map

    def get_thresh(self):
        return self.thresh

    def get_inds(self):
        return self.inds

    def get_mask(self):
        return self.mask


class SketchPainterOptimizer:

    def __init__(
            self,
            renderer: nn.Module,
            points_lr: float,
            optim_alpha: bool,
            optim_rgba: bool,
            color_lr: float,
            optim_width: bool,
            width_lr: float
    ):
        self.renderer = renderer

        self.points_lr = points_lr
        self.optim_color = optim_alpha or optim_rgba
        self.color_lr = color_lr
        self.optim_width = optim_width
        self.width_lr = width_lr

        self.points_optimizer, self.width_optimizer, self.color_optimizer = None, None, None

    def init_optimizers(self):
        self.renderer.set_points_parameters()
        self.points_optimizer = torch.optim.Adam(self.renderer.get_points_params(), lr=self.points_lr)
        if self.optim_color:
            self.renderer.set_color_parameters()
            self.color_optimizer = torch.optim.Adam(self.renderer.get_color_parameters(), lr=self.color_lr)
        if self.optim_width:
            self.renderer.set_width_parameters()
            self.width_optimizer = torch.optim.Adam(self.renderer.get_width_parameters(), lr=self.width_lr)

    def update_lr(self, step, base_lr, decay_steps=(500, 750)):
        if step % decay_steps[0] == 0 and step > 0:
            for param_group in self.points_optimizer.param_groups:
                param_group['lr'] = base_lr * 0.4
        if step % decay_steps[1] == 0 and step > 0:
            for param_group in self.points_optimizer.param_groups:
                param_group['lr'] = base_lr * 0.1

    def zero_grad_(self):
        self.points_optimizer.zero_grad()
        if self.optim_color:
            self.color_optimizer.zero_grad()
        if self.optim_width:
            self.width_optimizer.zero_grad()

    def step_(self):
        self.points_optimizer.step()
        if self.optim_color:
            self.color_optimizer.step()
        if self.optim_width:
            self.width_optimizer.step()

    def get_lr(self):
        return self.points_optimizer.param_groups[0]['lr']