Source code for torchwrench.nn.functional.segments

#!/usr/bin/env python
# -*- coding: utf-8 -*-

from typing import List, Optional, Tuple, Union

import torch
from torch import Tensor

from torchwrench.core.make import DeviceLike, as_device
from torchwrench.nn import functional as F
from torchwrench.nn.functional.padding import pad_and_stack_rec, pad_dim
from torchwrench.types import BoolTensor, LongTensor



[docs]
def activity_to_segments(x: Tensor) -> LongTensor:
    """Extracts segments start and end positions from a boolean activity/mask tensor.

    Example 1
    ----------
    >>> x = torch.as_tensor([0, 1, 1, 0, 0, 1, 1, 1, 1, 0]).bool()
    >>> starts, ends = extract_segments(x)
    >>> starts
    ... tensor([1, 5])
    >>> ends
    ... tensor([3, 9])

    Example 2
    ----------
    >>> x = torch.as_tensor([[1, 1, 1, 0], [1, 0, 0, 1]]).bool()
    >>> indices, starts, ends = extract_segments(x)
    >>> indices
    ... tensor([0, 1, 1])
    >>> starts
    ... tensor([0, 0, 3])
    >>> ends
    ... tensor([3, 1, 4])

    Args:
        x: (..., N) bool tensor containing D dims

    Returns:
        segments: (D+1, M) tensor, where M is the total number of segments
            When D > 1, segments also contains indices of the source column for each start and end value. See Example 2 for details.
    """
    if not isinstance(x, BoolTensor):
        msg = f"Invalid argument {x=}. (expected BoolTensor)"
        raise ValueError(msg)

    x = x.int()
    x = pad_dim(x, x.shape[-1] + 2, align="center", pad_value=0, dim=-1)
    diff = x[..., 1:] - x[..., :-1]

    starts = torch.stack(torch.where(diff > 0))
    ends = torch.stack(torch.where(diff < 0))

    result = torch.cat([starts, ends[-1:]], dim=0)
    return result  # type: ignore




[docs]
def segments_to_segments_list(
    segments: Tensor,
    maxsize: Union[int, Tuple[int, ...], None] = None,
) -> Union[List[Tuple[int, int]], list]:
    """Convert stacked list/tensor of starts end stops separated to list of (start, end) tuples.

    Args:
        x: (2+C, N) tensor, where C defines indices in dimensions of a segments for 3D activity tensors.
        maxsize: Optional max size. If None, use x.max().

    Returns:
        list of (start, end) tuples of shape (*, N, 2).
            note: (*) corresponds to C batched dimensions.
    """
    if segments.shape[0] in (0, 1):
        msg = f"Invalid argument shape {segments.shape=}. (expected first dim >= 2)"
        raise ValueError(msg)

    elif segments.shape[0] == 2:
        starts, ends = segments.tolist()
        return list(zip(starts, ends))

    if maxsize is None:
        num_elems = segments[0].max().item() + 1
        next_maxsize = None
    elif isinstance(maxsize, tuple):
        num_elems = maxsize[0]
        next_maxsize = maxsize[1:]
    else:
        num_elems = maxsize
        next_maxsize = None

    arange = torch.arange(num_elems)
    result = [
        segments_to_segments_list(
            segments[1:, ..., segments[0] == idx], maxsize=next_maxsize
        )
        for idx in arange
    ]
    return result




[docs]
def segments_list_to_activity(
    segments_list: Union[List[Tuple[int, int]], Tensor, list],
    maxsize: Union[int, None] = None,
    *,
    device: DeviceLike = None,
) -> BoolTensor:
    """Convert list of (start, end) tuples to activity boolean tensor.

    Example
    =======
    ```python
    >>> segments = [(3, 6), (8, 9)]
    >>> segments_list_to_activity(segments)
    ... tensor([False, False, False, True, True, True, False, False, True])
    ```

    Args:
        segments_list: list of (start, end) tuples of shape (*, N, 2).
        maxsize: Optional max size. If None, use segments_list.max(). defaults to None.
        device: Optional output device. If None and segments_list is a tensor, it will use the same device. defaults to None.

    Returns:
        activity boolean tensor of shape (*, maxsize)
    """
    if device is None and isinstance(segments_list, Tensor):
        device = segments_list.device
    else:
        device = as_device(device)

    ndim = F.get_ndim(segments_list)
    if ndim == 1 and len(segments_list) == 0:
        if maxsize is None:
            num_elems = 0
        else:
            num_elems = maxsize

        activity = F.full((num_elems,), False, dtype=torch.bool, device=device)
        return activity  # type: ignore

    elif ndim == 2:
        segments_list = F.as_tensor(segments_list)
        return _segments_list_tensor_to_activity(segments_list, maxsize, device)

    elif (
        ndim > 2
        and F.get_shape(
            segments_list,
            return_indicator=True,
            return_default_on_invalid=True,
        ).valid
    ):
        segments_list = F.as_tensor(segments_list)
        return _segments_list_tensor_to_activity(segments_list, maxsize, device)

    elif ndim > 2:
        activities = [
            segments_list_to_activity(segments_list_i, maxsize, device=device)  # type: ignore
            for segments_list_i in segments_list
        ]
        return pad_and_stack_rec(activities, False, device=device, dtype=torch.bool)  # type: ignore

    else:
        msg = f"Invalid argument ndim {ndim}. (expected ndim>=2 or (ndim == 1 and len == 0))"
        raise ValueError(msg)



def _segments_list_tensor_to_activity(
    segments_list: Tensor,
    maxsize: Optional[int],
    device: DeviceLike,
) -> BoolTensor:
    if device is None and isinstance(segments_list, Tensor):
        device = segments_list.device
    else:
        device = as_device(device)

    assert segments_list.ndim >= 2 and segments_list.shape[-1] == 2, (
        f"{segments_list.shape=}"
    )
    starts, ends = segments_list.permute(-1, *range(0, segments_list.ndim - 1))

    if maxsize is None:
        num_elems = ends.max().item()
    else:
        num_elems = maxsize

    unsqueeze_arange = tuple([None] * starts.ndim + [slice(None)])
    arange = F.arange(num_elems, device=device)[unsqueeze_arange]

    unsqueeze_bounds = tuple([slice(None)] * starts.ndim + [None])
    activity = (starts[unsqueeze_bounds] <= arange) & (arange < ends[unsqueeze_bounds])
    activity = activity.any(dim=-2)

    return activity  # type: ignore



[docs]
def activity_to_segments_list(x: Tensor) -> Union[List[Tuple[int, int]], list]:
    segments = activity_to_segments(x)
    segments_lst = segments_to_segments_list(segments, x.shape[-1])
    return segments_lst




[docs]
def segments_to_activity(x: Tensor, maxsize: Optional[int] = None) -> BoolTensor:
    """Convert stacked list/tensor of starts end stops separated to activity boolean tensor.

    Args:
        x: (*, 2, N) tensor
        maxsize: Optional max size. If None, use x.max().

    Returns:
        activity boolean tensor of shape (*, maxsize)
    """
    if maxsize is None:
        maxsize = int(x.max().item())
    segments_lst = segments_to_segments_list(x, maxsize)
    activity = segments_list_to_activity(segments_lst, maxsize)
    return activity