Add aggregated extraction support

3 years ago · 487b126fe1
parent 0d75fa72bd
commit 487b126fe1
2 changed files with 94 additions and 0 deletions
--- a/server/entertainment_decider/extractors/collection/init.py
+++ b/server/entertainment_decider/extractors/collection/init.py
@ -7,6 +7,7 @@ from ...config import app_config
 from ...models import MediaCollection
 from ..helpers import expect_suitable_extractor
 from .base import CollectionExtractor
 from .aggregated import AggregatedCollectionExtractor
 from .tt_rss import TtRssCollectionExtractor, TtRssConnectionParameter
 from .tmdb import TmdbCollectionExtractor, TmdbKeywordExtractor
 from .tvmaze import TvmazeCollectionExtractor
@ -15,6 +16,7 @@ from .youtube import YouTubeCollectionExtractor
 tt_rss_params = TtRssConnectionParameter(**app_config["extractors"]["tt_rss"])
 COLLECTION_EXTRACTORS: Dict[str, CollectionExtractor] = {
    "aggregated": AggregatedCollectionExtractor(),
    "tt-rss": TtRssCollectionExtractor(
        params=tt_rss_params,
        label_filter=-1033,
--- a/server/entertainment_decider/extractors/collection/aggregated.py
+++ b/server/entertainment_decider/extractors/collection/aggregated.py
@ -0,0 +1,92 @@
 from __future__ import annotations
 import re
 from typing import List, Set
 from pony import orm
 from ...models import MediaCollection, MediaCollectionLink, MediaElement
 from ..generic import ExtractedData, ExtractedDataLight, SuitableLevel
 from .base import CollectionExtractor
 class AggregatedCollectionExtractor(CollectionExtractor[List[List[MediaElement]]]):
    __uri_regex = re.compile(r"^aggregated:///(?P<id>\d+(,\d+)*)")
    @classmethod
    def __get_id(cls, uri: str) -> List[int]:
        m = cls.__uri_regex.search(uri)
        if not m:
            raise Exception(f"Failed to parse aggregated collection uri {uri!r}")
        return [int(i) for i in m.group("id").split(",")]
    @classmethod
    def __get_collections(cls, uri: str) -> List[MediaCollection]:
        aggregate_ids = cls.__get_id(uri)
        colls = [MediaCollection[i] for i in aggregate_ids]
        return colls
    def __init__(self) -> None:
        super().__init__("aggregated")
    def uri_suitable(self, uri: str) -> SuitableLevel:
        return SuitableLevel.always_or_no(self.__uri_regex.match(uri) is not None)
    def can_extract_offline(self, uri: str) -> bool:
        return True
    def _cache_expired(self, object: MediaCollection) -> bool:
        colls = self.__get_collections(object.uri)
        for c in colls:
            if c.last_updated is None or object.last_updated <= c.last_updated:
                return True
        return False
    def _extract_offline(self, uri: str) -> ExtractedDataLight:
        coll_id = ",".join(str(i) for i in self.__get_id(uri))
        return ExtractedDataLight(
            extractor_name=self.name,
            object_key=coll_id,
            object_uri=uri,
        )
    def _extract_online(self, uri: str) -> ExtractedData[List[List[MediaElement]]]:
        colls = self.__get_collections(uri)
        coll_id = ",".join(str(c.id) for c in colls)
        return ExtractedData(
            extractor_name=self.name,
            object_key=coll_id,
            object_uri=uri,
            data=[
                [
                    l.element
                    for l in orm.select(l for l in c.media_links).order_by(
                        MediaCollectionLink.sort_key
                    )
                ]
                for c in colls
            ],
        )
    def _update_object_raw(
        self, object: MediaCollection, data: List[List[MediaElement]]
    ) -> None:
        if object.title is None or "[aggregated]" not in object.title:
            object.title = f"[aggregated] {object.uri}"
        object.creator = None
        object.set_watch_in_order_auto(True)
        all_links: Set[int] = set(
            orm.select(link.element.id for link in object.media_links)
        )
        for season, media_list in enumerate(data):
            for episode, media in enumerate(media_list):
                all_links.discard(media.id)
                object.add_episode(
                    media=media,
                    season=season + 1,
                    episode=episode + 1,
                )
        orm.delete(link for link in object.media_links if link.element.id in all_links)
        for uri_link in list(object.uris):
            uri_link.delete()