streamlined/server/entertainment_decider/extractors/media/youtube.py

from __future__ import annotations

from datetime import datetime
import logging
import re
from typing import List, Optional, TypedDict

from youtubesearchpython import ResultMode, Video

from ...models import (
    MediaElement,
    MediaThumbnail,
    thumbnail_sort_key,
)
from ..generic import (
    AuthorExtractedData,
    ExtractedData,
    SuitableLevel,
)
from .base import MediaExtractor


class YoutubeDuration(TypedDict):
    secondsText: str


class YoutubeViewCount(TypedDict):
    text: str


class YoutubeThumbnailData(TypedDict):
    url: str
    width: int
    height: int


class YoutubeChannelData(TypedDict):
    name: str
    id: str
    link: str


class YoutubeVideoData(TypedDict):
    id: str
    title: str
    duration: YoutubeDuration
    viewCount: YoutubeViewCount
    thumbnails: List[YoutubeThumbnailData]
    description: str
    channel: YoutubeChannelData
    allowRatings: bool
    averageRating: float
    keywords: List[str]
    isLiveContent: bool
    publishDate: str
    uploadDate: str
    isLiveNow: bool
    link: str


class YoutubeMediaExtractor(MediaExtractor[YoutubeVideoData]):

    __uri_regex = re.compile(
        r"""^
        https?://(
            (www\.)?youtube\.com/(
                watch\?v=
            )|
            youtu\.be/
        )(?P<id>[^/&?]+)
    $""",
        re.VERBOSE,
    )

    def __init__(self):
        super().__init__("ytdl")

    def uri_suitable(self, uri: str) -> SuitableLevel:
        return SuitableLevel.always_or_no(self.__uri_regex.match(uri))

    def _get_author_data(self, data: YoutubeVideoData) -> Optional[AuthorExtractedData]:
        return AuthorExtractedData(
            object_uri=data["channel"]["link"],
            extractor_name=self.name,
            object_key=f"author:{data['channel']['id']}",
            author_name=data["channel"]["name"],
        )

    def _extract_online(self, uri: str) -> ExtractedData[YoutubeVideoData]:
        logging.info(f"Request info using youtube_search_python for {uri!r}")
        uri_match = self.__uri_regex.match(uri)
        if not uri_match:
            raise Exception(f"URI not suitable: {uri!r}")
        id = uri_match.group("id")
        vid_data: YoutubeVideoData = Video.getInfo(
            videoLink=f"https://www.youtube.com/watch?v={id}",
            mode=ResultMode.dict,
        )
        return ExtractedData[YoutubeVideoData](
            object_uri=uri,
            extractor_name=self.name,
            object_key=vid_data["id"],
            data=vid_data,
        )

    def _update_object_raw(self, object: MediaElement, data: YoutubeVideoData):
        object.title = f"{data['title']} - {data['channel']['name']}"
        object.description = data.get("description")
        if data.get("thumbnails"):
            best_thumb = min(
                data["thumbnails"],
                key=lambda thumb: thumbnail_sort_key(thumb["width"], thumb["height"]),
            )
            object.thumbnail = MediaThumbnail.from_uri(best_thumb["url"])
        object.release_date = datetime.strptime(
            data.get("uploadDate") or data["publishDate"], "%Y-%m-%d"
        )
        object.length = int(data["duration"]["secondsText"])
        object.uri = f"https://www.youtube.com/watch?v={data['id']}"
        object.add_uris(
            (
                f"https://youtu.be/{data['id']}",
                f"https://youtube.com/watch?v={data['id']}",
            )
        )
Added youtube media extractor based on new version of youtubesearchpython 3 years ago			`from __future__ import annotations`

			`from datetime import datetime`
			`import logging`
			`import re`
			`from typing import List, Optional, TypedDict`

			`from youtubesearchpython import ResultMode, Video`

Format code - server/entertainment_decider/common.py - server/entertainment_decider/extractors/all/tt_rss.py - server/entertainment_decider/extractors/all/ytdl.py - server/entertainment_decider/extractors/collection/__init__.py - server/entertainment_decider/extractors/collection/tt_rss.py - server/entertainment_decider/extractors/collection/youtube.py - server/entertainment_decider/extractors/generic.py - server/entertainment_decider/extractors/helpers.py - server/entertainment_decider/extractors/media/__init__.py - server/entertainment_decider/extractors/media/base.py - server/entertainment_decider/extractors/media/youtube.py - server/entertainment_decider/extractors/media/ytdl.py Applied automatically using black 2 years ago			`from ...models import (`
			`MediaElement,`
Extract media thumbnail automatically from YouTube 2 years ago			`MediaThumbnail,`
			`thumbnail_sort_key,`
Format code - server/entertainment_decider/common.py - server/entertainment_decider/extractors/all/tt_rss.py - server/entertainment_decider/extractors/all/ytdl.py - server/entertainment_decider/extractors/collection/__init__.py - server/entertainment_decider/extractors/collection/tt_rss.py - server/entertainment_decider/extractors/collection/youtube.py - server/entertainment_decider/extractors/generic.py - server/entertainment_decider/extractors/helpers.py - server/entertainment_decider/extractors/media/__init__.py - server/entertainment_decider/extractors/media/base.py - server/entertainment_decider/extractors/media/youtube.py - server/entertainment_decider/extractors/media/ytdl.py Applied automatically using black 2 years ago			`)`
			`from ..generic import (`
			`AuthorExtractedData,`
			`ExtractedData,`
			`SuitableLevel,`
			`)`
Added youtube media extractor based on new version of youtubesearchpython 3 years ago			`from .base import MediaExtractor`


			`class YoutubeDuration(TypedDict):`
			`secondsText: str`

Format code - server/entertainment_decider/common.py - server/entertainment_decider/extractors/all/tt_rss.py - server/entertainment_decider/extractors/all/ytdl.py - server/entertainment_decider/extractors/collection/__init__.py - server/entertainment_decider/extractors/collection/tt_rss.py - server/entertainment_decider/extractors/collection/youtube.py - server/entertainment_decider/extractors/generic.py - server/entertainment_decider/extractors/helpers.py - server/entertainment_decider/extractors/media/__init__.py - server/entertainment_decider/extractors/media/base.py - server/entertainment_decider/extractors/media/youtube.py - server/entertainment_decider/extractors/media/ytdl.py Applied automatically using black 2 years ago
Added youtube media extractor based on new version of youtubesearchpython 3 years ago			`class YoutubeViewCount(TypedDict):`
			`text: str`

Format code - server/entertainment_decider/common.py - server/entertainment_decider/extractors/all/tt_rss.py - server/entertainment_decider/extractors/all/ytdl.py - server/entertainment_decider/extractors/collection/__init__.py - server/entertainment_decider/extractors/collection/tt_rss.py - server/entertainment_decider/extractors/collection/youtube.py - server/entertainment_decider/extractors/generic.py - server/entertainment_decider/extractors/helpers.py - server/entertainment_decider/extractors/media/__init__.py - server/entertainment_decider/extractors/media/base.py - server/entertainment_decider/extractors/media/youtube.py - server/entertainment_decider/extractors/media/ytdl.py Applied automatically using black 2 years ago
Added youtube media extractor based on new version of youtubesearchpython 3 years ago			`class YoutubeThumbnailData(TypedDict):`
			`url: str`
			`width: int`
			`height: int`

Format code - server/entertainment_decider/common.py - server/entertainment_decider/extractors/all/tt_rss.py - server/entertainment_decider/extractors/all/ytdl.py - server/entertainment_decider/extractors/collection/__init__.py - server/entertainment_decider/extractors/collection/tt_rss.py - server/entertainment_decider/extractors/collection/youtube.py - server/entertainment_decider/extractors/generic.py - server/entertainment_decider/extractors/helpers.py - server/entertainment_decider/extractors/media/__init__.py - server/entertainment_decider/extractors/media/base.py - server/entertainment_decider/extractors/media/youtube.py - server/entertainment_decider/extractors/media/ytdl.py Applied automatically using black 2 years ago
Added youtube media extractor based on new version of youtubesearchpython 3 years ago			`class YoutubeChannelData(TypedDict):`
			`name: str`
			`id: str`
			`link: str`

Format code - server/entertainment_decider/common.py - server/entertainment_decider/extractors/all/tt_rss.py - server/entertainment_decider/extractors/all/ytdl.py - server/entertainment_decider/extractors/collection/__init__.py - server/entertainment_decider/extractors/collection/tt_rss.py - server/entertainment_decider/extractors/collection/youtube.py - server/entertainment_decider/extractors/generic.py - server/entertainment_decider/extractors/helpers.py - server/entertainment_decider/extractors/media/__init__.py - server/entertainment_decider/extractors/media/base.py - server/entertainment_decider/extractors/media/youtube.py - server/entertainment_decider/extractors/media/ytdl.py Applied automatically using black 2 years ago
Added youtube media extractor based on new version of youtubesearchpython 3 years ago			`class YoutubeVideoData(TypedDict):`
			`id: str`
			`title: str`
			`duration: YoutubeDuration`
			`viewCount: YoutubeViewCount`
			`thumbnails: List[YoutubeThumbnailData]`
			`description: str`
			`channel: YoutubeChannelData`
			`allowRatings: bool`
			`averageRating: float`
			`keywords: List[str]`
			`isLiveContent: bool`
			`publishDate: str`
			`uploadDate: str`
			`isLiveNow: bool`
			`link: str`


			`class YoutubeMediaExtractor(MediaExtractor[YoutubeVideoData]):`

Format code - server/entertainment_decider/common.py - server/entertainment_decider/extractors/all/tt_rss.py - server/entertainment_decider/extractors/all/ytdl.py - server/entertainment_decider/extractors/collection/__init__.py - server/entertainment_decider/extractors/collection/tt_rss.py - server/entertainment_decider/extractors/collection/youtube.py - server/entertainment_decider/extractors/generic.py - server/entertainment_decider/extractors/helpers.py - server/entertainment_decider/extractors/media/__init__.py - server/entertainment_decider/extractors/media/base.py - server/entertainment_decider/extractors/media/youtube.py - server/entertainment_decider/extractors/media/ytdl.py Applied automatically using black 2 years ago			`__uri_regex = re.compile(`
			`r"""^`
Reformat code (partially using black) 2 years ago			`https?://(`
			`(www\.)?youtube\.com/(`
			`watch\?v=`
			`)\|`
			`youtu\.be/`
			`)(?P<id>[^/&?]+)`
Format code - server/entertainment_decider/common.py - server/entertainment_decider/extractors/all/tt_rss.py - server/entertainment_decider/extractors/all/ytdl.py - server/entertainment_decider/extractors/collection/__init__.py - server/entertainment_decider/extractors/collection/tt_rss.py - server/entertainment_decider/extractors/collection/youtube.py - server/entertainment_decider/extractors/generic.py - server/entertainment_decider/extractors/helpers.py - server/entertainment_decider/extractors/media/__init__.py - server/entertainment_decider/extractors/media/base.py - server/entertainment_decider/extractors/media/youtube.py - server/entertainment_decider/extractors/media/ytdl.py Applied automatically using black 2 years ago			`$""",`
			`re.VERBOSE,`
			`)`
Added youtube media extractor based on new version of youtubesearchpython 3 years ago
			`def __init__(self):`
			`super().__init__("ytdl")`

			`def uri_suitable(self, uri: str) -> SuitableLevel:`
			`return SuitableLevel.always_or_no(self.__uri_regex.match(uri))`

			`def _get_author_data(self, data: YoutubeVideoData) -> Optional[AuthorExtractedData]:`
			`return AuthorExtractedData(`
Format code - server/entertainment_decider/common.py - server/entertainment_decider/extractors/all/tt_rss.py - server/entertainment_decider/extractors/all/ytdl.py - server/entertainment_decider/extractors/collection/__init__.py - server/entertainment_decider/extractors/collection/tt_rss.py - server/entertainment_decider/extractors/collection/youtube.py - server/entertainment_decider/extractors/generic.py - server/entertainment_decider/extractors/helpers.py - server/entertainment_decider/extractors/media/__init__.py - server/entertainment_decider/extractors/media/base.py - server/entertainment_decider/extractors/media/youtube.py - server/entertainment_decider/extractors/media/ytdl.py Applied automatically using black 2 years ago			`object_uri=data["channel"]["link"],`
			`extractor_name=self.name,`
			`object_key=f"author:{data['channel']['id']}",`
			`author_name=data["channel"]["name"],`
Added youtube media extractor based on new version of youtubesearchpython 3 years ago			`)`

			`def _extract_online(self, uri: str) -> ExtractedData[YoutubeVideoData]:`
			`logging.info(f"Request info using youtube_search_python for {uri!r}")`
extr/media/youtube: Explicit check for suitable URI 2 years ago			`uri_match = self.__uri_regex.match(uri)`
			`if not uri_match:`
			`raise Exception(f"URI not suitable: {uri!r}")`
extr/media/youtube: Rewrite URI so extractor works deteministicly 2 years ago			`id = uri_match.group("id")`
Added youtube media extractor based on new version of youtubesearchpython 3 years ago			`vid_data: YoutubeVideoData = Video.getInfo(`
extr/media/youtube: Rewrite URI so extractor works deteministicly 2 years ago			`videoLink=f"https://www.youtube.com/watch?v={id}",`
Format code - server/entertainment_decider/common.py - server/entertainment_decider/extractors/all/tt_rss.py - server/entertainment_decider/extractors/all/ytdl.py - server/entertainment_decider/extractors/collection/__init__.py - server/entertainment_decider/extractors/collection/tt_rss.py - server/entertainment_decider/extractors/collection/youtube.py - server/entertainment_decider/extractors/generic.py - server/entertainment_decider/extractors/helpers.py - server/entertainment_decider/extractors/media/__init__.py - server/entertainment_decider/extractors/media/base.py - server/entertainment_decider/extractors/media/youtube.py - server/entertainment_decider/extractors/media/ytdl.py Applied automatically using black 2 years ago			`mode=ResultMode.dict,`
Added youtube media extractor based on new version of youtubesearchpython 3 years ago			`)`
			`return ExtractedData[YoutubeVideoData](`
			`object_uri=uri,`
			`extractor_name=self.name,`
			`object_key=vid_data["id"],`
			`data=vid_data,`
			`)`

			`def _update_object_raw(self, object: MediaElement, data: YoutubeVideoData):`
			`object.title = f"{data['title']} - {data['channel']['name']}"`
extr/media/youtube: Extract description 2 years ago			`object.description = data.get("description")`
Extract media thumbnail automatically from YouTube 2 years ago			`if data.get("thumbnails"):`
			`best_thumb = min(`
			`data["thumbnails"],`
			`key=lambda thumb: thumbnail_sort_key(thumb["width"], thumb["height"]),`
			`)`
			`object.thumbnail = MediaThumbnail.from_uri(best_thumb["url"])`
Format code - server/entertainment_decider/common.py - server/entertainment_decider/extractors/all/tt_rss.py - server/entertainment_decider/extractors/all/ytdl.py - server/entertainment_decider/extractors/collection/__init__.py - server/entertainment_decider/extractors/collection/tt_rss.py - server/entertainment_decider/extractors/collection/youtube.py - server/entertainment_decider/extractors/generic.py - server/entertainment_decider/extractors/helpers.py - server/entertainment_decider/extractors/media/__init__.py - server/entertainment_decider/extractors/media/base.py - server/entertainment_decider/extractors/media/youtube.py - server/entertainment_decider/extractors/media/ytdl.py Applied automatically using black 2 years ago			`object.release_date = datetime.strptime(`
			`data.get("uploadDate") or data["publishDate"], "%Y-%m-%d"`
			`)`
Added youtube media extractor based on new version of youtubesearchpython 3 years ago			`object.length = int(data["duration"]["secondsText"])`
extr/coll,media/youtube: Move setting URLs to media extractor 2 years ago			`object.uri = f"https://www.youtube.com/watch?v={data['id']}"`
			`object.add_uris(`
			`(`
			`f"https://youtu.be/{data['id']}",`
			`f"https://youtube.com/watch?v={data['id']}",`
			`)`
			`)`