@ -5,12 +5,13 @@ import re
from . common import InfoExtractor
from . common import InfoExtractor
from . . utils import determine_ext
from . . utils import determine_ext
class SztvHuIE ( InfoExtractor ) :
class SztvHuIE ( InfoExtractor ) :
_VALID_URL = r ' (?:http://)?(?:(?:www \ .)?sztv \ .hu|www \ .tvszombathely \ .hu)/( [^/]+)/(?P<name>. +)'
_VALID_URL = r ' (?:http://)?(?:(?:www \ .)?sztv \ .hu|www \ .tvszombathely \ .hu)/( ?:[^/]+)/.+-(?P<id>[0-9] +)'
_TEST = {
_TEST = {
u ' url ' : u ' http://sztv.hu/hirek/cserkeszek-nepszerusitettek-a-kornyezettudatos-eletmodot-a-savaria-teren-20130909 ' ,
u ' url ' : u ' http://sztv.hu/hirek/cserkeszek-nepszerusitettek-a-kornyezettudatos-eletmodot-a-savaria-teren-20130909 ' ,
u ' file ' : u ' 130909zoldnap .mp4' ,
u ' file ' : u ' 20 130909.mp4' ,
u ' md5 ' : u ' 0047eacedc0afd1ceeac99e69173a07e ' ,
u ' md5 ' : u ' a6df607b11fb07d0e9f2ad94613375cb ' ,
u ' info_dict ' : {
u ' info_dict ' : {
u " title " : u " Cserkészek népszerűsítették a környezettudatos életmódot a Savaria téren " ,
u " title " : u " Cserkészek népszerűsítették a környezettudatos életmódot a Savaria téren " ,
u " description " : u ' A zöld nap játékos ismeretterjesztő programjait a Magyar Cserkész Szövetség szervezte, akik az ország nyolc városában adják át tudásukat az érdeklődőknek. A PET... ' ,
u " description " : u ' A zöld nap játékos ismeretterjesztő programjait a Magyar Cserkész Szövetség szervezte, akik az ország nyolc városában adják át tudásukat az érdeklődőknek. A PET... ' ,
@ -19,20 +20,22 @@ class SztvHuIE(InfoExtractor):
def _real_extract ( self , url ) :
def _real_extract ( self , url ) :
mobj = re . match ( self . _VALID_URL , url )
mobj = re . match ( self . _VALID_URL , url )
name = mobj . group ( ' name ' )
video_id = mobj . group ( ' id ' )
webpage = self . _download_webpage ( url , name )
webpage = self . _download_webpage ( url , video_id )
# file = self._search_regex(r'var fileHtml5 = "...:(.*?)";',
video_file = self . _search_regex (
file = self . _search_regex ( r ' file: " ...:(.*?) " , ' ,
r ' file: " ...:(.*?) " , ' , webpage , ' video file ' )
webpage , ' video file ' )
title = self . _html_search_regex (
title = self . _html_search_regex ( r ' <meta name= " title " content= " ([^ " ]*) " ' ,
r ' <meta name= " title " content= " ([^ " ]*) - [^-]* " ' ,
webpage , ' video title ' ) . rsplit ( ' - ' , 2 ) [ 0 ]
webpage , ' video title ' )
description = self . _html_search_regex ( r ' <meta name= " description " content= " ([^ " ]*) " /> ' ,
description = self . _html_search_regex (
webpage , ' video description ' )
r ' <meta name= " description " content= " ([^ " ]*) " /> ' ,
webpage , ' video description ' , fatal = False )
thumbnail = self . _og_search_thumbnail ( webpage )
thumbnail = self . _og_search_thumbnail ( webpage )
video_url = ' http://media.sztv.hu/vod/ ' + file
video_url = ' http://media.sztv.hu/vod/ ' + video_ file
return { ' id ' : name ,
return {
' id ' : video_id ,
' url ' : video_url ,
' url ' : video_url ,
' title ' : title ,
' title ' : title ,
' ext ' : determine_ext ( video_url ) ,
' ext ' : determine_ext ( video_url ) ,