[extractor/NiconicoSeries] Fix extraction (#6898)

Authored by: sqrtNOT
2024-11-17 00:22:34 +01:00 · 2023-04-25 10:21:06 +00:00 · 2023-04-25 10:21:06 +00:00 · c86e433c35
commit c86e433c35
parent 9b30cd3dfc
1 changed files with 6 additions and 7 deletions
--- a/yt_dlp/extractor/niconico.py
+++ b/yt_dlp/extractor/niconico.py
@ -660,10 +660,10 @@ def _real_extract(self, url):

 class NiconicoSeriesIE(InfoExtractor):
    IE_NAME = 'niconico:series'
-    _VALID_URL = r'https?://(?:(?:www\.|sp\.)?nicovideo\.jp|nico\.ms)/series/(?P<id>\d+)'
+    _VALID_URL = r'https?://(?:(?:www\.|sp\.)?nicovideo\.jp(?:/user/\d+)?|nico\.ms)/series/(?P<id>\d+)'

    _TESTS = [{
-        'url': 'https://www.nicovideo.jp/series/110226',
+        'url': 'https://www.nicovideo.jp/user/44113208/series/110226',
        'info_dict': {
            'id': '110226',
            'title': 'ご立派ァ！のシリーズ',
@ -683,7 +683,7 @@ class NiconicoSeriesIE(InfoExtractor):

    def _real_extract(self, url):
        list_id = self._match_id(url)
-        webpage = self._download_webpage(f'https://www.nicovideo.jp/series/{list_id}', list_id)
+        webpage = self._download_webpage(url, list_id)

        title = self._search_regex(
            (r'<title>「(.+)（全',
@ -691,10 +691,9 @@ def _real_extract(self, url):
            webpage, 'title', fatal=False)
        if title:
            title = unescapeHTML(title)
-        playlist = [
-            self.url_result(f'https://www.nicovideo.jp/watch/{v_id}', video_id=v_id)
-            for v_id in re.findall(r'data-href=[\'"](?:https://www\.nicovideo\.jp)?/watch/([a-z0-9]+)', webpage)]
-        return self.playlist_result(playlist, list_id, title)
+        json_data = next(self._yield_json_ld(webpage, None, fatal=False))
+        return self.playlist_from_matches(
+            traverse_obj(json_data, ('itemListElement', ..., 'url')), list_id, title, ie=NiconicoIE)


 class NiconicoHistoryIE(NiconicoPlaylistBaseIE):