[generic] Suppress warning about doctypes in RSS parser

2024-11-10 13:12:45 +01:00 · 2014-03-10 17:31:32 +01:00 · 2014-03-10 17:31:32 +01:00 · bcf89ce62c
commit bcf89ce62c
parent e3899d0e00
2 changed files with 13 additions and 2 deletions
--- a/youtube_dl/extractor/generic.py
+++ b/youtube_dl/extractor/generic.py
@ -4,7 +4,6 @@
 import os
 import re
 import xml.etree.ElementTree
 from .common import InfoExtractor
 from .youtube import YoutubeIE
@ -17,6 +16,7 @@
    ExtractorError,
    HEADRequest,
    parse_xml,
    smuggle_url,
    unescapeHTML,
    unified_strdate,
@ -274,7 +274,7 @@ def _real_extract(self, url):
        # Is it an RSS feed?
        try:
-            doc = xml.etree.ElementTree.fromstring(webpage.encode('utf-8'))
+            doc = parse_xml(webpage)
            if doc.tag == 'rss':
                return self._extract_rss(url, video_id, doc)
        except compat_xml_parse_error:
--- a/youtube_dl/utils.py
+++ b/youtube_dl/utils.py
@ -22,6 +22,7 @@
 import subprocess
 import sys
 import traceback
 import xml.etree.ElementTree
 import zlib
 try:
@ -1267,3 +1268,13 @@ def fixup(url):
 def urlencode_postdata(*args, **kargs):
    return compat_urllib_parse.urlencode(*args, **kargs).encode('ascii')
 def parse_xml(s):
    class TreeBuilder(xml.etree.ElementTree.TreeBuilder):
        def doctype(self, name, pubid, system):
            pass  # Ignore doctypes
    parser = xml.etree.ElementTree.XMLParser(target=TreeBuilder())
    kwargs = {'parser': parser} if sys.version_info >= (2, 7) else {}
    return xml.etree.ElementTree.XML(s.encode('utf-8'), **kwargs)