[JSInterp] Add tests and relevant functionality from yt-dlp

* thx seproDev, bashonly: yt-dlp/yt-dlp#12760, yt-dlp/yt-dlp#12761: - Improve nested attribute support - Pass global stack when extracting objects - interpret_statement: Match attribute before indexing - Fix assignment to array elements with nested brackets - Add new signature tests - Invalidate JS function cache - Avoid testdata dupes now that we cache by URL * rework nsig function name search * fully fixes #33102 * update cache required versions * update program version
[JSInterp] Improve unary operators; add !
2025-04-26 00:37:32 +00:00 · 2025-04-08 01:59:00 +01:00 · 2025-04-08 01:59:00 +01:00 · 2025-04-08 01:59:00 +01:00 · 2025-04-08 01:59:00 +01:00 · 2025-04-08 01:59:00 +01:00
17 changed files with 1856 additions and 532 deletions
--- a/test/test_cache.py
+++ b/test/test_cache.py
@ -63,7 +63,7 @@ class TestCache(unittest.TestCase):
        obj = {'x': 1, 'y': ['ä', '\\a', True]}
        c.store('test_cache', 'k.', obj)
        self.assertEqual(c.load('test_cache', 'k.', min_ver='1970.01.01'), obj)
-        new_version = '.'.join(('%d' % ((v + 1) if i == 0 else v, )) for i, v in enumerate(version_tuple(__version__)))
+        new_version = '.'.join(('%0.2d' % ((v + 1) if i == 0 else v, )) for i, v in enumerate(version_tuple(__version__)))
        self.assertIs(c.load('test_cache', 'k.', min_ver=new_version), None)
--- a/test/test_jsinterp.py
+++ b/test/test_jsinterp.py
@ -1,4 +1,5 @@
 #!/usr/bin/env python
 # coding: utf-8
 from __future__ import unicode_literals
@ -6,12 +7,14 @@ from __future__ import unicode_literals
 import os
 import sys
 import unittest
 sys.path.insert(0, os.path.dirname(os.path.dirname(os.path.abspath(__file__))))
 import math
 import re
 import time
-from youtube_dl.compat import compat_str
+from youtube_dl.compat import compat_str as str
 from youtube_dl.jsinterp import JS_Undefined, JSInterpreter
 NaN = object()
@ -19,7 +22,7 @@ NaN = object()
 class TestJSInterpreter(unittest.TestCase):
    def _test(self, jsi_or_code, expected, func='f', args=()):
-        if isinstance(jsi_or_code, compat_str):
+        if isinstance(jsi_or_code, str):
            jsi_or_code = JSInterpreter(jsi_or_code)
        got = jsi_or_code.call_function(func, *args)
        if expected is NaN:
@ -40,16 +43,27 @@ class TestJSInterpreter(unittest.TestCase):
        self._test('function f(){return 42 + 7;}', 49)
        self._test('function f(){return 42 + undefined;}', NaN)
        self._test('function f(){return 42 + null;}', 42)
        self._test('function f(){return 1 + "";}', '1')
        self._test('function f(){return 42 + "7";}', '427')
        self._test('function f(){return false + true;}', 1)
        self._test('function f(){return "false" + true;}', 'falsetrue')
        self._test('function f(){return '
                   '1 + "2" + [3,4] + {k: 56} + null + undefined + Infinity;}',
                   '123,4[object Object]nullundefinedInfinity')
    def test_sub(self):
        self._test('function f(){return 42 - 7;}', 35)
        self._test('function f(){return 42 - undefined;}', NaN)
        self._test('function f(){return 42 - null;}', 42)
        self._test('function f(){return 42 - "7";}', 35)
        self._test('function f(){return 42 - "spam";}', NaN)
    def test_mul(self):
        self._test('function f(){return 42 * 7;}', 294)
        self._test('function f(){return 42 * undefined;}', NaN)
        self._test('function f(){return 42 * null;}', 0)
        self._test('function f(){return 42 * "7";}', 294)
        self._test('function f(){return 42 * "eggs";}', NaN)
    def test_div(self):
        jsi = JSInterpreter('function f(a, b){return a / b;}')
@ -57,17 +71,26 @@ class TestJSInterpreter(unittest.TestCase):
        self._test(jsi, NaN, args=(JS_Undefined, 1))
        self._test(jsi, float('inf'), args=(2, 0))
        self._test(jsi, 0, args=(0, 3))
        self._test(jsi, 6, args=(42, 7))
        self._test(jsi, 0, args=(42, float('inf')))
        self._test(jsi, 6, args=("42", 7))
        self._test(jsi, NaN, args=("spam", 7))
    def test_mod(self):
        self._test('function f(){return 42 % 7;}', 0)
        self._test('function f(){return 42 % 0;}', NaN)
        self._test('function f(){return 42 % undefined;}', NaN)
        self._test('function f(){return 42 % "7";}', 0)
        self._test('function f(){return 42 % "beans";}', NaN)
    def test_exp(self):
        self._test('function f(){return 42 ** 2;}', 1764)
        self._test('function f(){return 42 ** undefined;}', NaN)
        self._test('function f(){return 42 ** null;}', 1)
        self._test('function f(){return undefined ** 0;}', 1)
        self._test('function f(){return undefined ** 42;}', NaN)
        self._test('function f(){return 42 ** "2";}', 1764)
        self._test('function f(){return 42 ** "spam";}', NaN)
    def test_calc(self):
        self._test('function f(a){return 2*a+1;}', 7, args=[3])
@ -89,13 +112,60 @@ class TestJSInterpreter(unittest.TestCase):
        self._test('function f(){return 19 & 21;}', 17)
        self._test('function f(){return 11 >> 2;}', 2)
        self._test('function f(){return []? 2+3: 4;}', 5)
        # equality
        self._test('function f(){return 1 == 1}', True)
        self._test('function f(){return 1 == 1.0}', True)
        self._test('function f(){return 1 == "1"}', True)
        self._test('function f(){return 1 == 2}', False)
        self._test('function f(){return 1 != "1"}', False)
        self._test('function f(){return 1 != 2}', True)
        self._test('function f(){var x = {a: 1}; var y = x; return x == y}', True)
        self._test('function f(){var x = {a: 1}; return x == {a: 1}}', False)
        self._test('function f(){return NaN == NaN}', False)
        self._test('function f(){return null == undefined}', True)
        self._test('function f(){return "spam, eggs" == "spam, eggs"}', True)
        # strict equality
        self._test('function f(){return 1 === 1}', True)
        self._test('function f(){return 1 === 1.0}', True)
        self._test('function f(){return 1 === "1"}', False)
        self._test('function f(){return 1 === 2}', False)
        self._test('function f(){var x = {a: 1}; var y = x; return x === y}', True)
        self._test('function f(){var x = {a: 1}; return x === {a: 1}}', False)
        self._test('function f(){return NaN === NaN}', False)
        self._test('function f(){return null === undefined}', False)
        self._test('function f(){return null === null}', True)
        self._test('function f(){return undefined === undefined}', True)
        self._test('function f(){return "uninterned" === "uninterned"}', True)
        self._test('function f(){return 1 === 1}', True)
        self._test('function f(){return 1 === "1"}', False)
        self._test('function f(){return 1 !== 1}', False)
        self._test('function f(){return 1 !== "1"}', True)
        # expressions
        self._test('function f(){return 0 && 1 || 2;}', 2)
        self._test('function f(){return 0 ?? 42;}', 0)
        self._test('function f(){return "life, the universe and everything" < 42;}', False)
        # https://github.com/ytdl-org/youtube-dl/issues/32815
        self._test('function f(){return 0  - 7 * - 6;}', 42)
    def test_bitwise_operators_typecast(self):
        # madness
        self._test('function f(){return null << 5}', 0)
        self._test('function f(){return undefined >> 5}', 0)
        self._test('function f(){return 42 << NaN}', 42)
        self._test('function f(){return 42 << Infinity}', 42)
        self._test('function f(){return 0.0 << null}', 0)
        self._test('function f(){return NaN << 42}', 0)
        self._test('function f(){return "21.9" << 1}', 42)
        self._test('function f(){return true << "5";}', 32)
        self._test('function f(){return true << true;}', 2)
        self._test('function f(){return "19" & "21.9";}', 17)
        self._test('function f(){return "19" & false;}', 0)
        self._test('function f(){return "11.0" >> "2.1";}', 2)
        self._test('function f(){return 5 ^ 9;}', 12)
        self._test('function f(){return 0.0 << NaN}', 0)
        self._test('function f(){return null << undefined}', 0)
        self._test('function f(){return 21 << 4294967297}', 42)
    def test_array_access(self):
        self._test('function f(){var x = [1,2,3]; x[0] = 4; x[0] = 5; x[2.0] = 7; return x;}', [5, 2, 7])
@ -110,8 +180,8 @@ class TestJSInterpreter(unittest.TestCase):
        self._test('function f(){var x = 20; x = 30 + 1; return x;}', 31)
        self._test('function f(){var x = 20; x += 30 + 1; return x;}', 51)
        self._test('function f(){var x = 20; x -= 30 + 1; return x;}', -11)
        self._test('function f(){var x = 2; var y = ["a", "b"]; y[x%y["length"]]="z"; return y}', ['z', 'b'])
    @unittest.skip('Not yet fully implemented')
    def test_comments(self):
        self._test('''
            function f() {
@ -130,6 +200,15 @@ class TestJSInterpreter(unittest.TestCase):
            }
        ''', 3)
        self._test('''
            function f() {
                var x = ( /* 1 + */ 2 +
                          /* 30 * 40 */
                          50);
                return x;
            }
        ''', 52)
    def test_precedence(self):
        self._test('''
            function f() {
@ -151,6 +230,34 @@ class TestJSInterpreter(unittest.TestCase):
        self._test(jsi, 86000, args=['12/31/1969 18:01:26 MDT'])
        # epoch 0
        self._test(jsi, 0, args=['1 January 1970 00:00:00 UTC'])
        # undefined
        self._test(jsi, NaN, args=[JS_Undefined])
        # y,m,d, ... - may fail with older dates lacking DST data
        jsi = JSInterpreter(
            'function f() { return new Date(%s); }'
            % ('2024, 5, 29, 2, 52, 12, 42',))
        self._test(jsi, (
            1719625932042                           # UK value
            + (
                + 3600                              # back to GMT
                + (time.altzone if time.daylight    # host's DST
                   else time.timezone)
            ) * 1000))
        # no arg
        self.assertAlmostEqual(JSInterpreter(
            'function f() { return new Date() - 0; }').call_function('f'),
            time.time() * 1000, delta=100)
        # Date.now()
        self.assertAlmostEqual(JSInterpreter(
            'function f() { return Date.now(); }').call_function('f'),
            time.time() * 1000, delta=100)
        # Date.parse()
        jsi = JSInterpreter('function f(dt) { return Date.parse(dt); }')
        self._test(jsi, 0, args=['1 January 1970 00:00:00 UTC'])
        # Date.UTC()
        jsi = JSInterpreter('function f() { return Date.UTC(%s); }'
                            % ('1970, 0, 1, 0, 0, 0, 0',))
        self._test(jsi, 0)
    def test_call(self):
        jsi = JSInterpreter('''
@ -265,8 +372,28 @@ class TestJSInterpreter(unittest.TestCase):
        self._test('function f() { a=5; return (a -= 1, a+=3, a); }', 7)
        self._test('function f() { return (l=[0,1,2,3], function(a, b){return a+b})((l[1], l[2]), l[3]) }', 5)
    def test_not(self):
        self._test('function f() { return ! undefined; }', True)
        self._test('function f() { return !0; }', True)
        self._test('function f() { return !!0; }', False)
        self._test('function f() { return ![]; }', False)
        self._test('function f() { return !0 !== false; }', True)
    def test_void(self):
-        self._test('function f() { return void 42; }', None)
+        self._test('function f() { return void 42; }', JS_Undefined)
    def test_typeof(self):
        self._test('function f() { return typeof undefined; }', 'undefined')
        self._test('function f() { return typeof NaN; }', 'number')
        self._test('function f() { return typeof Infinity; }', 'number')
        self._test('function f() { return typeof true; }', 'boolean')
        self._test('function f() { return typeof null; }', 'object')
        self._test('function f() { return typeof "a string"; }', 'string')
        self._test('function f() { return typeof 42; }', 'number')
        self._test('function f() { return typeof 42.42; }', 'number')
        self._test('function f() { var g = function(){}; return typeof g; }', 'function')
        self._test('function f() { return typeof {key: "value"}; }', 'object')
        # not yet implemented: Symbol, BigInt
    def test_return_function(self):
        jsi = JSInterpreter('''
@ -283,7 +410,7 @@ class TestJSInterpreter(unittest.TestCase):
    def test_undefined(self):
        self._test('function f() { return undefined === undefined; }', True)
        self._test('function f() { return undefined; }', JS_Undefined)
-        self._test('function f() {return undefined ?? 42; }', 42)
+        self._test('function f() { return undefined ?? 42; }', 42)
        self._test('function f() { let v; return v; }', JS_Undefined)
        self._test('function f() { let v; return v**0; }', 1)
        self._test('function f() { let v; return [v>42, v<=42, v&&42, 42&&v]; }',
@ -324,8 +451,19 @@ class TestJSInterpreter(unittest.TestCase):
        self._test('function f() { let a; return a?.qq; }', JS_Undefined)
        self._test('function f() { let a = {m1: 42, m2: 0 }; return a?.qq; }', JS_Undefined)
    def test_indexing(self):
        self._test('function f() { return [1, 2, 3, 4][3]}', 4)
        self._test('function f() { return [1, [2, [3, [4]]]][1][1][1][0]}', 4)
        self._test('function f() { var o = {1: 2, 3: 4}; return o[3]}', 4)
        self._test('function f() { var o = {1: 2, 3: 4}; return o["3"]}', 4)
        self._test('function f() { return [1, [2, {3: [4]}]][1][1]["3"][0]}', 4)
        self._test('function f() { return [1, 2, 3, 4].length}', 4)
        self._test('function f() { var o = {1: 2, 3: 4}; return o.length}', JS_Undefined)
        self._test('function f() { var o = {1: 2, 3: 4}; o["length"] = 42; return o.length}', 42)
    def test_regex(self):
        self._test('function f() { let a=/,,[/,913,/](,)}/; }', None)
        self._test('function f() { let a=/,,[/,913,/](,)}/; return a.source;  }', ',,[/,913,/](,)}')
        jsi = JSInterpreter('''
            function x() { let a=/,,[/,913,/](,)}/; "".replace(a, ""); return a; }
@ -373,13 +511,6 @@ class TestJSInterpreter(unittest.TestCase):
        self._test('function f(){return -524999584 << 5}', 379882496)
        self._test('function f(){return 1236566549 << 5}', 915423904)
    def test_bitwise_operators_typecast(self):
        # madness
        self._test('function f(){return null << 5}', 0)
        self._test('function f(){return undefined >> 5}', 0)
        self._test('function f(){return 42 << NaN}', 42)
        self._test('function f(){return 42 << Infinity}', 42)
    def test_negative(self):
        self._test('function f(){return 2    *    -2.0    ;}', -4)
        self._test('function f(){return 2    -    - -2    ;}', 0)
@ -411,10 +542,19 @@ class TestJSInterpreter(unittest.TestCase):
            self._test(jsi, 't-e-s-t', args=[test_input, '-'])
            self._test(jsi, '', args=[[], '-'])
        self._test('function f(){return '
                   '[1, 1.0, "abc", {a: 1}, null, undefined, Infinity, NaN].join()}',
                   '1,1,abc,[object Object],,,Infinity,NaN')
        self._test('function f(){return '
                   '[1, 1.0, "abc", {a: 1}, null, undefined, Infinity, NaN].join("~")}',
                   '1~1~abc~[object Object]~~~Infinity~NaN')
    def test_split(self):
        test_result = list('test')
        tests = [
            'function f(a, b){return a.split(b)}',
            'function f(a, b){return a["split"](b)}',
            'function f(a, b){let x = ["split"]; return a[x[0]](b)}',
            'function f(a, b){return String.prototype.split.call(a, b)}',
            'function f(a, b){return String.prototype.split.apply(a, [b])}',
        ]
@ -424,6 +564,93 @@ class TestJSInterpreter(unittest.TestCase):
            self._test(jsi, test_result, args=['t-e-s-t', '-'])
            self._test(jsi, [''], args=['', '-'])
            self._test(jsi, [], args=['', ''])
        # RegExp split
        self._test('function f(){return "test".split(/(?:)/)}',
                   ['t', 'e', 's', 't'])
        self._test('function f(){return "t-e-s-t".split(/[es-]+/)}',
                   ['t', 't'])
        # from MDN: surrogate pairs aren't handled: case 1 fails
        # self._test('function f(){return "😄😄".split(/(?:)/)}',
        #            ['\ud83d', '\ude04', '\ud83d', '\ude04'])
        # case 2 beats Py3.2: it gets the case 1 result
        if sys.version_info >= (2, 6) and not ((3, 0) <= sys.version_info < (3, 3)):
            self._test('function f(){return "😄😄".split(/(?:)/u)}',
                       ['😄', '😄'])
    def test_slice(self):
        self._test('function f(){return [0, 1, 2, 3, 4, 5, 6, 7, 8].slice()}', [0, 1, 2, 3, 4, 5, 6, 7, 8])
        self._test('function f(){return [0, 1, 2, 3, 4, 5, 6, 7, 8].slice(0)}', [0, 1, 2, 3, 4, 5, 6, 7, 8])
        self._test('function f(){return [0, 1, 2, 3, 4, 5, 6, 7, 8].slice(5)}', [5, 6, 7, 8])
        self._test('function f(){return [0, 1, 2, 3, 4, 5, 6, 7, 8].slice(99)}', [])
        self._test('function f(){return [0, 1, 2, 3, 4, 5, 6, 7, 8].slice(-2)}', [7, 8])
        self._test('function f(){return [0, 1, 2, 3, 4, 5, 6, 7, 8].slice(-99)}', [0, 1, 2, 3, 4, 5, 6, 7, 8])
        self._test('function f(){return [0, 1, 2, 3, 4, 5, 6, 7, 8].slice(0, 0)}', [])
        self._test('function f(){return [0, 1, 2, 3, 4, 5, 6, 7, 8].slice(1, 0)}', [])
        self._test('function f(){return [0, 1, 2, 3, 4, 5, 6, 7, 8].slice(0, 1)}', [0])
        self._test('function f(){return [0, 1, 2, 3, 4, 5, 6, 7, 8].slice(3, 6)}', [3, 4, 5])
        self._test('function f(){return [0, 1, 2, 3, 4, 5, 6, 7, 8].slice(1, -1)}', [1, 2, 3, 4, 5, 6, 7])
        self._test('function f(){return [0, 1, 2, 3, 4, 5, 6, 7, 8].slice(-1, 1)}', [])
        self._test('function f(){return [0, 1, 2, 3, 4, 5, 6, 7, 8].slice(-3, -1)}', [6, 7])
        self._test('function f(){return "012345678".slice()}', '012345678')
        self._test('function f(){return "012345678".slice(0)}', '012345678')
        self._test('function f(){return "012345678".slice(5)}', '5678')
        self._test('function f(){return "012345678".slice(99)}', '')
        self._test('function f(){return "012345678".slice(-2)}', '78')
        self._test('function f(){return "012345678".slice(-99)}', '012345678')
        self._test('function f(){return "012345678".slice(0, 0)}', '')
        self._test('function f(){return "012345678".slice(1, 0)}', '')
        self._test('function f(){return "012345678".slice(0, 1)}', '0')
        self._test('function f(){return "012345678".slice(3, 6)}', '345')
        self._test('function f(){return "012345678".slice(1, -1)}', '1234567')
        self._test('function f(){return "012345678".slice(-1, 1)}', '')
        self._test('function f(){return "012345678".slice(-3, -1)}', '67')
    def test_splice(self):
        self._test('function f(){var T = ["0", "1", "2"]; T["splice"](2, 1, "0")[0]; return T }', ['0', '1', '0'])
    def test_pop(self):
        # pop
        self._test('function f(){var a = [0, 1, 2, 3, 4, 5, 6, 7, 8]; return [a.pop(), a]}',
                   [8, [0, 1, 2, 3, 4, 5, 6, 7]])
        self._test('function f(){return [].pop()}', JS_Undefined)
        # push
        self._test('function f(){var a = [0, 1, 2]; return [a.push(3, 4), a]}',
                   [5, [0, 1, 2, 3, 4]])
        self._test('function f(){var a = [0, 1, 2]; return [a.push(), a]}',
                   [3, [0, 1, 2]])
    def test_shift(self):
        # shift
        self._test('function f(){var a = [0, 1, 2, 3, 4, 5, 6, 7, 8]; return [a.shift(), a]}',
                   [0, [1, 2, 3, 4, 5, 6, 7, 8]])
        self._test('function f(){return [].shift()}', JS_Undefined)
        # unshift
        self._test('function f(){var a = [0, 1, 2]; return [a.unshift(3, 4), a]}',
                   [5, [3, 4, 0, 1, 2]])
        self._test('function f(){var a = [0, 1, 2]; return [a.unshift(), a]}',
                   [3, [0, 1, 2]])
    def test_forEach(self):
        self._test('function f(){var ret = []; var l = [4, 2]; '
                   'var log = function(e,i,a){ret.push([e,i,a]);}; '
                   'l.forEach(log); '
                   'return [ret.length, ret[0][0], ret[1][1], ret[0][2]]}',
                   [2, 4, 1, [4, 2]])
        self._test('function f(){var ret = []; var l = [4, 2]; '
                   'var log = function(e,i,a){this.push([e,i,a]);}; '
                   'l.forEach(log, ret); '
                   'return [ret.length, ret[0][0], ret[1][1], ret[0][2]]}',
                   [2, 4, 1, [4, 2]])
    def test_extract_function(self):
        jsi = JSInterpreter('function a(b) { return b + 1; }')
        func = jsi.extract_function('a')
        self.assertEqual(func([2]), 3)
    def test_extract_function_with_global_stack(self):
        jsi = JSInterpreter('function c(d) { return d + e + f + g; }')
        func = jsi.extract_function('c', {'e': 10}, {'f': 100, 'g': 1000})
        self.assertEqual(func([1]), 1111)
 if __name__ == '__main__':
--- a/test/test_youtube_signature.py
+++ b/test/test_youtube_signature.py
@ -1,4 +1,5 @@
 #!/usr/bin/env python
 # coding: utf-8
 from __future__ import unicode_literals
@ -12,6 +13,7 @@ import re
 import string
 from youtube_dl.compat import (
    compat_contextlib_suppress,
    compat_open as open,
    compat_str,
    compat_urlretrieve,
@ -50,23 +52,93 @@ _SIG_TESTS = [
    (
        'https://s.ytimg.com/yts/jsbin/html5player-en_US-vflBb0OQx.js',
        84,
-        '123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQ0STUVWXYZ!"#$%&\'()*+,@./:;<=>'
+        '123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQ0STUVWXYZ!"#$%&\'()*+,@./:;<=>',
    ),
    (
        'https://s.ytimg.com/yts/jsbin/html5player-en_US-vfl9FYC6l.js',
        83,
-        '123456789abcdefghijklmnopqr0tuvwxyzABCDETGHIJKLMNOPQRS>UVWXYZ!"#$%&\'()*+,-./:;<=F'
+        '123456789abcdefghijklmnopqr0tuvwxyzABCDETGHIJKLMNOPQRS>UVWXYZ!"#$%&\'()*+,-./:;<=F',
    ),
    (
        'https://s.ytimg.com/yts/jsbin/html5player-en_US-vflCGk6yw/html5player.js',
        '4646B5181C6C3020DF1D9C7FCFEA.AD80ABF70C39BD369CCCAE780AFBB98FA6B6CB42766249D9488C288',
-        '82C8849D94266724DC6B6AF89BBFA087EACCD963.B93C07FBA084ACAEFCF7C9D1FD0203C6C1815B6B'
+        '82C8849D94266724DC6B6AF89BBFA087EACCD963.B93C07FBA084ACAEFCF7C9D1FD0203C6C1815B6B',
    ),
    (
        'https://s.ytimg.com/yts/jsbin/html5player-en_US-vflKjOTVq/html5player.js',
        '312AA52209E3623129A412D56A40F11CB0AF14AE.3EE09501CB14E3BCDC3B2AE808BF3F1D14E7FBF12',
        '112AA5220913623229A412D56A40F11CB0AF14AE.3EE0950FCB14EEBCDC3B2AE808BF331D14E7FBF3',
-    )
+    ),
    (
        'https://www.youtube.com/s/player/6ed0d907/player_ias.vflset/en_US/base.js',
        '2aq0aqSyOoJXtK73m-uME_jv7-pT15gOFC02RFkGMqWpzEICs69VdbwQ0LDp1v7j8xx92efCJlYFYb1sUkkBSPOlPmXgIARw8JQ0qOAOAA',
        'AOq0QJ8wRAIgXmPlOPSBkkUs1bYFYlJCfe29xx8j7v1pDL2QwbdV96sCIEzpWqMGkFR20CFOg51Tp-7vj_EMu-m37KtXJoOySqa0',
    ),
    (
        'https://www.youtube.com/s/player/3bb1f723/player_ias.vflset/en_US/base.js',
        '2aq0aqSyOoJXtK73m-uME_jv7-pT15gOFC02RFkGMqWpzEICs69VdbwQ0LDp1v7j8xx92efCJlYFYb1sUkkBSPOlPmXgIARw8JQ0qOAOAA',
        'MyOSJXtKI3m-uME_jv7-pT12gOFC02RFkGoqWpzE0Cs69VdbwQ0LDp1v7j8xx92efCJlYFYb1sUkkBSPOlPmXgIARw8JQ0qOAOAA',
    ),
    (
        'https://www.youtube.com/s/player/2f1832d2/player_ias.vflset/en_US/base.js',
        '2aq0aqSyOoJXtK73m-uME_jv7-pT15gOFC02RFkGMqWpzEICs69VdbwQ0LDp1v7j8xx92efCJlYFYb1sUkkBSPOlPmXgIARw8JQ0qOAOAA',
        '0QJ8wRAIgXmPlOPSBkkUs1bYFYlJCfe29xxAj7v1pDL0QwbdV96sCIEzpWqMGkFR20CFOg51Tp-7vj_EMu-m37KtXJ2OySqa0q',
    ),
    (
        'https://www.youtube.com/s/player/643afba4/tv-player-ias.vflset/tv-player-ias.js',
        '2aq0aqSyOoJXtK73m-uME_jv7-pT15gOFC02RFkGMqWpzEICs69VdbwQ0LDp1v7j8xx92efCJlYFYb1sUkkBSPOlPmXgIARw8JQ0qOAOAA',
        'AAOAOq0QJ8wRAIgXmPlOPSBkkUs1bYFYlJCfe29xx8j7vgpDL0QwbdV06sCIEzpWqMGkFR20CFOS21Tp-7vj_EMu-m37KtXJoOy1',
    ),
    (
        'https://www.youtube.com/s/player/363db69b/player_ias.vflset/en_US/base.js',
        '2aq0aqSyOoJXtK73m-uME_jv7-pT15gOFC02RFkGMqWpzEICs69VdbwQ0LDp1v7j8xx92efCJlYFYb1sUkkBSPOlPmXgIARw8JQ0qOAOAA',
        '0aqSyOoJXtK73m-uME_jv7-pT15gOFC02RFkGMqWpz2ICs6EVdbwQ0LDp1v7j8xx92efCJlYFYb1sUkkBSPOlPmXgIARw8JQ0qOAOAA',
    ),
    (
        'https://www.youtube.com/s/player/363db69b/player_ias_tce.vflset/en_US/base.js',
        '2aq0aqSyOoJXtK73m-uME_jv7-pT15gOFC02RFkGMqWpzEICs69VdbwQ0LDp1v7j8xx92efCJlYFYb1sUkkBSPOlPmXgIARw8JQ0qOAOAA',
        '0aqSyOoJXtK73m-uME_jv7-pT15gOFC02RFkGMqWpz2ICs6EVdbwQ0LDp1v7j8xx92efCJlYFYb1sUkkBSPOlPmXgIARw8JQ0qOAOAA',
    ),
    (
        'https://www.youtube.com/s/player/4fcd6e4a/player_ias.vflset/en_US/base.js',
        '2aq0aqSyOoJXtK73m-uME_jv7-pT15gOFC02RFkGMqWpzEICs69VdbwQ0LDp1v7j8xx92efCJlYFYb1sUkkBSPOlPmXgIARw8JQ0qOAOAA',
        'wAOAOq0QJ8ARAIgXmPlOPSBkkUs1bYFYlJCfe29xx8q7v1pDL0QwbdV96sCIEzpWqMGkFR20CFOg51Tp-7vj_EMu-m37KtXJoOySqa0',
    ),
    (
        'https://www.youtube.com/s/player/4fcd6e4a/player_ias_tce.vflset/en_US/base.js',
        '2aq0aqSyOoJXtK73m-uME_jv7-pT15gOFC02RFkGMqWpzEICs69VdbwQ0LDp1v7j8xx92efCJlYFYb1sUkkBSPOlPmXgIARw8JQ0qOAOAA',
        'wAOAOq0QJ8ARAIgXmPlOPSBkkUs1bYFYlJCfe29xx8q7v1pDL0QwbdV96sCIEzpWqMGkFR20CFOg51Tp-7vj_EMu-m37KtXJoOySqa0',
    ),
    (
        'https://www.youtube.com/s/player/20830619/player_ias.vflset/en_US/base.js',
        '2aq0aqSyOoJXtK73m-uME_jv7-pT15gOFC02RFkGMqWpzEICs69VdbwQ0LDp1v7j8xx92efCJlYFYb1sUkkBSPOlPmXgIARw8JQ0qOAOAA',
        '7AOq0QJ8wRAIgXmPlOPSBkkAs1bYFYlJCfe29xx8jOv1pDL0Q2bdV96sCIEzpWqMGkFR20CFOg51Tp-7vj_EMu-m37KtXJoOySqa0qaw',
    ),
    (
        'https://www.youtube.com/s/player/20830619/player_ias_tce.vflset/en_US/base.js',
        '2aq0aqSyOoJXtK73m-uME_jv7-pT15gOFC02RFkGMqWpzEICs69VdbwQ0LDp1v7j8xx92efCJlYFYb1sUkkBSPOlPmXgIARw8JQ0qOAOAA',
        '7AOq0QJ8wRAIgXmPlOPSBkkAs1bYFYlJCfe29xx8jOv1pDL0Q2bdV96sCIEzpWqMGkFR20CFOg51Tp-7vj_EMu-m37KtXJoOySqa0qaw',
    ),
    (
        'https://www.youtube.com/s/player/20830619/player-plasma-ias-phone-en_US.vflset/base.js',
        '2aq0aqSyOoJXtK73m-uME_jv7-pT15gOFC02RFkGMqWpzEICs69VdbwQ0LDp1v7j8xx92efCJlYFYb1sUkkBSPOlPmXgIARw8JQ0qOAOAA',
        '7AOq0QJ8wRAIgXmPlOPSBkkAs1bYFYlJCfe29xx8jOv1pDL0Q2bdV96sCIEzpWqMGkFR20CFOg51Tp-7vj_EMu-m37KtXJoOySqa0qaw',
    ),
    (
        'https://www.youtube.com/s/player/20830619/player-plasma-ias-tablet-en_US.vflset/base.js',
        '2aq0aqSyOoJXtK73m-uME_jv7-pT15gOFC02RFkGMqWpzEICs69VdbwQ0LDp1v7j8xx92efCJlYFYb1sUkkBSPOlPmXgIARw8JQ0qOAOAA',
        '7AOq0QJ8wRAIgXmPlOPSBkkAs1bYFYlJCfe29xx8jOv1pDL0Q2bdV96sCIEzpWqMGkFR20CFOg51Tp-7vj_EMu-m37KtXJoOySqa0qaw',
    ),
    (
        'https://www.youtube.com/s/player/8a8ac953/player_ias_tce.vflset/en_US/base.js',
        '2aq0aqSyOoJXtK73m-uME_jv7-pT15gOFC02RFkGMqWpzEICs69VdbwQ0LDp1v7j8xx92efCJlYFYb1sUkkBSPOlPmXgIARw8JQ0qOAOAA',
        'IAOAOq0QJ8wRAAgXmPlOPSBkkUs1bYFYlJCfe29xx8j7v1pDL0QwbdV96sCIEzpWqMGkFR20CFOg51Tp-7vj_E2u-m37KtXJoOySqa0',
    ),
    (
        'https://www.youtube.com/s/player/8a8ac953/tv-player-es6.vflset/tv-player-es6.js',
        '2aq0aqSyOoJXtK73m-uME_jv7-pT15gOFC02RFkGMqWpzEICs69VdbwQ0LDp1v7j8xx92efCJlYFYb1sUkkBSPOlPmXgIARw8JQ0qOAOAA',
        'IAOAOq0QJ8wRAAgXmPlOPSBkkUs1bYFYlJCfe29xx8j7v1pDL0QwbdV96sCIEzpWqMGkFR20CFOg51Tp-7vj_E2u-m37KtXJoOySqa0',
    ),
 ]
 _NSIG_TESTS = [
@ -136,12 +208,16 @@ _NSIG_TESTS = [
    ),
    (
        'https://www.youtube.com/s/player/c57c113c/player_ias.vflset/en_US/base.js',
-        '-Txvy6bT5R6LqgnQNx', 'dcklJCnRUHbgSg',
+        'M92UUMHa8PdvPd3wyM', '3hPqLJsiNZx7yA',
    ),
    (
        'https://www.youtube.com/s/player/5a3b6271/player_ias.vflset/en_US/base.js',
        'B2j7f_UPT4rfje85Lu_e', 'm5DmNymaGQ5RdQ',
    ),
    (
        'https://www.youtube.com/s/player/7a062b77/player_ias.vflset/en_US/base.js',
        'NRcE3y3mVtm_cV-W', 'VbsCYUATvqlt5w',
    ),
    (
        'https://www.youtube.com/s/player/dac945fd/player_ias.vflset/en_US/base.js',
        'o8BkRxXhuYsBCWi6RplPdP', '3Lx32v_hmzTm6A',
@ -152,7 +228,11 @@ _NSIG_TESTS = [
    ),
    (
        'https://www.youtube.com/s/player/cfa9e7cb/player_ias.vflset/en_US/base.js',
-        'qO0NiMtYQ7TeJnfFG2', 'k9cuJDHNS5O7kQ',
+        'aCi3iElgd2kq0bxVbQ', 'QX1y8jGb2IbZ0w',
    ),
    (
        'https://www.youtube.com/s/player/8c7583ff/player_ias.vflset/en_US/base.js',
        '1wWCVpRR96eAmMI87L', 'KSkWAVv1ZQxC3A',
    ),
    (
        'https://www.youtube.com/s/player/b7910ca8/player_ias.vflset/en_US/base.js',
@ -166,6 +246,106 @@ _NSIG_TESTS = [
        'https://www.youtube.com/s/player/b22ef6e7/player_ias.vflset/en_US/base.js',
        'b6HcntHGkvBLk_FRf', 'kNPW6A7FyP2l8A',
    ),
    (
        'https://www.youtube.com/s/player/3400486c/player_ias.vflset/en_US/base.js',
        'lL46g3XifCKUZn1Xfw', 'z767lhet6V2Skl',
    ),
    (
        'https://www.youtube.com/s/player/5604538d/player_ias.vflset/en_US/base.js',
        '7X-he4jjvMx7BCX', 'sViSydX8IHtdWA',
    ),
    (
        'https://www.youtube.com/s/player/20dfca59/player_ias.vflset/en_US/base.js',
        '-fLCxedkAk4LUTK2', 'O8kfRq1y1eyHGw',
    ),
    (
        'https://www.youtube.com/s/player/b12cc44b/player_ias.vflset/en_US/base.js',
        'keLa5R2U00sR9SQK', 'N1OGyujjEwMnLw',
    ),
    (
        'https://www.youtube.com/s/player/3bb1f723/player_ias.vflset/en_US/base.js',
        'gK15nzVyaXE9RsMP3z', 'ZFFWFLPWx9DEgQ',
    ),
    (
        'https://www.youtube.com/s/player/f8f53e1a/player_ias.vflset/en_US/base.js',
        'VTQOUOv0mCIeJ7i8kZB', 'kcfD8wy0sNLyNQ',
    ),
    (
        'https://www.youtube.com/s/player/2f1832d2/player_ias.vflset/en_US/base.js',
        'YWt1qdbe8SAfkoPHW5d', 'RrRjWQOJmBiP',
    ),
    (
        'https://www.youtube.com/s/player/9c6dfc4a/player_ias.vflset/en_US/base.js',
        'jbu7ylIosQHyJyJV', 'uwI0ESiynAmhNg',
    ),
    (
        'https://www.youtube.com/s/player/f6e09c70/player_ias.vflset/en_US/base.js',
        'W9HJZKktxuYoDTqW', 'jHbbkcaxm54',
    ),
    (
        'https://www.youtube.com/s/player/f6e09c70/player_ias_tce.vflset/en_US/base.js',
        'W9HJZKktxuYoDTqW', 'jHbbkcaxm54',
    ),
    (
        'https://www.youtube.com/s/player/e7567ecf/player_ias_tce.vflset/en_US/base.js',
        'Sy4aDGc0VpYRR9ew_', '5UPOT1VhoZxNLQ',
    ),
    (
        'https://www.youtube.com/s/player/d50f54ef/player_ias_tce.vflset/en_US/base.js',
        'Ha7507LzRmH3Utygtj', 'XFTb2HoeOE5MHg',
    ),
    (
        'https://www.youtube.com/s/player/074a8365/player_ias_tce.vflset/en_US/base.js',
        'Ha7507LzRmH3Utygtj', 'ufTsrE0IVYrkl8v',
    ),
    (
        'https://www.youtube.com/s/player/643afba4/player_ias.vflset/en_US/base.js',
        'N5uAlLqm0eg1GyHO', 'dCBQOejdq5s-ww',
    ),
    (
        'https://www.youtube.com/s/player/69f581a5/tv-player-ias.vflset/tv-player-ias.js',
        '-qIP447rVlTTwaZjY', 'KNcGOksBAvwqQg',
    ),
    (
        'https://www.youtube.com/s/player/643afba4/tv-player-ias.vflset/tv-player-ias.js',
        'ir9-V6cdbCiyKxhr', '2PL7ZDYAALMfmA',
    ),
    (
        'https://www.youtube.com/s/player/643afba4/player_ias.vflset/en_US/base.js',
        'ir9-V6cdbCiyKxhr', '2PL7ZDYAALMfmA',
    ),
    (
        'https://www.youtube.com/s/player/363db69b/player_ias.vflset/en_US/base.js',
        'eWYu5d5YeY_4LyEDc', 'XJQqf-N7Xra3gg',
    ),
    (
        'https://www.youtube.com/s/player/4fcd6e4a/player_ias.vflset/en_US/base.js',
        'o_L251jm8yhZkWtBW', 'lXoxI3XvToqn6A',
    ),
    (
        'https://www.youtube.com/s/player/4fcd6e4a/tv-player-ias.vflset/tv-player-ias.js',
        'o_L251jm8yhZkWtBW', 'lXoxI3XvToqn6A',
    ),
    (
        'https://www.youtube.com/s/player/20830619/tv-player-ias.vflset/tv-player-ias.js',
        'ir9-V6cdbCiyKxhr', '9YE85kNjZiS4',
    ),
    (
        'https://www.youtube.com/s/player/20830619/player-plasma-ias-phone-en_US.vflset/base.js',
        'ir9-V6cdbCiyKxhr', '9YE85kNjZiS4',
    ),
    (
        'https://www.youtube.com/s/player/20830619/player-plasma-ias-tablet-en_US.vflset/base.js',
        'ir9-V6cdbCiyKxhr', '9YE85kNjZiS4',
    ),
    (
        'https://www.youtube.com/s/player/8a8ac953/player_ias_tce.vflset/en_US/base.js',
        'MiBYeXx_vRREbiCCmh', 'RtZYMVvmkE0JE',
    ),
    (
        'https://www.youtube.com/s/player/8a8ac953/tv-player-es6.vflset/tv-player-es6.js',
        'MiBYeXx_vRREbiCCmh', 'RtZYMVvmkE0JE',
    ),
 ]
@ -178,6 +358,8 @@ class TestPlayerInfo(unittest.TestCase):
            ('https://www.youtube.com/s/player/64dddad9/player-plasma-ias-phone-en_US.vflset/base.js', '64dddad9'),
            ('https://www.youtube.com/s/player/64dddad9/player-plasma-ias-phone-de_DE.vflset/base.js', '64dddad9'),
            ('https://www.youtube.com/s/player/64dddad9/player-plasma-ias-tablet-en_US.vflset/base.js', '64dddad9'),
            ('https://www.youtube.com/s/player/e7567ecf/player_ias_tce.vflset/en_US/base.js', 'e7567ecf'),
            ('https://www.youtube.com/s/player/643afba4/tv-player-ias.vflset/tv-player-ias.js', '643afba4'),
            # obsolete
            ('https://www.youtube.com/yts/jsbin/player_ias-vfle4-e03/en_US/base.js', 'vfle4-e03'),
            ('https://www.youtube.com/yts/jsbin/player_ias-vfl49f_g4/en_US/base.js', 'vfl49f_g4'),
@ -187,8 +369,9 @@ class TestPlayerInfo(unittest.TestCase):
            ('https://s.ytimg.com/yts/jsbin/html5player-en_US-vflXGBaUN.js', 'vflXGBaUN'),
            ('https://s.ytimg.com/yts/jsbin/html5player-en_US-vflKjOTVq/html5player.js', 'vflKjOTVq'),
        )
        ie = YoutubeIE(FakeYDL({'cachedir': False}))
        for player_url, expected_player_id in PLAYER_URLS:
-            player_id = YoutubeIE._extract_player_info(player_url)
+            player_id = ie._extract_player_info(player_url)
            self.assertEqual(player_id, expected_player_id)
@ -200,21 +383,19 @@ class TestSignature(unittest.TestCase):
            os.mkdir(self.TESTDATA_DIR)
    def tearDown(self):
-        try:
+        with compat_contextlib_suppress(OSError):
            for f in os.listdir(self.TESTDATA_DIR):
                os.remove(f)
        except OSError:
            pass
 def t_factory(name, sig_func, url_pattern):
    def make_tfunc(url, sig_input, expected_sig):
        m = url_pattern.match(url)
-        assert m, '%r should follow URL format' % url
+        assert m, '{0!r} should follow URL format'.format(url)
-        test_id = m.group('id')
+        test_id = re.sub(r'[/.-]', '_', m.group('id') or m.group('compat_id'))
        def test_func(self):
-            basename = 'player-{0}-{1}.js'.format(name, test_id)
+            basename = 'player-{0}.js'.format(test_id)
            fn = os.path.join(self.TESTDATA_DIR, basename)
            if not os.path.exists(fn):
@ -229,7 +410,7 @@ def t_factory(name, sig_func, url_pattern):
 def signature(jscode, sig_input):
-    func = YoutubeIE(FakeYDL())._parse_sig_js(jscode)
+    func = YoutubeIE(FakeYDL({'cachedir': False}))._parse_sig_js(jscode)
    src_sig = (
        compat_str(string.printable[:sig_input])
        if isinstance(sig_input, int) else sig_input)
@ -237,17 +418,23 @@ def signature(jscode, sig_input):
 def n_sig(jscode, sig_input):
-    funcname = YoutubeIE(FakeYDL())._extract_n_function_name(jscode)
+    ie = YoutubeIE(FakeYDL({'cachedir': False}))
-    return JSInterpreter(jscode).call_function(funcname, sig_input)
+    jsi = JSInterpreter(jscode)
    jsi, _, func_code = ie._extract_n_function_code_jsi(sig_input, jsi)
    return ie._extract_n_function_from_code(jsi, func_code)(sig_input)
 make_sig_test = t_factory(
-    'signature', signature, re.compile(r'.*-(?P<id>[a-zA-Z0-9_-]+)(?:/watch_as3|/html5player)?\.[a-z]+$'))
+    'signature', signature,
    re.compile(r'''(?x)
        .+/(?P<h5>html5)?player(?(h5)(?:-en_US)?-|/)(?P<id>[a-zA-Z0-9/._-]+)
        (?(h5)/(?:watch_as3|html5player))?\.js$
    '''))
 for test_spec in _SIG_TESTS:
    make_sig_test(*test_spec)
 make_nsig_test = t_factory(
-    'nsig', n_sig, re.compile(r'.+/player/(?P<id>[a-zA-Z0-9_-]+)/.+.js$'))
+    'nsig', n_sig, re.compile(r'.+/player/(?P<id>[a-zA-Z0-9_/.-]+)\.js$'))
 for test_spec in _NSIG_TESTS:
    make_nsig_test(*test_spec)
--- a/youtube_dl/YoutubeDL.py
+++ b/youtube_dl/YoutubeDL.py
@ -540,10 +540,14 @@ class YoutubeDL(object):
        """Print message to stdout if not in quiet mode."""
        return self.to_stdout(message, skip_eol, check_quiet=True)
-    def _write_string(self, s, out=None):
+    def _write_string(self, s, out=None, only_once=False, _cache=set()):
        if only_once and s in _cache:
            return
        write_string(s, out=out, encoding=self.params.get('encoding'))
        if only_once:
            _cache.add(s)
-    def to_stdout(self, message, skip_eol=False, check_quiet=False):
+    def to_stdout(self, message, skip_eol=False, check_quiet=False, only_once=False):
        """Print message to stdout if not in quiet mode."""
        if self.params.get('logger'):
            self.params['logger'].debug(message)
@ -552,9 +556,9 @@ class YoutubeDL(object):
            terminator = ['\n', ''][skip_eol]
            output = message + terminator
-            self._write_string(output, self._screen_file)
+            self._write_string(output, self._screen_file, only_once=only_once)
-    def to_stderr(self, message):
+    def to_stderr(self, message, only_once=False):
        """Print message to stderr."""
        assert isinstance(message, compat_str)
        if self.params.get('logger'):
@ -562,7 +566,7 @@ class YoutubeDL(object):
        else:
            message = self._bidi_workaround(message)
            output = message + '\n'
-            self._write_string(output, self._err_file)
+            self._write_string(output, self._err_file, only_once=only_once)
    def to_console_title(self, message):
        if not self.params.get('consoletitle', False):
@ -641,18 +645,11 @@ class YoutubeDL(object):
            raise DownloadError(message, exc_info)
        self._download_retcode = 1
-    def report_warning(self, message, only_once=False, _cache={}):
+    def report_warning(self, message, only_once=False):
        '''
        Print the message to stderr, it will be prefixed with 'WARNING:'
        If stderr is a tty file the 'WARNING:' will be colored
        '''
        if only_once:
            m_hash = hash((self, message))
            m_cnt = _cache.setdefault(m_hash, 0)
            _cache[m_hash] = m_cnt + 1
            if m_cnt > 0:
                return
        if self.params.get('logger') is not None:
            self.params['logger'].warning(message)
        else:
@ -663,7 +660,7 @@ class YoutubeDL(object):
            else:
                _msg_header = 'WARNING:'
            warning_message = '%s %s' % (_msg_header, message)
-            self.to_stderr(warning_message)
+            self.to_stderr(warning_message, only_once=only_once)
    def report_error(self, message, *args, **kwargs):
        '''
@ -677,6 +674,16 @@ class YoutubeDL(object):
        kwargs['message'] = '%s %s' % (_msg_header, message)
        self.trouble(*args, **kwargs)
    def write_debug(self, message, only_once=False):
        '''Log debug message or Print message to stderr'''
        if not self.params.get('verbose', False):
            return
        message = '[debug] {0}'.format(message)
        if self.params.get('logger'):
            self.params['logger'].debug(message)
        else:
            self.to_stderr(message, only_once)
    def report_unscoped_cookies(self, *args, **kwargs):
        # message=None, tb=False, is_error=False
        if len(args) <= 2:
@ -2514,7 +2521,7 @@ class YoutubeDL(object):
                self.get_encoding()))
        write_string(encoding_str, encoding=None)
-        writeln_debug = lambda *s: self._write_string('[debug] %s\n' % (''.join(s), ))
+        writeln_debug = lambda *s: self.write_debug(''.join(s))
        writeln_debug('youtube-dl version ', __version__)
        if _LAZY_LOADER:
            writeln_debug('Lazy loading extractors enabled')
--- a/youtube_dl/init.py
+++ b/youtube_dl/init.py
@ -18,7 +18,7 @@ from .compat import (
    compat_getpass,
    compat_register_utf8,
    compat_shlex_split,
-    workaround_optparse_bug9161,
+    _workaround_optparse_bug9161,
 )
 from .utils import (
    _UnsafeExtensionError,
@ -50,7 +50,7 @@ def _real_main(argv=None):
    # Compatibility fix for Windows
    compat_register_utf8()
-    workaround_optparse_bug9161()
+    _workaround_optparse_bug9161()
    setproctitle('youtube-dl')
--- a/youtube_dl/cache.py
+++ b/youtube_dl/cache.py
@ -1,6 +1,6 @@
 # coding: utf-8
 from __future__ import unicode_literals
 import errno
 import json
 import os
 import re
@ -8,14 +8,17 @@ import shutil
 import traceback
 from .compat import (
    compat_contextlib_suppress,
    compat_getenv,
    compat_open as open,
    compat_os_makedirs,
 )
 from .utils import (
    error_to_compat_str,
    escape_rfc3986,
    expand_path,
    is_outdated_version,
-    try_get,
+    traverse_obj,
    write_json_file,
 )
 from .version import __version__
@ -30,23 +33,35 @@ class Cache(object):
    def __init__(self, ydl):
        self._ydl = ydl
    def _write_debug(self, *args, **kwargs):
        self._ydl.write_debug(*args, **kwargs)
    def _report_warning(self, *args, **kwargs):
        self._ydl.report_warning(*args, **kwargs)
    def _to_screen(self, *args, **kwargs):
        self._ydl.to_screen(*args, **kwargs)
    def _get_param(self, k, default=None):
        return self._ydl.params.get(k, default)
    def _get_root_dir(self):
-        res = self._ydl.params.get('cachedir')
+        res = self._get_param('cachedir')
        if res is None:
            cache_root = compat_getenv('XDG_CACHE_HOME', '~/.cache')
            res = os.path.join(cache_root, self._YTDL_DIR)
        return expand_path(res)
    def _get_cache_fn(self, section, key, dtype):
-        assert re.match(r'^[a-zA-Z0-9_.-]+$', section), \
+        assert re.match(r'^[\w.-]+$', section), \
            'invalid section %r' % section
-        assert re.match(r'^[a-zA-Z0-9_.-]+$', key), 'invalid key %r' % key
+        key = escape_rfc3986(key, safe='').replace('%', ',')  # encode non-ascii characters
        return os.path.join(
            self._get_root_dir(), section, '%s.%s' % (key, dtype))
    @property
    def enabled(self):
-        return self._ydl.params.get('cachedir') is not False
+        return self._get_param('cachedir') is not False
    def store(self, section, key, data, dtype='json'):
        assert dtype in ('json',)
@ -56,61 +71,55 @@ class Cache(object):
        fn = self._get_cache_fn(section, key, dtype)
        try:
-            try:
+            compat_os_makedirs(os.path.dirname(fn), exist_ok=True)
-                os.makedirs(os.path.dirname(fn))
+            self._write_debug('Saving {section}.{key} to cache'.format(section=section, key=key))
            except OSError as ose:
                if ose.errno != errno.EEXIST:
                    raise
            write_json_file({self._VERSION_KEY: __version__, 'data': data}, fn)
        except Exception:
            tb = traceback.format_exc()
-            self._ydl.report_warning(
+            self._report_warning('Writing cache to {fn!r} failed: {tb}'.format(fn=fn, tb=tb))
                'Writing cache to %r failed: %s' % (fn, tb))
    def _validate(self, data, min_ver):
-        version = try_get(data, lambda x: x[self._VERSION_KEY])
+        version = traverse_obj(data, self._VERSION_KEY)
        if not version:  # Backward compatibility
            data, version = {'data': data}, self._DEFAULT_VERSION
        if not is_outdated_version(version, min_ver or '0', assume_new=False):
            return data['data']
-        self._ydl.to_screen(
+        self._write_debug('Discarding old cache from version {version} (needs {min_ver})'.format(version=version, min_ver=min_ver))
            'Discarding old cache from version {version} (needs {min_ver})'.format(**locals()))
-    def load(self, section, key, dtype='json', default=None, min_ver=None):
+    def load(self, section, key, dtype='json', default=None, **kw_min_ver):
        assert dtype in ('json',)
        min_ver = kw_min_ver.get('min_ver')
        if not self.enabled:
            return default
        cache_fn = self._get_cache_fn(section, key, dtype)
        with compat_contextlib_suppress(IOError):  # If no cache available
            try:
-            try:
+                with open(cache_fn, encoding='utf-8') as cachef:
-                with open(cache_fn, 'r', encoding='utf-8') as cachef:
+                    self._write_debug('Loading {section}.{key} from cache'.format(section=section, key=key), only_once=True)
                    return self._validate(json.load(cachef), min_ver)
-            except ValueError:
+            except (ValueError, KeyError):
                try:
                    file_size = os.path.getsize(cache_fn)
                except (OSError, IOError) as oe:
                    file_size = error_to_compat_str(oe)
-                self._ydl.report_warning(
+                self._report_warning('Cache retrieval from %s failed (%s)' % (cache_fn, file_size))
                    'Cache retrieval from %s failed (%s)' % (cache_fn, file_size))
        except IOError:
            pass  # No cache available
        return default
    def remove(self):
        if not self.enabled:
-            self._ydl.to_screen('Cache is disabled (Did you combine --no-cache-dir and --rm-cache-dir?)')
+            self._to_screen('Cache is disabled (Did you combine --no-cache-dir and --rm-cache-dir?)')
            return
        cachedir = self._get_root_dir()
        if not any((term in cachedir) for term in ('cache', 'tmp')):
-            raise Exception('Not removing directory %s - this does not look like a cache dir' % cachedir)
+            raise Exception('Not removing directory %s - this does not look like a cache dir' % (cachedir,))
-        self._ydl.to_screen(
+        self._to_screen(
-            'Removing cache dir %s .' % cachedir, skip_eol=True)
+            'Removing cache dir %s .' % (cachedir,), skip_eol=True, ),
        if os.path.exists(cachedir):
-            self._ydl.to_screen('.', skip_eol=True)
+            self._to_screen('.', skip_eol=True)
            shutil.rmtree(cachedir)
-        self._ydl.to_screen('.')
+        self._to_screen('.')
--- a/youtube_dl/casefold.py
+++ b/youtube_dl/casefold.py
@ -10,9 +10,10 @@ from .compat import (
 # https://github.com/unicode-org/icu/blob/main/icu4c/source/data/unidata/CaseFolding.txt
 # In case newly foldable Unicode characters are defined, paste the new version
 # of the text inside the ''' marks.
-# The text is expected to have only blank lines andlines with 1st character #,
+# The text is expected to have only blank lines and lines with 1st character #,
 # all ignored, and fold definitions like this:
-# `from_hex_code; space_separated_to_hex_code_list; comment`
+# `from_hex_code; status; space_separated_to_hex_code_list; comment`
 # Only `status` C/F are used.
 _map_str = '''
 # CaseFolding-15.0.0.txt
@ -1657,11 +1658,6 @@ _map = dict(
 del _map_str
-def casefold(s):
+def _casefold(s):
    assert isinstance(s, compat_str)
    return ''.join((_map.get(c, c) for c in s))
 __all__ = [
    'casefold',
 ]
--- a/youtube_dl/compat.py
+++ b/youtube_dl/compat.py
@ -16,7 +16,6 @@ import os
 import platform
 import re
 import shlex
 import shutil
 import socket
 import struct
 import subprocess
@ -24,11 +23,15 @@ import sys
 import types
 import xml.etree.ElementTree
 _IDENTITY = lambda x: x
 # naming convention
 # 'compat_' + Python3_name.replace('.', '_')
 # other aliases exist for convenience and/or legacy
 # wrap disposable test values in type() to reclaim storage
-# deal with critical unicode/str things first
+# deal with critical unicode/str things first:
 # compat_str, compat_basestring, compat_chr
 try:
    # Python 2
    compat_str, compat_basestring, compat_chr = (
@ -39,18 +42,23 @@ except NameError:
        str, (str, bytes), chr
    )
-# casefold
+
 # compat_casefold
 try:
    compat_str.casefold
    compat_casefold = lambda s: s.casefold()
 except AttributeError:
-    from .casefold import casefold as compat_casefold
+    from .casefold import _casefold as compat_casefold
 # compat_collections_abc
 try:
    import collections.abc as compat_collections_abc
 except ImportError:
    import collections as compat_collections_abc
 # compat_urllib_request
 try:
    import urllib.request as compat_urllib_request
 except ImportError:  # Python 2
@ -79,11 +87,15 @@ except TypeError:
    _add_init_method_arg(compat_urllib_request.Request)
    del _add_init_method_arg
 # compat_urllib_error
 try:
    import urllib.error as compat_urllib_error
 except ImportError:  # Python 2
    import urllib2 as compat_urllib_error
 # compat_urllib_parse
 try:
    import urllib.parse as compat_urllib_parse
 except ImportError:  # Python 2
@ -98,17 +110,23 @@ except ImportError:  # Python 2
 compat_urlparse = compat_urllib_parse
 compat_urllib_parse_urlparse = compat_urllib_parse.urlparse
 # compat_urllib_response
 try:
    import urllib.response as compat_urllib_response
 except ImportError:  # Python 2
    import urllib as compat_urllib_response
 # compat_urllib_response.addinfourl
 try:
    compat_urllib_response.addinfourl.status
 except AttributeError:
    # .getcode() is deprecated in Py 3.
    compat_urllib_response.addinfourl.status = property(lambda self: self.getcode())
 # compat_http_cookiejar
 try:
    import http.cookiejar as compat_cookiejar
 except ImportError:  # Python 2
@ -127,12 +145,16 @@ else:
    compat_cookiejar_Cookie = compat_cookiejar.Cookie
 compat_http_cookiejar_Cookie = compat_cookiejar_Cookie
 # compat_http_cookies
 try:
    import http.cookies as compat_cookies
 except ImportError:  # Python 2
    import Cookie as compat_cookies
 compat_http_cookies = compat_cookies
 # compat_http_cookies_SimpleCookie
 if sys.version_info[0] == 2 or sys.version_info < (3, 3):
    class compat_cookies_SimpleCookie(compat_cookies.SimpleCookie):
        def load(self, rawdata):
@ -155,11 +177,15 @@ else:
    compat_cookies_SimpleCookie = compat_cookies.SimpleCookie
 compat_http_cookies_SimpleCookie = compat_cookies_SimpleCookie
 # compat_html_entities, probably useless now
 try:
    import html.entities as compat_html_entities
 except ImportError:  # Python 2
    import htmlentitydefs as compat_html_entities
 # compat_html_entities_html5
 try:  # Python >= 3.3
    compat_html_entities_html5 = compat_html_entities.html5
 except AttributeError:
@ -2408,18 +2434,24 @@ except AttributeError:
    # Py < 3.1
    compat_http_client.HTTPResponse.getcode = lambda self: self.status
 # compat_urllib_HTTPError
 try:
    from urllib.error import HTTPError as compat_HTTPError
 except ImportError:  # Python 2
    from urllib2 import HTTPError as compat_HTTPError
 compat_urllib_HTTPError = compat_HTTPError
 # compat_urllib_request_urlretrieve
 try:
    from urllib.request import urlretrieve as compat_urlretrieve
 except ImportError:  # Python 2
    from urllib import urlretrieve as compat_urlretrieve
 compat_urllib_request_urlretrieve = compat_urlretrieve
 # compat_html_parser_HTMLParser, compat_html_parser_HTMLParseError
 try:
    from HTMLParser import (
        HTMLParser as compat_HTMLParser,
@ -2432,22 +2464,33 @@ except ImportError:  # Python 3
        # HTMLParseError was deprecated in Python 3.3 and removed in
        # Python 3.5. Introducing dummy exception for Python >3.5 for compatible
        # and uniform cross-version exception handling
        class compat_HTMLParseError(Exception):
            pass
 compat_html_parser_HTMLParser = compat_HTMLParser
 compat_html_parser_HTMLParseError = compat_HTMLParseError
 # compat_subprocess_get_DEVNULL
 try:
    _DEVNULL = subprocess.DEVNULL
    compat_subprocess_get_DEVNULL = lambda: _DEVNULL
 except AttributeError:
    compat_subprocess_get_DEVNULL = lambda: open(os.path.devnull, 'w')
 # compat_http_server
 try:
    import http.server as compat_http_server
 except ImportError:
    import BaseHTTPServer as compat_http_server
 # compat_urllib_parse_unquote_to_bytes,
 # compat_urllib_parse_unquote, compat_urllib_parse_unquote_plus,
 # compat_urllib_parse_urlencode,
 # compat_urllib_parse_parse_qs
 try:
    from urllib.parse import unquote_to_bytes as compat_urllib_parse_unquote_to_bytes
    from urllib.parse import unquote as compat_urllib_parse_unquote
@ -2455,8 +2498,7 @@ try:
    from urllib.parse import urlencode as compat_urllib_parse_urlencode
    from urllib.parse import parse_qs as compat_parse_qs
 except ImportError:  # Python 2
-    _asciire = (compat_urllib_parse._asciire if hasattr(compat_urllib_parse, '_asciire')
+    _asciire = getattr(compat_urllib_parse, '_asciire', None) or re.compile(r'([\x00-\x7f]+)')
                else re.compile(r'([\x00-\x7f]+)'))
    # HACK: The following are the correct unquote_to_bytes, unquote and unquote_plus
    # implementations from cpython 3.4.3's stdlib. Python 2's version
@ -2524,24 +2566,21 @@ except ImportError:  # Python 2
    # Possible solutions are to either port it from python 3 with all
    # the friends or manually ensure input query contains only byte strings.
    # We will stick with latter thus recursively encoding the whole query.
-    def compat_urllib_parse_urlencode(query, doseq=0, encoding='utf-8'):
+    def compat_urllib_parse_urlencode(query, doseq=0, safe='', encoding='utf-8', errors='strict'):
        def encode_elem(e):
            if isinstance(e, dict):
                e = encode_dict(e)
            elif isinstance(e, (list, tuple,)):
-                list_e = encode_list(e)
+                e = type(e)(encode_elem(el) for el in e)
                e = tuple(list_e) if isinstance(e, tuple) else list_e
            elif isinstance(e, compat_str):
-                e = e.encode(encoding)
+                e = e.encode(encoding, errors)
            return e
        def encode_dict(d):
-            return dict((encode_elem(k), encode_elem(v)) for k, v in d.items())
+            return tuple((encode_elem(k), encode_elem(v)) for k, v in d.items())
-        def encode_list(l):
+        return compat_urllib_parse._urlencode(encode_elem(query), doseq=doseq).decode('ascii')
            return [encode_elem(e) for e in l]
        return compat_urllib_parse._urlencode(encode_elem(query), doseq=doseq)
    # HACK: The following is the correct parse_qs implementation from cpython 3's stdlib.
    # Python 2's version is apparently totally broken
@ -2596,8 +2635,61 @@ except ImportError:  # Python 2
            ('parse_qs', compat_parse_qs)):
        setattr(compat_urllib_parse, name, fix)
    try:
        all(chr(i) in b'' for i in range(256))
    except TypeError:
        # not all chr(i) are str: patch Python2 quote
        _safemaps = getattr(compat_urllib_parse, '_safemaps', {})
        _always_safe = frozenset(compat_urllib_parse.always_safe)
        def _quote(s, safe='/'):
            """quote('abc def') -> 'abc%20def'"""
            if not s and s is not None:  # fast path
                return s
            safe = frozenset(safe)
            cachekey = (safe, _always_safe)
            try:
                safe_map = _safemaps[cachekey]
            except KeyError:
                safe = _always_safe | safe
                safe_map = {}
                for i in range(256):
                    c = chr(i)
                    safe_map[c] = (
                        c if (i < 128 and c in safe)
                        else b'%{0:02X}'.format(i))
                _safemaps[cachekey] = safe_map
            if safe.issuperset(s):
                return s
            return ''.join(safe_map[c] for c in s)
        # linked code
        def _quote_plus(s, safe=''):
            return (
                _quote(s, safe + b' ').replace(b' ', b'+') if b' ' in s
                else _quote(s, safe))
        # linked code
        def _urlcleanup():
            if compat_urllib_parse._urlopener:
                compat_urllib_parse._urlopener.cleanup()
            _safemaps.clear()
            compat_urllib_parse.ftpcache.clear()
        for name, fix in (
                ('quote', _quote),
                ('quote_plus', _quote_plus),
                ('urlcleanup', _urlcleanup)):
            setattr(compat_urllib_parse, '_' + name, getattr(compat_urllib_parse, name))
            setattr(compat_urllib_parse, name, fix)
 compat_urllib_parse_parse_qs = compat_parse_qs
 # compat_urllib_request_DataHandler
 try:
    from urllib.request import DataHandler as compat_urllib_request_DataHandler
 except ImportError:  # Python < 3.4
@ -2632,16 +2724,20 @@ except ImportError:  # Python < 3.4
            return compat_urllib_response.addinfourl(io.BytesIO(data), headers, url)
 # compat_xml_etree_ElementTree_ParseError
 try:
    from xml.etree.ElementTree import ParseError as compat_xml_parse_error
 except ImportError:  # Python 2.6
    from xml.parsers.expat import ExpatError as compat_xml_parse_error
 compat_xml_etree_ElementTree_ParseError = compat_xml_parse_error
-etree = xml.etree.ElementTree
+
 # compat_xml_etree_ElementTree_Element
 _etree = xml.etree.ElementTree
-class _TreeBuilder(etree.TreeBuilder):
+class _TreeBuilder(_etree.TreeBuilder):
    def doctype(self, name, pubid, system):
        pass
@ -2650,7 +2746,7 @@ try:
    # xml.etree.ElementTree.Element is a method in Python <=2.6 and
    # the following will crash with:
    #  TypeError: isinstance() arg 2 must be a class, type, or tuple of classes and types
-    isinstance(None, etree.Element)
+    isinstance(None, _etree.Element)
    from xml.etree.ElementTree import Element as compat_etree_Element
 except TypeError:  # Python <=2.6
    from xml.etree.ElementTree import _ElementInterface as compat_etree_Element
@ -2658,12 +2754,12 @@ compat_xml_etree_ElementTree_Element = compat_etree_Element
 if sys.version_info[0] >= 3:
    def compat_etree_fromstring(text):
-        return etree.XML(text, parser=etree.XMLParser(target=_TreeBuilder()))
+        return _etree.XML(text, parser=_etree.XMLParser(target=_TreeBuilder()))
 else:
    # python 2.x tries to encode unicode strings with ascii (see the
    # XMLParser._fixtext method)
    try:
-        _etree_iter = etree.Element.iter
+        _etree_iter = _etree.Element.iter
    except AttributeError:  # Python <=2.6
        def _etree_iter(root):
            for el in root.findall('*'):
@ -2675,27 +2771,29 @@ else:
    # 2.7 source
    def _XML(text, parser=None):
        if not parser:
-            parser = etree.XMLParser(target=_TreeBuilder())
+            parser = _etree.XMLParser(target=_TreeBuilder())
        parser.feed(text)
        return parser.close()
    def _element_factory(*args, **kwargs):
-        el = etree.Element(*args, **kwargs)
+        el = _etree.Element(*args, **kwargs)
        for k, v in el.items():
            if isinstance(v, bytes):
                el.set(k, v.decode('utf-8'))
        return el
    def compat_etree_fromstring(text):
-        doc = _XML(text, parser=etree.XMLParser(target=_TreeBuilder(element_factory=_element_factory)))
+        doc = _XML(text, parser=_etree.XMLParser(target=_TreeBuilder(element_factory=_element_factory)))
        for el in _etree_iter(doc):
            if el.text is not None and isinstance(el.text, bytes):
                el.text = el.text.decode('utf-8')
        return doc
-if hasattr(etree, 'register_namespace'):
+
-    compat_etree_register_namespace = etree.register_namespace
+# compat_xml_etree_register_namespace
-else:
+try:
    compat_etree_register_namespace = _etree.register_namespace
 except AttributeError:
    def compat_etree_register_namespace(prefix, uri):
        """Register a namespace prefix.
        The registry is global, and any existing mapping for either the
@ -2704,14 +2802,16 @@ else:
        attributes in this namespace will be serialized with prefix if possible.
        ValueError is raised if prefix is reserved or is invalid.
        """
-        if re.match(r"ns\d+$", prefix):
+        if re.match(r'ns\d+$', prefix):
-            raise ValueError("Prefix format reserved for internal use")
+            raise ValueError('Prefix format reserved for internal use')
-        for k, v in list(etree._namespace_map.items()):
+        for k, v in list(_etree._namespace_map.items()):
            if k == uri or v == prefix:
-                del etree._namespace_map[k]
+                del _etree._namespace_map[k]
-        etree._namespace_map[uri] = prefix
+        _etree._namespace_map[uri] = prefix
 compat_xml_etree_register_namespace = compat_etree_register_namespace
 # compat_xpath, compat_etree_iterfind
 if sys.version_info < (2, 7):
    # Here comes the crazy part: In 2.6, if the xpath is a unicode,
    # .//node does not match if a node is a direct child of . !
@ -2898,7 +2998,6 @@ if sys.version_info < (2, 7):
        def __init__(self, root):
            self.root = root
    ##
    # Generate all matching objects.
    def compat_etree_iterfind(elem, path, namespaces=None):
@ -2933,13 +3032,15 @@ if sys.version_info < (2, 7):
 else:
    compat_xpath = lambda xpath: xpath
    compat_etree_iterfind = lambda element, match: element.iterfind(match)
    compat_xpath = _IDENTITY
 # compat_os_name
 compat_os_name = os._name if os.name == 'java' else os.name
 # compat_shlex_quote
 if compat_os_name == 'nt':
    def compat_shlex_quote(s):
        return s if re.match(r'^[-_\w./]+$', s) else '"%s"' % s.replace('"', '\\"')
@ -2954,6 +3055,7 @@ else:
                return "'" + s.replace("'", "'\"'\"'") + "'"
 # compat_shlex.split
 try:
    args = shlex.split('中文')
    assert (isinstance(args, list)
@ -2969,6 +3071,7 @@ except (AssertionError, UnicodeEncodeError):
        return list(map(lambda s: s.decode('utf-8'), shlex.split(s, comments, posix)))
 # compat_ord
 def compat_ord(c):
    if isinstance(c, int):
        return c
@ -2976,6 +3079,7 @@ def compat_ord(c):
        return ord(c)
 # compat_getenv, compat_os_path_expanduser, compat_setenv
 if sys.version_info >= (3, 0):
    compat_getenv = os.getenv
    compat_expanduser = os.path.expanduser
@ -3063,6 +3167,22 @@ else:
 compat_os_path_expanduser = compat_expanduser
 # compat_os_makedirs
 try:
    os.makedirs('.', exist_ok=True)
    compat_os_makedirs = os.makedirs
 except TypeError:  # < Py3.2
    from errno import EEXIST as _errno_EEXIST
    def compat_os_makedirs(name, mode=0o777, exist_ok=False):
        try:
            return os.makedirs(name, mode=mode)
        except OSError as ose:
            if not (exist_ok and ose.errno == _errno_EEXIST):
                raise
 # compat_os_path_realpath
 if compat_os_name == 'nt' and sys.version_info < (3, 8):
    # os.path.realpath on Windows does not follow symbolic links
    # prior to Python 3.8 (see https://bugs.python.org/issue9949)
@ -3076,6 +3196,7 @@ else:
 compat_os_path_realpath = compat_realpath
 # compat_print
 if sys.version_info < (3, 0):
    def compat_print(s):
        from .utils import preferredencoding
@ -3086,6 +3207,7 @@ else:
        print(s)
 # compat_getpass_getpass
 if sys.version_info < (3, 0) and sys.platform == 'win32':
    def compat_getpass(prompt, *args, **kwargs):
        if isinstance(prompt, compat_str):
@ -3098,36 +3220,42 @@ else:
 compat_getpass_getpass = compat_getpass
 # compat_input
 try:
    compat_input = raw_input
 except NameError:  # Python 3
    compat_input = input
 # compat_kwargs
 # Python < 2.6.5 require kwargs to be bytes
 try:
-    def _testfunc(x):
+    (lambda x: x)(**{'x': 0})
        pass
    _testfunc(**{'x': 0})
 except TypeError:
    def compat_kwargs(kwargs):
        return dict((bytes(k), v) for k, v in kwargs.items())
 else:
-    compat_kwargs = lambda kwargs: kwargs
+    compat_kwargs = _IDENTITY
 # compat_numeric_types
 try:
    compat_numeric_types = (int, float, long, complex)
 except NameError:  # Python 3
    compat_numeric_types = (int, float, complex)
 # compat_integer_types
 try:
    compat_integer_types = (int, long)
 except NameError:  # Python 3
    compat_integer_types = (int, )
 # compat_int
 compat_int = compat_integer_types[-1]
 # compat_socket_create_connection
 if sys.version_info < (2, 7):
    def compat_socket_create_connection(address, timeout, source_address=None):
        host, port = address
@ -3154,6 +3282,7 @@ else:
    compat_socket_create_connection = socket.create_connection
 # compat_contextlib_suppress
 try:
    from contextlib import suppress as compat_contextlib_suppress
 except ImportError:
@ -3201,7 +3330,7 @@ except AttributeError:
 # Fix https://github.com/ytdl-org/youtube-dl/issues/4223
 # See http://bugs.python.org/issue9161 for what is broken
-def workaround_optparse_bug9161():
+def _workaround_optparse_bug9161():
    op = optparse.OptionParser()
    og = optparse.OptionGroup(op, 'foo')
    try:
@ -3220,9 +3349,10 @@ def workaround_optparse_bug9161():
        optparse.OptionGroup.add_option = _compat_add_option
-if hasattr(shutil, 'get_terminal_size'):  # Python >= 3.3
+# compat_shutil_get_terminal_size
-    compat_get_terminal_size = shutil.get_terminal_size
+try:
-else:
+    from shutil import get_terminal_size as compat_get_terminal_size  # Python >= 3.3
 except ImportError:
    _terminal_size = collections.namedtuple('terminal_size', ['columns', 'lines'])
    def compat_get_terminal_size(fallback=(80, 24)):
@ -3252,27 +3382,33 @@ else:
                columns = _columns
            if lines is None or lines <= 0:
                lines = _lines
        return _terminal_size(columns, lines)
 compat_shutil_get_terminal_size = compat_get_terminal_size
 # compat_itertools_count
 try:
-    itertools.count(start=0, step=1)
+    type(itertools.count(start=0, step=1))
    compat_itertools_count = itertools.count
-except TypeError:  # Python 2.6
+except TypeError:  # Python 2.6 lacks step
    def compat_itertools_count(start=0, step=1):
        while True:
            yield start
            start += step
 # compat_tokenize_tokenize
 if sys.version_info >= (3, 0):
    from tokenize import tokenize as compat_tokenize_tokenize
 else:
    from tokenize import generate_tokens as compat_tokenize_tokenize
 # compat_struct_pack, compat_struct_unpack, compat_Struct
 try:
-    struct.pack('!I', 0)
+    type(struct.pack('!I', 0))
 except TypeError:
    # In Python 2.6 and 2.7.x < 2.7.7, struct requires a bytes argument
    # See https://bugs.python.org/issue19099
@ -3304,8 +3440,10 @@ else:
        compat_Struct = struct.Struct
-# compat_map/filter() returning an iterator, supposedly the
+# builtins returning an iterator
-# same versioning as for zip below
+
 # compat_map, compat_filter
 # supposedly the same versioning as for zip below
 try:
    from future_builtins import map as compat_map
 except ImportError:
@ -3322,6 +3460,7 @@ except ImportError:
    except ImportError:
        compat_filter = filter
 # compat_zip
 try:
    from future_builtins import zip as compat_zip
 except ImportError:  # not 2.6+ or is 3.x
@ -3331,6 +3470,7 @@ except ImportError:  # not 2.6+ or is 3.x
        compat_zip = zip
 # compat_itertools_zip_longest
 # method renamed between Py2/3
 try:
    from itertools import zip_longest as compat_itertools_zip_longest
@ -3338,7 +3478,8 @@ except ImportError:
    from itertools import izip_longest as compat_itertools_zip_longest
-# new class in collections
+# compat_collections_chain_map
 # collections.ChainMap: new class
 try:
    from collections import ChainMap as compat_collections_chain_map
    # Py3.3's ChainMap is deficient
@ -3394,19 +3535,22 @@ except ImportError:
        def new_child(self, m=None, **kwargs):
            m = m or {}
            m.update(kwargs)
-            return compat_collections_chain_map(m, *self.maps)
+            # support inheritance !
            return type(self)(m, *self.maps)
        @property
        def parents(self):
-            return compat_collections_chain_map(*(self.maps[1:]))
+            return type(self)(*(self.maps[1:]))
 # compat_re_Pattern, compat_re_Match
 # Pythons disagree on the type of a pattern (RegexObject, _sre.SRE_Pattern, Pattern, ...?)
 compat_re_Pattern = type(re.compile(''))
 # and on the type of a match
 compat_re_Match = type(re.match('a', 'a'))
 # compat_base64_b64decode
 if sys.version_info < (3, 3):
    def compat_b64decode(s, *args, **kwargs):
        if isinstance(s, compat_str):
@ -3418,6 +3562,7 @@ else:
 compat_base64_b64decode = compat_b64decode
 # compat_ctypes_WINFUNCTYPE
 if platform.python_implementation() == 'PyPy' and sys.pypy_version_info < (5, 4, 0):
    # PyPy2 prior to version 5.4.0 expects byte strings as Windows function
    # names, see the original PyPy issue [1] and the youtube-dl one [2].
@ -3436,6 +3581,7 @@ else:
        return ctypes.WINFUNCTYPE(*args, **kwargs)
 # compat_open
 if sys.version_info < (3, 0):
    # open(file, mode='r', buffering=- 1, encoding=None, errors=None, newline=None, closefd=True) not: opener=None
    def compat_open(file_, *args, **kwargs):
@ -3463,18 +3609,28 @@ except AttributeError:
    def compat_datetime_timedelta_total_seconds(td):
        return (td.microseconds + (td.seconds + td.days * 24 * 3600) * 10**6) / 10**6
 # optional decompression packages
 # compat_brotli
 # PyPi brotli package implements 'br' Content-Encoding
 try:
    import brotli as compat_brotli
 except ImportError:
    compat_brotli = None
 # compat_ncompress
 # PyPi ncompress package implements 'compress' Content-Encoding
 try:
    import ncompress as compat_ncompress
 except ImportError:
    compat_ncompress = None
 # compat_zstandard
 # PyPi zstandard package implements 'zstd' Content-Encoding (RFC 8878 7.2)
 try:
    import zstandard as compat_zstandard
 except ImportError:
    compat_zstandard = None
 legacy = [
    'compat_HTMLParseError',
@ -3491,6 +3647,7 @@ legacy = [
    'compat_getpass',
    'compat_parse_qs',
    'compat_realpath',
    'compat_shlex_split',
    'compat_urllib_parse_parse_qs',
    'compat_urllib_parse_unquote',
    'compat_urllib_parse_unquote_plus',
@ -3504,8 +3661,6 @@ legacy = [
 __all__ = [
    'compat_html_parser_HTMLParseError',
    'compat_html_parser_HTMLParser',
    'compat_Struct',
    'compat_base64_b64decode',
    'compat_basestring',
@ -3514,13 +3669,9 @@ __all__ = [
    'compat_chr',
    'compat_collections_abc',
    'compat_collections_chain_map',
    'compat_datetime_timedelta_total_seconds',
    'compat_http_cookiejar',
    'compat_http_cookiejar_Cookie',
    'compat_http_cookies',
    'compat_http_cookies_SimpleCookie',
    'compat_contextlib_suppress',
    'compat_ctypes_WINFUNCTYPE',
    'compat_datetime_timedelta_total_seconds',
    'compat_etree_fromstring',
    'compat_etree_iterfind',
    'compat_filter',
@ -3529,9 +3680,16 @@ __all__ = [
    'compat_getpass_getpass',
    'compat_html_entities',
    'compat_html_entities_html5',
    'compat_html_parser_HTMLParseError',
    'compat_html_parser_HTMLParser',
    'compat_http_cookiejar',
    'compat_http_cookiejar_Cookie',
    'compat_http_cookies',
    'compat_http_cookies_SimpleCookie',
    'compat_http_client',
    'compat_http_server',
    'compat_input',
    'compat_int',
    'compat_integer_types',
    'compat_itertools_count',
    'compat_itertools_zip_longest',
@ -3541,6 +3699,7 @@ __all__ = [
    'compat_numeric_types',
    'compat_open',
    'compat_ord',
    'compat_os_makedirs',
    'compat_os_name',
    'compat_os_path_expanduser',
    'compat_os_path_realpath',
@ -3550,7 +3709,7 @@ __all__ = [
    'compat_register_utf8',
    'compat_setenv',
    'compat_shlex_quote',
-    'compat_shlex_split',
+    'compat_shutil_get_terminal_size',
    'compat_socket_create_connection',
    'compat_str',
    'compat_struct_pack',
@ -3570,5 +3729,5 @@ __all__ = [
    'compat_xml_etree_register_namespace',
    'compat_xpath',
    'compat_zip',
-    'workaround_optparse_bug9161',
+    'compat_zstandard',
 ]
--- a/youtube_dl/extractor/bokecc.py
+++ b/youtube_dl/extractor/bokecc.py
@ -32,7 +32,7 @@ class BokeCCBaseIE(InfoExtractor):
 class BokeCCIE(BokeCCBaseIE):
-    _IE_DESC = 'CC视频'
+    IE_DESC = 'CC视频'
    _VALID_URL = r'https?://union\.bokecc\.com/playvideo\.bo\?(?P<query>.*)'
    _TESTS = [{
--- a/youtube_dl/extractor/cloudy.py
+++ b/youtube_dl/extractor/cloudy.py
@ -9,7 +9,7 @@ from ..utils import (
 class CloudyIE(InfoExtractor):
-    _IE_DESC = 'cloudy.ec'
+    IE_DESC = 'cloudy.ec'
    _VALID_URL = r'https?://(?:www\.)?cloudy\.ec/(?:v/|embed\.php\?.*?\bid=)(?P<id>[A-Za-z0-9]+)'
    _TESTS = [{
        'url': 'https://www.cloudy.ec/v/af511e2527aac',
--- a/youtube_dl/extractor/common.py
+++ b/youtube_dl/extractor/common.py
@ -422,6 +422,8 @@ class InfoExtractor(object):
    _GEO_COUNTRIES = None
    _GEO_IP_BLOCKS = None
    _WORKING = True
    # supply this in public subclasses: used in supported sites list, etc
    # IE_DESC = 'short description of IE'
    def __init__(self, downloader=None):
        """Constructor. Receives an optional downloader."""
@ -503,7 +505,7 @@ class InfoExtractor(object):
        if not self._x_forwarded_for_ip:
            # Geo bypass mechanism is explicitly disabled by user
-            if not self._downloader.params.get('geo_bypass', True):
+            if not self.get_param('geo_bypass', True):
                return
            if not geo_bypass_context:
@ -525,7 +527,7 @@ class InfoExtractor(object):
            # Explicit IP block specified by user, use it right away
            # regardless of whether extractor is geo bypassable or not
-            ip_block = self._downloader.params.get('geo_bypass_ip_block', None)
+            ip_block = self.get_param('geo_bypass_ip_block', None)
            # Otherwise use random IP block from geo bypass context but only
            # if extractor is known as geo bypassable
@ -536,8 +538,8 @@ class InfoExtractor(object):
            if ip_block:
                self._x_forwarded_for_ip = GeoUtils.random_ipv4(ip_block)
-                if self._downloader.params.get('verbose', False):
+                if self.get_param('verbose', False):
-                    self._downloader.to_screen(
+                    self.to_screen(
                        '[debug] Using fake IP %s as X-Forwarded-For.'
                        % self._x_forwarded_for_ip)
                return
@ -546,7 +548,7 @@ class InfoExtractor(object):
            # Explicit country code specified by user, use it right away
            # regardless of whether extractor is geo bypassable or not
-            country = self._downloader.params.get('geo_bypass_country', None)
+            country = self.get_param('geo_bypass_country', None)
            # Otherwise use random country code from geo bypass context but
            # only if extractor is known as geo bypassable
@ -557,8 +559,8 @@ class InfoExtractor(object):
            if country:
                self._x_forwarded_for_ip = GeoUtils.random_ipv4(country)
-                if self._downloader.params.get('verbose', False):
+                if self.get_param('verbose', False):
-                    self._downloader.to_screen(
+                    self.to_screen(
                        '[debug] Using fake IP %s (%s) as X-Forwarded-For.'
                        % (self._x_forwarded_for_ip, country.upper()))
@ -584,9 +586,9 @@ class InfoExtractor(object):
            raise ExtractorError('An extractor error has occurred.', cause=e)
    def __maybe_fake_ip_and_retry(self, countries):
-        if (not self._downloader.params.get('geo_bypass_country', None)
+        if (not self.get_param('geo_bypass_country', None)
                and self._GEO_BYPASS
-                and self._downloader.params.get('geo_bypass', True)
+                and self.get_param('geo_bypass', True)
                and not self._x_forwarded_for_ip
                and countries):
            country_code = random.choice(countries)
@ -696,7 +698,7 @@ class InfoExtractor(object):
            if fatal:
                raise ExtractorError(errmsg, sys.exc_info()[2], cause=err)
            else:
-                self._downloader.report_warning(errmsg)
+                self.report_warning(errmsg)
                return False
    def _download_webpage_handle(self, url_or_request, video_id, note=None, errnote=None, fatal=True, encoding=None, data=None, headers={}, query={}, expected_status=None):
@ -768,11 +770,11 @@ class InfoExtractor(object):
            webpage_bytes = prefix + webpage_bytes
        if not encoding:
            encoding = self._guess_encoding_from_content(content_type, webpage_bytes)
-        if self._downloader.params.get('dump_intermediate_pages', False):
+        if self.get_param('dump_intermediate_pages', False):
            self.to_screen('Dumping request to ' + urlh.geturl())
            dump = base64.b64encode(webpage_bytes).decode('ascii')
-            self._downloader.to_screen(dump)
+            self.to_screen(dump)
-        if self._downloader.params.get('write_pages', False):
+        if self.get_param('write_pages', False):
            basen = '%s_%s' % (video_id, urlh.geturl())
            if len(basen) > 240:
                h = '___' + hashlib.md5(basen.encode('utf-8')).hexdigest()
@ -974,19 +976,9 @@ class InfoExtractor(object):
        """Print msg to screen, prefixing it with '[ie_name]'"""
        self._downloader.to_screen(self.__ie_msg(msg))
-    def write_debug(self, msg, only_once=False, _cache=[]):
+    def write_debug(self, msg, only_once=False):
        '''Log debug message or Print message to stderr'''
-        if not self.get_param('verbose', False):
+        self._downloader.write_debug(self.__ie_msg(msg), only_once=only_once)
            return
        message = '[debug] ' + self.__ie_msg(msg)
        logger = self.get_param('logger')
        if logger:
            logger.debug(message)
        else:
            if only_once and hash(message) in _cache:
                return
            self._downloader.to_stderr(message)
            _cache.append(hash(message))
    # name, default=None, *args, **kwargs
    def get_param(self, name, *args, **kwargs):
@ -1082,7 +1074,7 @@ class InfoExtractor(object):
                if mobj:
                    break
-        if not self._downloader.params.get('no_color') and compat_os_name != 'nt' and sys.stderr.isatty():
+        if not self.get_param('no_color') and compat_os_name != 'nt' and sys.stderr.isatty():
            _name = '\033[0;34m%s\033[0m' % name
        else:
            _name = name
@ -1100,7 +1092,7 @@ class InfoExtractor(object):
        elif fatal:
            raise RegexNotFoundError('Unable to extract %s' % _name)
        else:
-            self._downloader.report_warning('unable to extract %s' % _name + bug_reports_message())
+            self.report_warning('unable to extract %s' % _name + bug_reports_message())
            return None
    def _search_json(self, start_pattern, string, name, video_id, **kwargs):
@ -1170,7 +1162,7 @@ class InfoExtractor(object):
        username = None
        password = None
-        if self._downloader.params.get('usenetrc', False):
+        if self.get_param('usenetrc', False):
            try:
                netrc_machine = netrc_machine or self._NETRC_MACHINE
                info = netrc.netrc().authenticators(netrc_machine)
@ -1181,7 +1173,7 @@ class InfoExtractor(object):
                    raise netrc.NetrcParseError(
                        'No authenticators for %s' % netrc_machine)
            except (AttributeError, IOError, netrc.NetrcParseError) as err:
-                self._downloader.report_warning(
+                self.report_warning(
                    'parsing .netrc: %s' % error_to_compat_str(err))
        return username, password
@ -1218,10 +1210,10 @@ class InfoExtractor(object):
        """
        if self._downloader is None:
            return None
        downloader_params = self._downloader.params
-        if downloader_params.get('twofactor') is not None:
+        twofactor = self.get_param('twofactor')
-            return downloader_params['twofactor']
+        if twofactor is not None:
            return twofactor
        return compat_getpass('Type %s and press [Return]: ' % note)
@ -1356,7 +1348,7 @@ class InfoExtractor(object):
        elif fatal:
            raise RegexNotFoundError('Unable to extract JSON-LD')
        else:
-            self._downloader.report_warning('unable to extract JSON-LD %s' % bug_reports_message())
+            self.report_warning('unable to extract JSON-LD %s' % bug_reports_message())
            return {}
    def _json_ld(self, json_ld, video_id, fatal=True, expected_type=None):
@ -1587,7 +1579,7 @@ class InfoExtractor(object):
            if f.get('vcodec') == 'none':  # audio only
                preference -= 50
-                if self._downloader.params.get('prefer_free_formats'):
+                if self.get_param('prefer_free_formats'):
                    ORDER = ['aac', 'mp3', 'm4a', 'webm', 'ogg', 'opus']
                else:
                    ORDER = ['webm', 'opus', 'ogg', 'mp3', 'aac', 'm4a']
@ -1599,7 +1591,7 @@ class InfoExtractor(object):
            else:
                if f.get('acodec') == 'none':  # video only
                    preference -= 40
-                if self._downloader.params.get('prefer_free_formats'):
+                if self.get_param('prefer_free_formats'):
                    ORDER = ['flv', 'mp4', 'webm']
                else:
                    ORDER = ['webm', 'flv', 'mp4']
@ -1665,7 +1657,7 @@ class InfoExtractor(object):
        """ Either "http:" or "https:", depending on the user's preferences """
        return (
            'http:'
-            if self._downloader.params.get('prefer_insecure', False)
+            if self.get_param('prefer_insecure', False)
            else 'https:')
    def _proto_relative_url(self, url, scheme=None):
@ -3170,7 +3162,7 @@ class InfoExtractor(object):
                    # See com/longtailvideo/jwplayer/media/RTMPMediaProvider.as
                    # of jwplayer.flash.swf
                    rtmp_url_parts = re.split(
-                        r'((?:mp4|mp3|flv):)', source_url, 1)
+                        r'((?:mp4|mp3|flv):)', source_url, maxsplit=1)
                    if len(rtmp_url_parts) == 3:
                        rtmp_url, prefix, play_path = rtmp_url_parts
                        a_format.update({
@ -3197,7 +3189,7 @@ class InfoExtractor(object):
            if fatal:
                raise ExtractorError(msg)
            else:
-                self._downloader.report_warning(msg)
+                self.report_warning(msg)
        return res
    def _float(self, v, name, fatal=False, **kwargs):
@ -3207,7 +3199,7 @@ class InfoExtractor(object):
            if fatal:
                raise ExtractorError(msg)
            else:
-                self._downloader.report_warning(msg)
+                self.report_warning(msg)
        return res
    def _set_cookie(self, domain, name, value, expire_time=None, port=None,
@ -3216,12 +3208,12 @@ class InfoExtractor(object):
            0, name, value, port, port is not None, domain, True,
            domain.startswith('.'), path, True, secure, expire_time,
            discard, None, None, rest)
-        self._downloader.cookiejar.set_cookie(cookie)
+        self.cookiejar.set_cookie(cookie)
    def _get_cookies(self, url):
        """ Return a compat_cookies_SimpleCookie with the cookies for the url """
        req = sanitized_Request(url)
-        self._downloader.cookiejar.add_cookie_header(req)
+        self.cookiejar.add_cookie_header(req)
        return compat_cookies_SimpleCookie(req.get_header('Cookie'))
    def _apply_first_set_cookie_header(self, url_handle, cookie):
@ -3281,8 +3273,8 @@ class InfoExtractor(object):
        return not any_restricted
    def extract_subtitles(self, *args, **kwargs):
-        if (self._downloader.params.get('writesubtitles', False)
+        if (self.get_param('writesubtitles', False)
-                or self._downloader.params.get('listsubtitles')):
+                or self.get_param('listsubtitles')):
            return self._get_subtitles(*args, **kwargs)
        return {}
@ -3303,7 +3295,11 @@ class InfoExtractor(object):
        """ Merge subtitle dictionaries, language by language. """
        # ..., * , target=None
-        target = kwargs.get('target') or dict(subtitle_dict1)
+        target = kwargs.get('target')
        if target is None:
            target = dict(subtitle_dict1)
        else:
            subtitle_dicts = (subtitle_dict1,) + subtitle_dicts
        for subtitle_dict in subtitle_dicts:
            for lang in subtitle_dict:
@ -3311,8 +3307,8 @@ class InfoExtractor(object):
        return target
    def extract_automatic_captions(self, *args, **kwargs):
-        if (self._downloader.params.get('writeautomaticsub', False)
+        if (self.get_param('writeautomaticsub', False)
-                or self._downloader.params.get('listsubtitles')):
+                or self.get_param('listsubtitles')):
            return self._get_automatic_captions(*args, **kwargs)
        return {}
@ -3320,9 +3316,9 @@ class InfoExtractor(object):
        raise NotImplementedError('This method must be implemented by subclasses')
    def mark_watched(self, *args, **kwargs):
-        if (self._downloader.params.get('mark_watched', False)
+        if (self.get_param('mark_watched', False)
                and (self._get_login_info()[0] is not None
-                     or self._downloader.params.get('cookiefile') is not None)):
+                     or self.get_param('cookiefile') is not None)):
            self._mark_watched(*args, **kwargs)
    def _mark_watched(self, *args, **kwargs):
@ -3330,7 +3326,7 @@ class InfoExtractor(object):
    def geo_verification_headers(self):
        headers = {}
-        geo_verification_proxy = self._downloader.params.get('geo_verification_proxy')
+        geo_verification_proxy = self.get_param('geo_verification_proxy')
        if geo_verification_proxy:
            headers['Ytdl-request-proxy'] = geo_verification_proxy
        return headers
--- a/youtube_dl/extractor/itv.py
+++ b/youtube_dl/extractor/itv.py
@ -35,15 +35,6 @@ from ..utils import (
 class ITVBaseIE(InfoExtractor):
    def _search_nextjs_data(self, webpage, video_id, **kw):
        transform_source = kw.pop('transform_source', None)
        fatal = kw.pop('fatal', True)
        return self._parse_json(
            self._search_regex(
                r'''<script\b[^>]+\bid=('|")__NEXT_DATA__\1[^>]*>(?P<js>[^<]+)</script>''',
                webpage, 'next.js data', group='js', fatal=fatal, **kw),
            video_id, transform_source=transform_source, fatal=fatal)
    def __handle_request_webpage_error(self, err, video_id=None, errnote=None, fatal=True):
        if errnote is False:
            return False
@ -109,7 +100,9 @@ class ITVBaseIE(InfoExtractor):
 class ITVIE(ITVBaseIE):
    _VALID_URL = r'https?://(?:www\.)?itv\.com/(?:(?P<w>watch)|hub)/[^/]+/(?(w)[\w-]+/)(?P<id>\w+)'
-    _IE_DESC = 'ITVX'
+    IE_DESC = 'ITVX'
    _WORKING = False
    _TESTS = [{
        'note': 'Hub URLs redirect to ITVX',
        'url': 'https://www.itv.com/hub/liar/2a4547a0012',
@ -270,7 +263,7 @@ class ITVIE(ITVBaseIE):
                'ext': determine_ext(href, 'vtt'),
            })
-        next_data = self._search_nextjs_data(webpage, video_id, fatal=False, default='{}')
+        next_data = self._search_nextjs_data(webpage, video_id, fatal=False, default={})
        video_data.update(traverse_obj(next_data, ('props', 'pageProps', ('title', 'episode')), expected_type=dict)[0] or {})
        title = traverse_obj(video_data, 'headerTitle', 'episodeTitle')
        info = self._og_extract(webpage, require_title=not title)
@ -323,7 +316,7 @@ class ITVIE(ITVBaseIE):
 class ITVBTCCIE(ITVBaseIE):
    _VALID_URL = r'https?://(?:www\.)?itv\.com/(?!(?:watch|hub)/)(?:[^/]+/)+(?P<id>[^/?#&]+)'
-    _IE_DESC = 'ITV articles: News, British Touring Car Championship'
+    IE_DESC = 'ITV articles: News, British Touring Car Championship'
    _TESTS = [{
        'note': 'British Touring Car Championship',
        'url': 'https://www.itv.com/btcc/articles/btcc-2018-all-the-action-from-brands-hatch',
--- a/youtube_dl/extractor/senateisvp.py
+++ b/youtube_dl/extractor/senateisvp.py
@ -47,7 +47,7 @@ class SenateISVPIE(InfoExtractor):
        ['vetaff', '76462', 'http://vetaff-f.akamaihd.net'],
        ['arch', '', 'http://ussenate-f.akamaihd.net/']
    ]
-    _IE_NAME = 'senate.gov'
+    IE_NAME = 'senate.gov'
    _VALID_URL = r'https?://(?:www\.)?senate\.gov/isvp/?\?(?P<qs>.+)'
    _TESTS = [{
        'url': 'http://www.senate.gov/isvp/?comm=judiciary&type=live&stt=&filename=judiciary031715&auto_play=false&wmode=transparent&poster=http%3A%2F%2Fwww.judiciary.senate.gov%2Fthemes%2Fjudiciary%2Fimages%2Fvideo-poster-flash-fit.png',
--- a/youtube_dl/extractor/youtube.py
+++ b/youtube_dl/extractor/youtube.py
--- a/youtube_dl/jsinterp.py
+++ b/youtube_dl/jsinterp.py
--- a/youtube_dl/utils.py
+++ b/youtube_dl/utils.py
@ -4204,12 +4204,16 @@ def lowercase_escape(s):
        s)
-def escape_rfc3986(s):
+def escape_rfc3986(s, safe=None):
    """Escape non-ASCII characters as suggested by RFC 3986"""
    if sys.version_info < (3, 0):
        s = _encode_compat_str(s, 'utf-8')
        if safe is not None:
            safe = _encode_compat_str(safe, 'utf-8')
    if safe is None:
        safe = b"%/;:@&=+$,!~*'()?#[]"
    # ensure unicode: after quoting, it can always be converted
-    return compat_str(compat_urllib_parse.quote(s, b"%/;:@&=+$,!~*'()?#[]"))
+    return compat_str(compat_urllib_parse.quote(s, safe))
 def escape_url(url):
--- a/youtube_dl/version.py
+++ b/youtube_dl/version.py
@ -1,3 +1,3 @@
 from __future__ import unicode_literals
-__version__ = '2021.12.17'
+__version__ = '2025.04.07'
Author	SHA1	Message	Date
dirkf	c052a16f72	[JSInterp] Add tests and relevant functionality from yt-dlp * thx seproDev, bashonly: yt-dlp/yt-dlp#12760, yt-dlp/yt-dlp#12761: - Improve nested attribute support - Pass global stack when extracting objects - interpret_statement: Match attribute before indexing - Fix assignment to array elements with nested brackets - Add new signature tests - Invalidate JS function cache - Avoid testdata dupes now that we cache by URL * rework nsig function name search * fully fixes #33102 * update cache required versions * update program version	2025-04-08 01:59:00 +01:00
dirkf	bd2ded59f2	[JSInterp] Improve unary operators; add `!`	2025-04-08 01:59:00 +01:00
dirkf	16b7e97afa	[JSInterp] Add `_separate_at_op()`	2025-04-08 01:59:00 +01:00
dirkf	d21717978c	[JSInterp] Improve JS classes, etc	2025-04-08 01:59:00 +01:00
dirkf	7513413794	[JSInterp] Reorganise some declarations to align better with yt-dlp	2025-04-08 01:59:00 +01:00
dirkf	67dbfa65f2	[InfoExtractor] Fix merging subtitles to empty target	2025-04-08 01:59:00 +01:00
dirkf	6eb6d6dff5	[InfoExtractor] Use local variants for remaining parent method calls * ... where defined	2025-04-08 01:59:00 +01:00
dirkf	6c40d9f847	[YouTube] Remove remaining hard-coded API keys * no longer required for these cases	2025-04-08 01:59:00 +01:00
dirkf	1b08d3281d	[YouTube] Fix playlist continuation extraction * thx coletdjnz, bashonly: yt-dlp/yt-dlp#12777	2025-04-08 01:59:00 +01:00
dirkf	32b8d31780	[YouTube] Support shorts playlist * only 1..100: yt-dlp/yt-dlp#11130	2025-04-08 01:59:00 +01:00
dirkf	570b868078	[cache] Use `esc_rfc3986` to encode cache key	2025-04-08 01:59:00 +01:00
dirkf	2190e89260	[utils] Support optional `safe` argument for `escape_rfc3986()`	2025-04-08 01:59:00 +01:00
dirkf	7e136639db	[compat] Improve Py2 compatibility for URL Quoting	2025-04-08 01:59:00 +01:00
dirkf	cedeeed56f	[cache] Align further with yt-dlp * use compat_os_makedirs * support non-ASCII characters in cache key * improve logging	2025-04-08 01:59:00 +01:00
dirkf	add4622870	[compat] Add compat_os_makedirs * support exists_ok parameter in Py < 3.2	2025-04-08 01:59:00 +01:00
dirkf	9a6ddece4d	[core] Refactor message routines to align better with yt-dlp * in particular, support `only_once` in the same methods	2025-04-08 01:59:00 +01:00
dirkf	3eb8d22ddb	[JSInterp] Temporary fix for #33102	2025-03-31 04:21:09 +01:00
dirkf	4e714f9df1	[Misc] Correct [_]IE_DESC/NAME in a few IEs * thx seproDev, yt-dlp/yt-dlp/pull/12694/commits/ae69e3c * also add documenting comment in `InfoExtractor`	2025-03-26 12:47:19 +00:00
dirkf	c1ea7f5a24	[ITV] Mark ITVX not working * update old shim * correct [_]IE_DESC	2025-03-26 12:17:49 +00:00
dirkf	2b4fbfce25	[YouTube] Support player `4fcd6e4a` thx seproDev, bashonly: yt-dlp/yt-dlp#12748	2025-03-26 02:27:25 +00:00
dirkf	1bc45b8b6c	[JSInterp] Use `,` for join() with null/undefined argument Eg: [1,2,3].join(null) -> '1,2,3'	2025-03-25 22:35:06 +00:00
dirkf	b982d77d0b	[YouTube] Align signature tests with yt-dlp thx bashonly, yt-dlp/yt-dlp#12725	2025-03-25 22:35:06 +00:00
dirkf	c55dbf4838	[YouTube] Update signature extraction for players `643afba4`, `363db69b`	2025-03-25 22:35:06 +00:00
dirkf	087d865230	[YouTube] Support new player URL patterns	2025-03-25 22:35:06 +00:00
dirkf	a4fc1151f1	[JSInterp] Improve indexing * catch invalid list index with `ValueError` (eg [1, 2]['ab'] -> undefined) * allow assignment outside existing list (eg var l = [1,2]; l[9] = 0;)	2025-03-25 22:35:05 +00:00
dirkf	a464c159e6	[YouTube] Make `_extract_player_info()` use `_search_regex()`	2025-03-25 22:35:05 +00:00
dirkf	7dca08eff0	[YouTube] Also get original of translated automatic captions	2025-03-25 22:35:05 +00:00
dirkf	2239ee7965	[YouTube] Get subtitles/automatic captions from both web and API responses	2025-03-25 22:35:05 +00:00
dirkf	da7223d4aa	[YouTube] Improve support for tce-style player JS * improve extraction of global "useful data" Array from player JS * also handle tv-player and add tests: thx seproDev (yt-dlp/yt-dlp#12684) Co-Authored-By: sepro <sepro@sepr0.com>	2025-03-21 16:26:25 +00:00
dirkf	37c2440d6a	[YouTube] Update player client data thx seproDev (yt-dlp/yt-dlp#12603) Co-authored-by: sepro <sepro@sepr0.com>	2025-03-21 16:13:24 +00:00
dirkf	420d53387c	[JSInterp] Improve tests * from yt-dlp/yt-dlp#12313 * also fix d7c2708	2025-03-11 02:00:24 +00:00
dirkf	32f89de92b	[YouTube] Update TVHTML5 client parameters * resolves #33078	2025-03-11 02:00:24 +00:00
dirkf	283dca56fe	[YouTube] Initially support tce-style player JS * resolves #33079	2025-03-11 02:00:24 +00:00
dirkf	422b1b31cf	[YouTube] Temporarily redirect from tce-style player JS	2025-03-11 02:00:24 +00:00
dirkf	1dc27e1c3b	[JSInterp] Make indexing error handling more conformant * by default TypeError -> undefined, else raise * set allow_undefined=True/False to override	2025-03-11 02:00:24 +00:00
dirkf	af049e309b	[JSInterp] Handle undefined, etc, passed to JS_RegExp and Exception	2025-03-11 02:00:24 +00:00
dirkf	94849bc997	[JSInterp] Improve Date processing * add JS_Date class implementing JS Date * support constructor args other than date string * support static methods of Date * Date objects are still automatically coerced to timestamp before using in JS.	2025-03-11 02:00:24 +00:00
dirkf	974c7d7f34	[compat] Fix inheriting from compat_collections_chain_map * see ytdl-org/youtube-dl#33079#issuecomment-2704038049	2025-03-11 02:00:24 +00:00
dirkf	8738407d77	[compat] Support zstd Content-Encoding * see RFC 8878 7.2	2025-03-11 02:00:24 +00:00
dirkf	cecaa18b80	[compat] Clean-up * make workaround_optparse_bug9161 private * add comments * avoid leaving test objects behind	2025-03-11 02:00:24 +00:00
dirkf	673277e510	[YouTube] Fix 91b1569	2025-02-28 01:02:20 +00:00
dirkf	91b1569f68	[YouTube] Fix channel playlist extraction (#33074 ) * [YouTube] Extract playlist items from LOCKUP_VIEW_MODEL_... * resolves #33073 * thx seproDev (yt-dlp/yt-dlp#11615) Co-authored-by: sepro <sepro@sepr0.com>	2025-02-28 00:02:10 +00:00
dirkf	711e72c292	[JSInterp] Fix bit-shift coercion for player 9c6dfc4a	2025-02-07 00:01:50 +00:00
dirkf	26b6f15d14	[compat] Make casefold private * if required, not supported: `from youtube_dl.casefold import _casefold as casefold`	2025-02-07 00:01:50 +00:00
dirkf	5975d7bb96	[YouTube] Use X-Goog-Visitor-Id * required with tv player client * resolves #33030	2025-01-22 06:52:40 +00:00
dirkf	63fb0fc415	[YouTube] Retain .videoDetails members from all player responses	2025-01-20 13:23:54 +00:00
dirkf	b09442a2f4	[YouTube] Also use ios client when is_live	2025-01-19 01:18:34 +00:00
dirkf	55ad8a24ca	[YouTube] Support `... /feeds/videos.xml?playlist_id={pl_id}`	2025-01-15 03:22:56 +00:00
dirkf	21fff05121	[YouTube] Switch to TV API client * thx yt-dlp/yt-dlp#12059	2025-01-15 03:19:15 +00:00
dirkf	1036478d13	[YouTube] Endure subtitle URLs are complete * WEB URLs are, MWEB not * resolves #33017	2025-01-06 01:39:04 +00:00
dirkf	00ad2b8ca1	[YouTube] Refactor subtitle processing * move to internal function * use `traverse-obj()`	2025-01-06 01:24:30 +00:00
dirkf	ab7c61ca29	[YouTube] Apply code style changes, trailing commas, etc	2025-01-06 01:22:16 +00:00
dirkf	176fc2cb00	[YouTube] Avoid early crash if webpage can't be read * see issue #33013	2024-12-31 14:51:29 +00:00
dirkf	d55d1f423d	[YouTube] Always extract using MWEB API client * temporary fix-up for 403 on download * MWEB parameters from yt-dlp 2024-12-06	2024-12-16 12:38:51 +00:00
dirkf	eeafbbc3e5	[YouTube] Fix signature function extraction for `2f1832d2` * `_` was omitted from patterns * thx yt-dlp/yt-dlp#11801 Co-authored-by: bashonly	2024-12-16 12:38:51 +00:00
dirkf	cd7c7b5edb	[YouTube] Simplify pattern for nsig function name extraction	2024-12-16 12:38:51 +00:00
dirkf	eed784e15f	[YouTube] Pass nsig value as return hook, fixes player `3bb1f723`	2024-12-16 12:38:51 +00:00
dirkf	b4469a0f65	[YouTube] Handle player `3bb1f723` * fix signature code extraction * raise if n function returns input value * add new tests from yt-dlp Co-authored-by: bashonly	2024-12-16 12:38:51 +00:00
dirkf	ce1e556b8f	[jsinterp] Add return hook for player `3bb1f723` * set var `_ytdl_do_not_return` to a specific value in the scope of a function * if an expression to be returned has that value, `return` becomes `void`	2024-12-16 12:38:51 +00:00
dirkf	f487b4a02a	[jsinterp] Strip /* comments / when parsing NB: _separate() is looking creaky	2024-12-16 12:38:51 +00:00
dirkf	60835ca16c	[jsinterp] Fix and improve "methods" * push, unshift return new length * impove edge cases for push/pop, shift/unshift, forEach, indexOf, charCodeAt * increase test coverage	2024-12-16 12:38:51 +00:00
dirkf	94fd774608	[jsinterp] Fix and improve split/join * improve split/join edge cases * correctly implement regex split (not like re.split)	2024-12-16 12:38:51 +00:00
dirkf	5dee6213ed	[jsinterp] Fix and improve arithmetic operations * addition becomes concat with a string operand * improve handling of edgier cases * arithmetic in float like JS (more places need cast to int?) * increase test coverage	2024-12-16 12:38:51 +00:00
dirkf	81e64cacf2	[jsinterp] Support multiple indexing (eg a[1][2]) * extend single indexing with improved RE (should probably use/have used _separate_at_paren()) * fix some cases that should have given undefined, not throwing * standardise RE group names * support length of objects, like {1: 2, 3: 4, length: 42}	2024-12-16 12:38:51 +00:00
dirkf	c1a03b1ac3	[jsinterp] Fix and improve loose and strict equality operations * reimplement loose equality according to MDN (eg, 1 == "1") * improve strict equality (eg, "abc" === "abc" but 'abc' is not 'abc') * add tests for above	2024-12-16 12:38:51 +00:00
dirkf	118c6d7a17	[jsinterp] Implement `typeof` operator	2024-12-16 12:38:51 +00:00
dirkf	f28d7178e4	[InfoExtractor] Use kwarg maxsplit for re.split * May become kw-only in future Pythons	2024-12-16 12:38:51 +00:00
dirkf	c5098961b0	[Youtube] Rework n function extraction pattern Now also succeeds with player b12cc44b	2024-08-06 20:59:09 +01:00
dirkf	dbc08fba83	[jsinterp] Improve slice implementation for player b12cc44b Partly taken from yt-dlp/yt-dlp#10664, thx seproDev Fixes #32896	2024-08-06 20:51:38 +01:00
Aiur Adept	71223bff39	[Youtube] Fix nsig extraction for player 20dfca59 (#32891 ) * dirkf's patch for nsig extraction * add generic search per yt-dlp/yt-dlp/pull/10611 - thx bashonly --------- Co-authored-by: dirkf <fieldhouse@gmx.net>	2024-08-01 19:18:34 +01:00
dirkf	e1b3fa242c	[Youtube] Find `n` function name in player `3400486c` Fixes #32877	2024-07-25 00:16:00 +01:00
dirkf	451046d62a	[Youtube] Make n-sig throttling diagnostic up-to-date	2024-07-24 14:33:34 +01:00
`@ -1,3 +1,3 @@`
	`from __future__ import unicode_literals`	`from __future__ import unicode_literals`

	`__version__ = '2021.12.17'`	`__version__ = '2025.04.07'`