gallery-dl/gallery_dl/extractor/imagefap.py

# -*- coding: utf-8 -*-

# Copyright 2016-2023 Mike Fährmann
#
# This program is free software; you can redistribute it and/or modify
# it under the terms of the GNU General Public License version 2 as
# published by the Free Software Foundation.

"""Extractors for https://www.imagefap.com/"""

from .common import Extractor, Message
from .. import text, util, exception

BASE_PATTERN = r"(?:https?://)?(?:www\.|beta\.)?imagefap\.com"


class ImagefapExtractor(Extractor):
    """Base class for imagefap extractors"""
    category = "imagefap"
    root = "https://www.imagefap.com"
    directory_fmt = ("{category}", "{gallery_id} {title}")
    filename_fmt = "{category}_{gallery_id}_{filename}.{extension}"
    archive_fmt = "{gallery_id}_{image_id}"
    request_interval = (2.0, 4.0)

    def request(self, url, **kwargs):
        response = Extractor.request(self, url, **kwargs)

        if response.history and response.url.endswith("/human-verification"):
            msg = text.extr(response.text, '<div class="mt-4', '<')
            if msg:
                msg = " ".join(msg.partition(">")[2].split())
                raise exception.StopExtraction("'%s'", msg)
            self.log.warning("HTTP redirect to %s", response.url)

        return response


class ImagefapGalleryExtractor(ImagefapExtractor):
    """Extractor for image galleries from imagefap.com"""
    subcategory = "gallery"
    pattern = BASE_PATTERN + r"/(?:gallery\.php\?gid=|gallery/|pictures/)(\d+)"
    example = "https://www.imagefap.com/gallery/12345"

    def __init__(self, match):
        ImagefapExtractor.__init__(self, match)
        self.gid = match.group(1)
        self.image_id = ""

    def items(self):
        url = "{}/gallery/{}".format(self.root, self.gid)
        page = self.request(url).text
        data = self.get_job_metadata(page)
        yield Message.Directory, data
        for url, image in self.get_images():
            data.update(image)
            yield Message.Url, url, data

    def get_job_metadata(self, page):
        """Collect metadata for extractor-job"""
        extr = text.extract_from(page)

        data = {
            "gallery_id": text.parse_int(self.gid),
            "uploader": extr("porn picture gallery by ", " to see hottest"),
            "title": text.unescape(extr("<title>", "<")),
            "description": text.unescape(extr(
                'id="gdesc_text"', '<').partition(">")[2]),
            "categories": text.split_html(extr(
                'id="cnt_cats"', '</div>'))[1::2],
            "tags": text.split_html(extr(
                'id="cnt_tags"', '</div>'))[1::2],
            "count": text.parse_int(extr(' 1 of ', ' pics"')),
        }

        self.image_id = extr('id="img_ed_', '"')
        self._count = data["count"]

        return data

    def get_images(self):
        """Collect image-urls and -metadata"""
        url = "{}/photo/{}/".format(self.root, self.image_id)
        params = {"gid": self.gid, "idx": 0, "partial": "true"}
        headers = {
            "Content-Type": "application/x-www-form-urlencoded",
            "X-Requested-With": "XMLHttpRequest",
            "Referer": "{}?pgid=&gid={}&page=0".format(url, self.image_id)
        }

        num = 0
        total = self._count
        while True:
            page = self.request(url, params=params, headers=headers).text

            cnt = 0
            for image_url in text.extract_iter(page, '<a href="', '"'):
                num += 1
                cnt += 1
                data = text.nameext_from_url(image_url)
                data["num"] = num
                data["image_id"] = text.parse_int(data["filename"])
                yield image_url, data

            if not cnt or cnt < 24 and num >= total:
                return
            params["idx"] += cnt


class ImagefapImageExtractor(ImagefapExtractor):
    """Extractor for single images from imagefap.com"""
    subcategory = "image"
    pattern = BASE_PATTERN + r"/photo/(\d+)"
    example = "https://www.imagefap.com/photo/12345"

    def __init__(self, match):
        ImagefapExtractor.__init__(self, match)
        self.image_id = match.group(1)

    def items(self):
        url, data = self.get_image()
        yield Message.Directory, data
        yield Message.Url, url, data

    def get_image(self):
        url = "{}/photo/{}/".format(self.root, self.image_id)
        page = self.request(url).text

        url, pos = text.extract(
            page, 'original="', '"')
        info, pos = text.extract(
            page, '<script type="application/ld+json">', '</script>', pos)
        image_id, pos = text.extract(
            page, 'id="imageid_input" value="', '"', pos)
        gallery_id, pos = text.extract(
            page, 'id="galleryid_input" value="', '"', pos)
        info = util.json_loads(info)

        return url, text.nameext_from_url(url, {
            "title": text.unescape(info["name"]),
            "uploader": info["author"],
            "date": info["datePublished"],
            "width": text.parse_int(info["width"]),
            "height": text.parse_int(info["height"]),
            "gallery_id": text.parse_int(gallery_id),
            "image_id": text.parse_int(image_id),
        })


class ImagefapFolderExtractor(ImagefapExtractor):
    """Extractor for imagefap user folders"""
    subcategory = "folder"
    pattern = (BASE_PATTERN + r"/(?:organizer/|"
               r"(?:usergallery\.php\?user(id)?=([^&#]+)&"
               r"|profile/([^/?#]+)/galleries\?)folderid=)(\d+|-1)")
    example = "https://www.imagefap.com/organizer/12345"

    def __init__(self, match):
        ImagefapExtractor.__init__(self, match)
        self._id, user, profile, self.folder_id = match.groups()
        self.user = user or profile

    def items(self):
        for gallery_id, name in self.galleries(self.folder_id):
            url = "{}/gallery/{}".format(self.root, gallery_id)
            data = {
                "gallery_id": gallery_id,
                "title"     : text.unescape(name),
                "_extractor": ImagefapGalleryExtractor,
            }
            yield Message.Queue, url, data

    def galleries(self, folder_id):
        """Yield gallery IDs and titles of a folder"""
        if folder_id == "-1":
            if self._id:
                url = "{}/usergallery.php?userid={}&folderid=-1".format(
                    self.root, self.user)
            else:
                url = "{}/profile/{}/galleries?folderid=-1".format(
                    self.root, self.user)
        else:
            url = "{}/organizer/{}/".format(self.root, folder_id)

        params = {"page": 0}
        while True:
            extr = text.extract_from(self.request(url, params=params).text)
            cnt = 0

            while True:
                gid = extr('<a  href="/gallery/', '"')
                if not gid:
                    break
                yield gid, extr("<b>", "<")
                cnt += 1

            if cnt < 20:
                break
            params["page"] += 1


class ImagefapUserExtractor(ImagefapExtractor):
    """Extractor for an imagefap user profile"""
    subcategory = "user"
    pattern = (BASE_PATTERN +
               r"/(?:profile(?:\.php\?user=|/)([^/?#]+)(?:/galleries)?"
               r"|usergallery\.php\?userid=(\d+))(?:$|#)")
    example = "https://www.imagefap.com/profile/USER"

    def __init__(self, match):
        ImagefapExtractor.__init__(self, match)
        self.user, self.user_id = match.groups()

    def items(self):
        data = {"_extractor": ImagefapFolderExtractor}

        for folder_id in self.folders():
            if folder_id == "-1":
                url = "{}/profile/{}/galleries?folderid=-1".format(
                    self.root, self.user)
            else:
                url = "{}/organizer/{}/".format(self.root, folder_id)
            yield Message.Queue, url, data

    def folders(self):
        """Return a list of folder IDs of a user"""
        if self.user:
            url = "{}/profile/{}/galleries".format(self.root, self.user)
        else:
            url = "{}/usergallery.php?userid={}".format(
                self.root, self.user_id)

        response = self.request(url)
        self.user = response.url.split("/")[-2]
        folders = text.extr(response.text, ' id="tgl_all" value="', '"')
        return folders.rstrip("|").split("|")
[imagefap] add extractor 2016-08-09 14:05:12 +02:00			`# -- coding: utf-8 --`

[imagefap] use default delay between requests (#1140) 2023-01-07 12:59:09 +01:00			`# Copyright 2016-2023 Mike Fährmann`
[imagefap] add extractor 2016-08-09 14:05:12 +02:00			`#`
			`# This program is free software; you can redistribute it and/or modify`
			`# it under the terms of the GNU General Public License version 2 as`
			`# published by the Free Software Foundation.`

update extractor test results - tumblr: remove deleted post - jaiminisbox: replace removed manga/chapters - smugmug: one inconsequential field got removed 2020-07-18 14:50:46 +02:00			`"""Extractors for https://www.imagefap.com/"""`
[imagefap] add extractor 2016-08-09 14:05:12 +02:00
			`from .common import Extractor, Message`
replace json.loads with direct calls to JSONDecoder.decode 2023-02-07 23:14:53 +01:00			`from .. import text, util, exception`
[imagefap] add extractor 2016-08-09 14:05:12 +02:00
[imagefap] generalize URL patterns and add tests (#552) 2020-01-02 14:26:18 +01:00			`BASE_PATTERN = r"(?:https?://)?(?:www\.\|beta\.)?imagefap\.com"`


set 'archive_fmt' values These are going to be used to create an unique id for each image. 2018-01-30 22:49:16 +01:00			`class ImagefapExtractor(Extractor):`
			`"""Base class for imagefap extractors"""`
[imagefap] add extractor 2016-08-09 14:05:12 +02:00			`category = "imagefap"`
[imagefap] use default delay between requests (#1140) 2023-01-07 12:59:09 +01:00			`root = "https://www.imagefap.com"`
simplify extractor constants - single strings for URL patterns - tuples instead of lists for 'directory_fmt' and 'test' - single-tuple tests where applicable 2019-02-08 13:45:40 +01:00			`directory_fmt = ("{category}", "{gallery_id} {title}")`
change results of text.nameext_from_url() Instead of getting a complete 'filename' from an URL and splitting that into 'name' and 'extension', the new approach gets rid of the complete version and renames 'name' to 'filename'. (Using anything other than {extension} for a filename extension doesn't really work anyway) Example: "https://example.org/path/filename.ext" before: - filename : filename.ext - name : filename - extension: ext now: - filename : filename - extension: ext 2019-02-14 16:07:17 +01:00			`filename_fmt = "{category}_{gallery_id}_{filename}.{extension}"`
set 'archive_fmt' values These are going to be used to create an unique id for each image. 2018-01-30 22:49:16 +01:00			`archive_fmt = "{gallery_id}_{image_id}"`
[imagefap] use default delay between requests (#1140) 2023-01-07 12:59:09 +01:00			`request_interval = (2.0, 4.0)`
set 'archive_fmt' values These are going to be used to create an unique id for each image. 2018-01-30 22:49:16 +01:00
[imagefap] warn about redirects to '/human-verification' (#1140) 2023-01-07 13:04:42 +01:00			`def request(self, url, **kwargs):`
			`response = Extractor.request(self, url, **kwargs)`

			`if response.history and response.url.endswith("/human-verification"):`
			`msg = text.extr(response.text, '<div class="mt-4', '<')`
			`if msg:`
			`msg = " ".join(msg.partition(">")[2].split())`
			`raise exception.StopExtraction("'%s'", msg)`
			`self.log.warning("HTTP redirect to %s", response.url)`

			`return response`

set 'archive_fmt' values These are going to be used to create an unique id for each image. 2018-01-30 22:49:16 +01:00
			`class ImagefapGalleryExtractor(ImagefapExtractor):`
			`"""Extractor for image galleries from imagefap.com"""`
			`subcategory = "gallery"`
[imagefap] generalize URL patterns and add tests (#552) 2020-01-02 14:26:18 +01:00			`pattern = BASE_PATTERN + r"/(?:gallery\.php\?gid=\|gallery/\|pictures/)(\d+)"`
remove test results in extractor modules and add generic example URLs 2023-09-11 16:30:55 +02:00			`example = "https://www.imagefap.com/gallery/12345"`
[imagefap] add extractor 2016-08-09 14:05:12 +02:00
			`def __init__(self, match):`
propagate 'match' to base extractor constructor 2019-02-11 13:31:10 +01:00			`ImagefapExtractor.__init__(self, match)`
[imagefap] add extractor 2016-08-09 14:05:12 +02:00			`self.gid = match.group(1)`
consistent extractor naming scheme + docstrings 2016-09-12 10:20:57 +02:00			`self.image_id = ""`
[imagefap] add extractor 2016-08-09 14:05:12 +02:00
			`def items(self):`
[imagefap] update 'gallery' URLs (#3595) 2023-01-31 15:33:35 +01:00			`url = "{}/gallery/{}".format(self.root, self.gid)`
[imagefap] add extractor 2016-08-09 14:05:12 +02:00			`page = self.request(url).text`
			`data = self.get_job_metadata(page)`
			`yield Message.Directory, data`
[imagefap] don't rely on image-count (fixes #9) 2017-03-09 20:34:39 +01:00			`for url, image in self.get_images():`
[imagefap] add extractor 2016-08-09 14:05:12 +02:00			`data.update(image)`
[imagefap] deal with long filenames 2016-08-11 15:50:32 +02:00			`yield Message.Url, url, data`
[imagefap] add extractor 2016-08-09 14:05:12 +02:00
			`def get_job_metadata(self, page):`
			`"""Collect metadata for extractor-job"""`
[imagefap] fix metadata extraction 2023-01-31 15:38:55 +01:00			`extr = text.extract_from(page)`

			`data = {`
[imagefap] fix extraction also adds tags to gallery-metadata and converts suitable values to int 2018-10-20 18:32:25 +02:00			`"gallery_id": text.parse_int(self.gid),`
[imagefap] fix metadata extraction 2023-01-31 15:38:55 +01:00			`"uploader": extr("porn picture gallery by ", " to see hottest"),`
			`"title": text.unescape(extr("<title>", "<")),`
[imagefap] extract 'description' metadata (#3905) 2023-04-16 17:02:16 +02:00			`"description": text.unescape(extr(`
			`'id="gdesc_text"', '<').partition(">")[2]),`
[imagefap] extract 'categories' metadata and fix empty 'tags' 2023-04-16 18:41:20 +02:00			`"categories": text.split_html(extr(`
			`'id="cnt_cats"', '</div>'))[1::2],`
			`"tags": text.split_html(extr(`
			`'id="cnt_tags"', '</div>'))[1::2],`
[imagefap] fix metadata extraction 2023-01-31 15:38:55 +01:00			`"count": text.parse_int(extr(' 1 of ', ' pics"')),`
[imagefap] fix extraction also adds tags to gallery-metadata and converts suitable values to int 2018-10-20 18:32:25 +02:00			`}`
[imagefap] add extractor 2016-08-09 14:05:12 +02:00
[imagefap] fix metadata extraction 2023-01-31 15:38:55 +01:00			`self.image_id = extr('id="img_ed_', '"')`
			`self._count = data["count"]`

			`return data`

[imagefap] don't rely on image-count (fixes #9) 2017-03-09 20:34:39 +01:00			`def get_images(self):`
[imagefap] deal with long filenames 2016-08-11 15:50:32 +02:00			`"""Collect image-urls and -metadata"""`
[imagefap] use HTTPS + update test results 2018-06-30 19:40:46 +02:00			`url = "{}/photo/{}/".format(self.root, self.image_id)`
[imagefap] deal with long filenames 2016-08-11 15:50:32 +02:00			`params = {"gid": self.gid, "idx": 0, "partial": "true"}`
[imagefap] fix and improve gallery pagination (#3013) 2022-10-07 17:40:56 +02:00			`headers = {`
			`"Content-Type": "application/x-www-form-urlencoded",`
			`"X-Requested-With": "XMLHttpRequest",`
			`"Referer": "{}?pgid=&gid={}&page=0".format(url, self.image_id)`
			`}`

			`num = 0`
			`total = self._count`
[imagefap] add extractor 2016-08-09 14:05:12 +02:00			`while True:`
[imagefap] fix and improve gallery pagination (#3013) 2022-10-07 17:40:56 +02:00			`page = self.request(url, params=params, headers=headers).text`

			`cnt = 0`
			`for image_url in text.extract_iter(page, '<a href="', '"'):`
[imagefap] deal with long filenames 2016-08-11 15:50:32 +02:00			`num += 1`
[imagefap] fix and improve gallery pagination (#3013) 2022-10-07 17:40:56 +02:00			`cnt += 1`
			`data = text.nameext_from_url(image_url)`
[imagefap] adapt to new image URL format 2019-11-30 23:48:02 +01:00			`data["num"] = num`
			`data["image_id"] = text.parse_int(data["filename"])`
[imagefap] fix and improve gallery pagination (#3013) 2022-10-07 17:40:56 +02:00			`yield image_url, data`

[imagefap] fix infinite pagination loop (#3594) 2023-01-31 19:21:43 +01:00			`if not cnt or cnt < 24 and num >= total:`
[imagefap] fix and improve gallery pagination (#3013) 2022-10-07 17:40:56 +02:00			`return`
			`params["idx"] += cnt`
[imagefap] add single-image extractor 2016-08-10 10:27:32 +02:00

set 'archive_fmt' values These are going to be used to create an unique id for each image. 2018-01-30 22:49:16 +01:00			`class ImagefapImageExtractor(ImagefapExtractor):`
consistent extractor naming scheme + docstrings 2016-09-12 10:20:57 +02:00			`"""Extractor for single images from imagefap.com"""`
[imagefap] add single-image extractor 2016-08-10 10:27:32 +02:00			`subcategory = "image"`
[imagefap] generalize URL patterns and add tests (#552) 2020-01-02 14:26:18 +01:00			`pattern = BASE_PATTERN + r"/photo/(\d+)"`
remove test results in extractor modules and add generic example URLs 2023-09-11 16:30:55 +02:00			`example = "https://www.imagefap.com/photo/12345"`
[imagefap] add single-image extractor 2016-08-10 10:27:32 +02:00
			`def __init__(self, match):`
propagate 'match' to base extractor constructor 2019-02-11 13:31:10 +01:00			`ImagefapExtractor.__init__(self, match)`
[imagefap] add single-image extractor 2016-08-10 10:27:32 +02:00			`self.image_id = match.group(1)`

			`def items(self):`
[imagefap] adapt to new image URL format 2019-11-30 23:48:02 +01:00			`url, data = self.get_image()`
[imagefap] add single-image extractor 2016-08-10 10:27:32 +02:00			`yield Message.Directory, data`
[imagefap] adapt to new image URL format 2019-11-30 23:48:02 +01:00			`yield Message.Url, url, data`
[imagefap] add single-image extractor 2016-08-10 10:27:32 +02:00
[imagefap] adapt to new image URL format 2019-11-30 23:48:02 +01:00			`def get_image(self):`
[imagefap] fix extraction also adds tags to gallery-metadata and converts suitable values to int 2018-10-20 18:32:25 +02:00			`url = "{}/photo/{}/".format(self.root, self.image_id)`
			`page = self.request(url).text`
[imagefap] adapt to new image URL format 2019-11-30 23:48:02 +01:00
[imagefap] fix single image resolution Downloading from a single image page like https://www.imagefap.com/photo/123456789/ returned only the thumbnail URL. 2023-11-26 00:30:52 +01:00			`url, pos = text.extract(`
			`page, 'original="', '"')`
[imagefap] adapt to new image URL format 2019-11-30 23:48:02 +01:00			`info, pos = text.extract(`
[imagefap] fix single image resolution Downloading from a single image page like https://www.imagefap.com/photo/123456789/ returned only the thumbnail URL. 2023-11-26 00:30:52 +01:00			`page, '<script type="application/ld+json">', '</script>', pos)`
[imagefap] adapt to new image URL format 2019-11-30 23:48:02 +01:00			`image_id, pos = text.extract(`
			`page, 'id="imageid_input" value="', '"', pos)`
			`gallery_id, pos = text.extract(`
			`page, 'id="galleryid_input" value="', '"', pos)`
replace json.loads with direct calls to JSONDecoder.decode 2023-02-07 23:14:53 +01:00			`info = util.json_loads(info)`
[imagefap] adapt to new image URL format 2019-11-30 23:48:02 +01:00
			`return url, text.nameext_from_url(url, {`
[imagefap] add single-image extractor 2016-08-10 10:27:32 +02:00			`"title": text.unescape(info["name"]),`
			`"uploader": info["author"],`
			`"date": info["datePublished"],`
[imagefap] fix extraction also adds tags to gallery-metadata and converts suitable values to int 2018-10-20 18:32:25 +02:00			`"width": text.parse_int(info["width"]),`
			`"height": text.parse_int(info["height"]),`
[imagefap] adapt to new image URL format 2019-11-30 23:48:02 +01:00			`"gallery_id": text.parse_int(gallery_id),`
			`"image_id": text.parse_int(image_id),`
[imagefap] add single-image extractor 2016-08-10 10:27:32 +02:00			`})`

[imagefap] add user extractor 2016-08-10 12:54:18 +02:00
[imagefap] add 'folder' extractor (#3504) 2023-01-08 16:44:54 +01:00			`class ImagefapFolderExtractor(ImagefapExtractor):`
			`"""Extractor for imagefap user folders"""`
			`subcategory = "folder"`
			`pattern = (BASE_PATTERN + r"/(?:organizer/\|"`
			`r"(?:usergallery\.php\?user(id)?=([^&#]+)&"`
			`r"\|profile/([^/?#]+)/galleries\?)folderid=)(\d+\|-1)")`
remove test results in extractor modules and add generic example URLs 2023-09-11 16:30:55 +02:00			`example = "https://www.imagefap.com/organizer/12345"`
[imagefap] add user extractor 2016-08-10 12:54:18 +02:00
			`def __init__(self, match):`
propagate 'match' to base extractor constructor 2019-02-11 13:31:10 +01:00			`ImagefapExtractor.__init__(self, match)`
[imagefap] add 'folder' extractor (#3504) 2023-01-08 16:44:54 +01:00			`self._id, user, profile, self.folder_id = match.groups()`
			`self.user = user or profile`
[imagefap] add user extractor 2016-08-10 12:54:18 +02:00
			`def items(self):`
[imagefap] add 'folder' extractor (#3504) 2023-01-08 16:44:54 +01:00			`for gallery_id, name in self.galleries(self.folder_id):`
			`url = "{}/gallery/{}".format(self.root, gallery_id)`
			`data = {`
			`"gallery_id": gallery_id,`
			`"title" : text.unescape(name),`
			`"_extractor": ImagefapGalleryExtractor,`
			`}`
			`yield Message.Queue, url, data`
[imagefap] fix and improve folder extraction (#3013) 2022-10-07 22:07:34 +02:00
			`def galleries(self, folder_id):`
[imagefap] add 'folder' extractor (#3504) 2023-01-08 16:44:54 +01:00			`"""Yield gallery IDs and titles of a folder"""`
[imagefap] fix and improve folder extraction (#3013) 2022-10-07 22:07:34 +02:00			`if folder_id == "-1":`
[imagefap] add 'folder' extractor (#3504) 2023-01-08 16:44:54 +01:00			`if self._id:`
			`url = "{}/usergallery.php?userid={}&folderid=-1".format(`
			`self.root, self.user)`
			`else:`
			`url = "{}/profile/{}/galleries?folderid=-1".format(`
			`self.root, self.user)`
[imagefap] fix and improve folder extraction (#3013) 2022-10-07 22:07:34 +02:00			`else:`
			`url = "{}/organizer/{}/".format(self.root, folder_id)`

[imagefap] add 'folder' extractor (#3504) 2023-01-08 16:44:54 +01:00			`params = {"page": 0}`
[imagefap] fix and improve folder extraction (#3013) 2022-10-07 22:07:34 +02:00			`while True:`
			`extr = text.extract_from(self.request(url, params=params).text)`
			`cnt = 0`

			`while True:`
			`gid = extr('<a href="/gallery/', '"')`
			`if not gid:`
			`break`
			`yield gid, extr("<b>", "<")`
			`cnt += 1`

[imagefap] fix pagination (#3013) 2023-07-18 17:56:33 +02:00			`if cnt < 20:`
[imagefap] fix and improve folder extraction (#3013) 2022-10-07 22:07:34 +02:00			`break`
			`params["page"] += 1`
[imagefap] add 'folder' extractor (#3504) 2023-01-08 16:44:54 +01:00

			`class ImagefapUserExtractor(ImagefapExtractor):`
			`"""Extractor for an imagefap user profile"""`
			`subcategory = "user"`
			`pattern = (BASE_PATTERN +`
			`r"/(?:profile(?:\.php\?user=\|/)([^/?#]+)(?:/galleries)?"`
			`r"\|usergallery\.php\?userid=(\d+))(?:$\|#)")`
remove test results in extractor modules and add generic example URLs 2023-09-11 16:30:55 +02:00			`example = "https://www.imagefap.com/profile/USER"`
[imagefap] add 'folder' extractor (#3504) 2023-01-08 16:44:54 +01:00
			`def __init__(self, match):`
			`ImagefapExtractor.__init__(self, match)`
			`self.user, self.user_id = match.groups()`

			`def items(self):`
			`data = {"_extractor": ImagefapFolderExtractor}`

			`for folder_id in self.folders():`
			`if folder_id == "-1":`
			`url = "{}/profile/{}/galleries?folderid=-1".format(`
			`self.root, self.user)`
			`else:`
			`url = "{}/organizer/{}/".format(self.root, folder_id)`
			`yield Message.Queue, url, data`

			`def folders(self):`
			`"""Return a list of folder IDs of a user"""`
			`if self.user:`
			`url = "{}/profile/{}/galleries".format(self.root, self.user)`
			`else:`
			`url = "{}/usergallery.php?userid={}".format(`
			`self.root, self.user_id)`

			`response = self.request(url)`
			`self.user = response.url.split("/")[-2]`
			`folders = text.extr(response.text, ' id="tgl_all" value="', '"')`
			`return folders.rstrip("\|").split("\|")`