Start using msgspec for message serialization/deseraliazation

Add new pipeline_for_v2 that loads based on ModelParams struct Fix cli to new protocol_v2 Fix worker code to new protocol_v2 Switch to pdbplus Split cuda_utils and normal utils
2023-10-16 07:13:38 -03:00 · 2023-10-16 07:13:38 -03:00 · 2c4a8661ef
parent d18d59a0ab
commit 2c4a8661ef
13 changed files with 1518 additions and 1103 deletions
--- a/poetry.lock
+++ b/poetry.lock
--- a/pyproject.toml
+++ b/pyproject.toml
@ -11,10 +11,12 @@ python = '>=3.10,<3.12'
 pytz = '^2023.3.post1'
 trio = '^0.22.2'
 asks = '^3.0.0'
 toml = '^0.10.2'
 Pillow = '^10.0.1'
 docker = '^6.1.3'
-py-leap = {git = 'https://github.com/guilledk/py-leap.git', rev = 'v0.1a14'}
+ueosio = {git = 'https://github.com/EOSArgentina/ueosio.git', rev = '543ab0a8b4b515d4b34ff02f1af4252b34ebd554'}
-toml = '^0.10.2'
+py-leap = {git = 'https://github.com/guilledk/py-leap.git', rev = 'multi_push_action'}
 msgspec = '^0.18.4'
 [tool.poetry.group.frontend]
 optional = true
@ -30,7 +32,7 @@ pyTelegramBotAPI = {version = '^4.14.0'}
 optional = true
 [tool.poetry.group.dev.dependencies]
-pdbpp = {version = '^0.10.3'}
+pdbplus = {version = '^1.5.0'}
 pytest = {version = '^7.4.2'}
 [tool.poetry.group.cuda]
@ -41,6 +43,7 @@ torch = {version = '2.0.1+cu118', source = 'torch'}
 scipy = {version = '^1.11.2'}
 numba = {version = '0.57.0'}
 quart = {version = '^0.19.3'}
 compel = {version = '^2.0.2'}
 triton = {version = '2.0.0', source = 'torch'}
 basicsr = {version = '^1.4.2'}
 xformers = {version = '^0.0.22'}
--- a/skynet.toml.example
+++ b/skynet.toml.example
@ -19,6 +19,13 @@ auto_withdraw = true
 non_compete = []
 api_bind = '127.0.0.1:42690'
 [[initial_models]]
 name = 'stabilityai/stable-diffusion-xl-base-1.0'
 pipe_fqn = 'diffusers.DiffusionPipeline'
 [initial_models.setup]
 variant = 'fp16'
 # telegram bot config (optional)
 [skynet.telegram]
 account = 'telegram'
--- a/skynet/init.py
+++ b/skynet/init.py
@ -1,2 +1,3 @@
 #!/usr/bin/python
 import pdbp
--- a/skynet/cli.py
+++ b/skynet/cli.py
@ -8,7 +8,10 @@ from functools import partial
 import click
-from leap.sugar import Name, asset_from_str
+from leap.sugar import Name, ListArgument, asset_from_str, symbol_from_str
 import msgspec
 from skynet.protocol import ComputeRequest, ParamsStruct, RequestRow
 from .config import *
 from .constants import *
@ -93,37 +96,49 @@ def download():
@click.option('--jobs', '-j', default=1)
@click.option('--model', '-m', default='stabilityai/stable-diffusion-xl-base-1.0')
@click.option(
-    '--prompt', '-p', default='a red old tractor in a sunny wheat field')
+    '--prompt', '-p',
-@click.option('--output', '-o', default='output.png')
+    default='cyberpunk skynet terminator skull a post impressionist oil painting with muted colors authored by Paul Cézanne, Paul Gauguin, Vincent van Gogh, Georges Seurat')
@click.option('--width', '-w', default=1024)
@click.option('--height', '-h', default=1024)
@click.option('--guidance', '-g', default=10)
@click.option('--step', '-s', default=26)
@click.option('--width', '-w', default=1024)
@click.option('--height', '-h', default=1024)
@click.option('--seed', '-S', default=None)
-@click.option('--upscaler', '-U', default='x4')
+@click.option('--input', '-i', multiple=True)
@click.option('--binary_data', '-b', default='')
@click.option('--strength', '-Z', default=None)
 def enqueue(
    reward: str,
    jobs: int,
    model: str,
    prompt: str,
    guidance: float,
    step: int,
    **kwargs
 ):
    import trio
    from leap.cleos import CLEOS
    config = load_skynet_toml()
    logging.basicConfig(level='INFO')
    key = load_key(config, 'skynet.user.key')
    account = load_key(config, 'skynet.user.account')
    permission = load_key(config, 'skynet.user.permission')
    node_url = load_key(config, 'skynet.node_url')
    contract = load_key(config, 'skynet.contract')
    cleos = CLEOS(None, None, url=node_url, remote=node_url)
-    binary = kwargs['binary_data']
+    inputs = kwargs['input']
    if len(inputs) > 0:
        del kwargs['width']
        del kwargs['height']
    del kwargs['input']
    if not kwargs['strength']:
-        if binary:
+        if len(inputs) > 0:
-            raise ValueError('strength -Z param required if binary data passed')
+            raise ValueError('strength -Z param required if input data passed')
        del kwargs['strength']
@ -139,29 +154,45 @@ def enqueue(
                seed = random.randint(0, 10e9)
            _kwargs = kwargs.copy()
-            _kwargs['seed'] = seed
+            _kwargs['generator'] = seed
            del _kwargs['seed']
-            req = json.dumps({
+            request = ComputeRequest(
-                'method': 'diffuse',
+                method='diffuse',
-                'params': _kwargs
+                params=ParamsStruct(
-            })
+                    model=ModelParams(
                        name=model,
                        pipe_fqn='diffusers.DiffusionPipeline',
                        setup={'variant': 'fp16'}
                    ),
                    runtime_args=[prompt],
                    runtime_kwargs={
                        'guidance_scale': guidance,
                        'num_inference_steps': step,
                        **_kwargs
                    }
                )
            )
            req = msgspec.json.encode(request)
            actions.append({
-                'account': 'telos.gpu',
+                'account': contract,
                'name': 'enqueue',
-                'data': {
+                'data': [
-                    'user': Name(account),
+                    Name(account),
-                    'request_body': req,
+                    ListArgument(req, 'uint8'),
-                    'binary_data': binary,
+                    ListArgument(inputs, 'string'),
-                    'reward': asset_from_str(reward),
+                    asset_from_str(reward),
-                    'min_verification': 1
+                    1
-                },
+                ],
                'authorization': [{
                    'actor': account,
                    'permission': permission
                }]
            })
        # breakpoint()
        res = await cleos.a_push_actions(actions, key)
        print(res)
@ -181,13 +212,14 @@ def clean(
    account = load_key(config, 'skynet.user.account')
    permission = load_key(config, 'skynet.user.permission')
    node_url = load_key(config, 'skynet.node_url')
    contract = load_key(config, 'skynet.contract')
    logging.basicConfig(level=loglevel)
    cleos = CLEOS(None, None, url=node_url, remote=node_url)
    trio.run(
        partial(
            cleos.a_push_action,
-            'telos.gpu',
+            contract,
            'clean',
            {},
            account, key, permission=permission
@ -199,33 +231,26 @@ def queue():
    import requests
    config = load_skynet_toml()
    node_url = load_key(config, 'skynet.node_url')
    contract = load_key(config, 'skynet.contract')
    resp = requests.post(
        f'{node_url}/v1/chain/get_table_rows',
        json={
-            'code': 'telos.gpu',
+            'code': contract,
            'table': 'queue',
-            'scope': 'telos.gpu',
+            'scope': contract,
            'json': True
        }
-    )
+    ).json()
-    print(json.dumps(resp.json(), indent=4))
+
    # process hex body
    results = []
    for row in resp['rows']:
        req = row.copy()
        req['body'] = json.loads(bytes.fromhex(req['body']).decode())
        results.append(req)
    print(json.dumps(results, indent=4))
@skynet.command()
@click.argument('request-id')
 def status(request_id: int):
    import requests
    config = load_skynet_toml()
    node_url = load_key(config, 'skynet.node_url')
    resp = requests.post(
        f'{node_url}/v1/chain/get_table_rows',
        json={
            'code': 'telos.gpu',
            'table': 'status',
            'scope': request_id,
            'json': True
        }
    )
    print(json.dumps(resp.json(), indent=4))
@skynet.command()
@click.argument('request-id')
@ -238,12 +263,13 @@ def dequeue(request_id: int):
    account = load_key(config, 'skynet.user.account')
    permission = load_key(config, 'skynet.user.permission')
    node_url = load_key(config, 'skynet.node_url')
    contract = load_key(config, 'skynet.contract')
    cleos = CLEOS(None, None, url=node_url, remote=node_url)
    res = trio.run(
        partial(
            cleos.a_push_action,
-            'telos.gpu',
+            contract,
            'dequeue',
            {
                'user': Name(account),
@ -256,33 +282,39 @@ def dequeue(request_id: int):
@skynet.command()
-@click.option(
+@click.argument(
-    '--token-contract', '-c', default='eosio.token')
+    'token-contract', required=True)
-@click.option(
+@click.argument(
-    '--token-symbol', '-S', default='4,GPU')
+    'token-symbol', required=True)
@click.argument(
    'nonce', required=True)
 def config(
    token_contract: str,
-    token_symbol: str
+    token_symbol: str,
    nonce: int
 ):
    import trio
    from leap.cleos import CLEOS
    logging.basicConfig(level='INFO')
    config = load_skynet_toml()
    key = load_key(config, 'skynet.user.key')
    account = load_key(config, 'skynet.user.account')
    permission = load_key(config, 'skynet.user.permission')
    node_url = load_key(config, 'skynet.node_url')
    contract = load_key(config, 'skynet.contract')
    cleos = CLEOS(None, None, url=node_url, remote=node_url)
    res = trio.run(
        partial(
            cleos.a_push_action,
-            'telos.gpu',
+            contract,
            'config',
            {
-                'token_contract': token_contract,
+                'token_contract': Name(token_contract),
-                'token_symbol': token_symbol,
+                'token_symbol': symbol_from_str(token_symbol),
                'nonce': int(nonce)
            },
            account, key, permission=permission
        )
@ -302,16 +334,17 @@ def deposit(quantity: str):
    account = load_key(config, 'skynet.user.account')
    permission = load_key(config, 'skynet.user.permission')
    node_url = load_key(config, 'skynet.node_url')
    contract = load_key(config, 'skynet.contract')
    cleos = CLEOS(None, None, url=node_url, remote=node_url)
    res = trio.run(
        partial(
            cleos.a_push_action,
-            'telos.gpu',
+            'eosio.token',
            'transfer',
            {
                'sender': Name(account),
-                'recipient': Name('telos.gpu'),
+                'recipient': Name(contract),
                'amount': asset_from_str(quantity),
                'memo': f'{account} transferred {quantity} to telos.gpu'
            },
--- a/skynet/constants.py
+++ b/skynet/constants.py
@ -1,5 +1,8 @@
 #!/usr/bin/python
 from skynet.protocol import ModelParams
 VERSION = '0.1a12'
 DOCKER_RUNTIME_CUDA = 'skynet:runtime-cuda'
@ -167,7 +170,11 @@ DEFAULT_UPSCALER = None
 DEFAULT_CONFIG_PATH = 'skynet.toml'
 DEFAULT_INITAL_MODELS = [
-    'stabilityai/stable-diffusion-xl-base-1.0'
+    ModelParams(
        name='stabilityai/stable-diffusion-xl-base-1.0',
        pipe_fqn='diffusers.DiffusionPipeline',
        setup={'variant': 'fp16'}
    )
 ]
 DATE_FORMAT = '%B the %dth %Y, %H:%M:%S'
--- a/skynet/cuda_utils.py
+++ b/skynet/cuda_utils.py
@ -0,0 +1,298 @@
 #!/usr/bin/python
 from copy import deepcopy
 import io
 import os
 import sys
 import random
 import logging
 from typing import Any, Optional
 from pathlib import Path
 from importlib import import_module
 import trio
 import asks
 import torch
 import numpy as np
 from PIL import Image
 from basicsr.archs.rrdbnet_arch import RRDBNet
 from diffusers import (
    DiffusionPipeline,
    EulerAncestralDiscreteScheduler
 )
 from realesrgan import RealESRGANer
 from huggingface_hub import login
 from skynet.protocol import ModelParams
 from .constants import MODELS
 def convert_from_cv2_to_image(img: np.ndarray) -> Image:
    # return Image.fromarray(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))
    return Image.fromarray(img)
 def convert_from_image_to_cv2(img: Image) -> np.ndarray:
    # return cv2.cvtColor(numpy.array(img), cv2.COLOR_RGB2BGR)
    return np.asarray(img)
 def convert_from_bytes_to_img(raw: bytes) -> Image:
    return Image.open(io.BytesIO(raw))
 def convert_from_img_to_bytes(image: Image, fmt='PNG') -> bytes:
    byte_arr = io.BytesIO()
    image.save(byte_arr, format=fmt)
    return byte_arr.getvalue()
 def crop_image(image: Image, max_w: int, max_h: int) -> Image:
    w, h = image.size
    if w > max_w or h > max_h:
        image.thumbnail((max_w, max_h))
    return image.convert('RGB')
 def pipeline_for(
    model: str,
    mem_fraction: float = 1.0,
    image: bool = False,
    cache_dir: str | None = None
 ) -> DiffusionPipeline:
    assert torch.cuda.is_available()
    torch.cuda.empty_cache()
    torch.backends.cuda.matmul.allow_tf32 = True
    torch.backends.cudnn.allow_tf32 = True
    # full determinism
    # https://huggingface.co/docs/diffusers/using-diffusers/reproducibility#deterministic-algorithms
    os.environ["CUBLAS_WORKSPACE_CONFIG"] = ":16:8"
    torch.backends.cudnn.benchmark = False
    torch.use_deterministic_algorithms(True)
    model_info = MODELS[model]
    req_mem = model_info['mem']
    mem_gb = torch.cuda.mem_get_info()[1] / (10**9)
    mem_gb *= mem_fraction
    over_mem = mem_gb < req_mem
    if over_mem:
        logging.warn(f'model requires {req_mem} but card has {mem_gb}, model will run slower..')
    shortname = model_info['short']
    params = {
        'safety_checker': None,
        'torch_dtype': torch.float16,
        'cache_dir': cache_dir,
        'variant': 'fp16'
    }
    match shortname:
        case 'stable':
            params['revision'] = 'fp16'
    torch.cuda.set_per_process_memory_fraction(mem_fraction)
    pipe = DiffusionPipeline.from_pretrained(
        model, **params)
    pipe.scheduler = EulerAncestralDiscreteScheduler.from_config(
        pipe.scheduler.config)
    pipe.enable_xformers_memory_efficient_attention()
    if over_mem:
        if not image:
            pipe.enable_vae_slicing()
            pipe.enable_vae_tiling()
        pipe.enable_model_cpu_offload()
    else:
        if sys.version_info[1] < 11:
            # torch.compile only supported on python < 3.11
            pipe.unet = torch.compile(
                pipe.unet, mode='reduce-overhead', fullgraph=True)
        pipe = pipe.to('cuda')
    return pipe
 def pipeline_for_v2(
    model: ModelParams,
    mem_fraction: float = 1.0,
    cache_dir: str | None = None
 ) -> Any:
    mod_name, class_name = model.pipe_fqn.rsplit('.', 1)
    mod = import_module(mod_name)
    pipe_class = getattr(mod, class_name)
    assert torch.cuda.is_available()
    torch.cuda.empty_cache()
    torch.backends.cuda.matmul.allow_tf32 = True
    torch.backends.cudnn.allow_tf32 = True
    # full determinism
    # https://huggingface.co/docs/diffusers/using-diffusers/reproducibility#deterministic-algorithms
    os.environ["CUBLAS_WORKSPACE_CONFIG"] = ":16:8"
    torch.backends.cudnn.benchmark = False
    torch.use_deterministic_algorithms(True)
    model_info = MODELS[model.name]
    req_mem = model_info['mem']
    mem_gb = torch.cuda.mem_get_info()[1] / (10**9)
    mem_gb *= mem_fraction
    over_mem = mem_gb < req_mem
    if over_mem:
        logging.warn(f'model requires {req_mem} but card has {mem_gb}, model will run slower..')
    torch.cuda.set_per_process_memory_fraction(mem_fraction)
    setup_params = deepcopy(model.setup)
    setup_params['safety_checker'] = None
    setup_params['torch_dtype'] = torch.float16
    setup_params['cache_dir'] = cache_dir
    pipe = pipe_class.from_pretrained(model.name, **setup_params)
    pipe.scheduler = EulerAncestralDiscreteScheduler.from_config(
        pipe.scheduler.config)
    pipe.enable_xformers_memory_efficient_attention()
    if over_mem:
        if 'Img' not in model.pipe_fqn:
            pipe.enable_vae_slicing()
            pipe.enable_vae_tiling()
        pipe.enable_model_cpu_offload()
    else:
        if sys.version_info[1] < 11:
            # torch.compile only supported on python < 3.11
            pipe.unet = torch.compile(
                pipe.unet, mode='reduce-overhead', fullgraph=True)
        pipe = pipe.to('cuda')
    return pipe
 def txt2img(
    hf_token: str,
    model: str = 'prompthero/openjourney',
    prompt: str = 'a red old tractor in a sunny wheat field',
    output: str = 'output.png',
    width: int = 512, height: int = 512,
    guidance: float = 10,
    steps: int = 28,
    seed: Optional[int] = None
 ):
    login(token=hf_token)
    pipe = pipeline_for(model)
    seed = seed if seed else random.randint(0, 2 ** 64)
    prompt = prompt
    image = pipe(
        prompt,
        width=width,
        height=height,
        guidance_scale=guidance, num_inference_steps=steps,
        generator=torch.Generator("cuda").manual_seed(seed)
    ).images[0]
    image.save(output)
 def img2img(
    hf_token: str,
    model: str = 'prompthero/openjourney',
    prompt: str = 'a red old tractor in a sunny wheat field',
    img_path: str = 'input.png',
    output: str = 'output.png',
    strength: float = 1.0,
    guidance: float = 10,
    steps: int = 28,
    seed: Optional[int] = None
 ):
    login(token=hf_token)
    pipe = pipeline_for(model, image=True)
    with open(img_path, 'rb') as img_file:
        input_img = convert_from_bytes_and_crop(img_file.read(), 512, 512)
    seed = seed if seed else random.randint(0, 2 ** 64)
    prompt = prompt
    image = pipe(
        prompt,
        image=input_img,
        strength=strength,
        guidance_scale=guidance, num_inference_steps=steps,
        generator=torch.Generator("cuda").manual_seed(seed)
    ).images[0]
    image.save(output)
 def init_upscaler(model_path: str = 'weights/RealESRGAN_x4plus.pth'):
    return RealESRGANer(
        scale=4,
        model_path=model_path,
        dni_weight=None,
        model=RRDBNet(
            num_in_ch=3,
            num_out_ch=3,
            num_feat=64,
            num_block=23,
            num_grow_ch=32,
            scale=4
        ),
        half=True
    )
 def upscale(
    img_path: str = 'input.png',
    output: str = 'output.png',
    model_path: str = 'weights/RealESRGAN_x4plus.pth'
 ):
    input_img = Image.open(img_path).convert('RGB')
    upscaler = init_upscaler(model_path=model_path)
    up_img, _ = upscaler.enhance(
        convert_from_image_to_cv2(input_img), outscale=4)
    image = convert_from_cv2_to_image(up_img)
    image.save(output)
 async def download_upscaler():
    print('downloading upscaler...')
    weights_path = Path('weights')
    weights_path.mkdir(exist_ok=True)
    upscaler_url = 'https://github.com/xinntao/Real-ESRGAN/releases/download/v0.1.0/RealESRGAN_x4plus.pth'
    save_path = weights_path / 'RealESRGAN_x4plus.pth'
    response = await asks.get(upscaler_url)
    with open(save_path, 'wb') as f:
        f.write(response.content)
    print('done')
 def download_all_models(hf_token: str, hf_home: str):
    assert torch.cuda.is_available()
    trio.run(download_upscaler)
    login(token=hf_token)
    for model in MODELS:
        print(f'DOWNLOADING {model.upper()}')
        pipeline_for(model, cache_dir=hf_home)
--- a/skynet/dgpu/init.py
+++ b/skynet/dgpu/init.py
@ -11,20 +11,22 @@ from skynet.dgpu.network import SkynetGPUConnector
 async def open_dgpu_node(config: dict):
-    conn = SkynetGPUConnector({**config, **config['dgpu']})
+    config = {**config, **config['dgpu']}
-    mm = SkynetMM(config['dgpu'])
+    conn = SkynetGPUConnector(config)
-    daemon = SkynetDGPUDaemon(mm, conn, config['dgpu'])
+    mm = SkynetMM(config)
    daemon = SkynetDGPUDaemon(mm, conn, config)
    api = None
-    if 'api_bind' in config['dgpu']:
+    if 'api_bind' in config:
        api_conf = Config()
        api_conf.bind = [config['api_bind']]
        api = await daemon.generate_api()
    async with trio.open_nursery() as n:
-        n.start_soon(conn.data_updater_task)
+        await n.start(conn.data_updater_task)
        if api:
            n.start_soon(serve, api, api_conf)
        await daemon.serve_forever()
        n.cancel_scope.cancel()
--- a/skynet/dgpu/compute.py
+++ b/skynet/dgpu/compute.py
@ -5,10 +5,9 @@
 import gc
 import logging
-from hashlib import sha256
+from copy import deepcopy
 from typing import Any
 from PIL import Image
 from diffusers import DiffusionPipeline
 import trio
@ -16,53 +15,29 @@ import torch
 from skynet.constants import DEFAULT_INITAL_MODELS, MODELS
 from skynet.dgpu.errors import DGPUComputeError, DGPUInferenceCancelled
 from skynet.protocol import ComputeRequest, ModelParams, ParamsStruct
-from skynet.utils import crop_image, convert_from_cv2_to_image, convert_from_image_to_cv2, convert_from_img_to_bytes, init_upscaler, pipeline_for
+from skynet.cuda_utils import (
    init_upscaler,
    pipeline_for_v2
 )
-def prepare_params_for_diffuse(
+def unpack_diffuse_params(params: ParamsStruct):
-    params: dict,
+    kwargs = deepcopy(params.runtime_kwargs)
    inputs: list[tuple[Any, str]],
 ):
    _params = {}
-    if len(inputs) > 1:
+    if 'generator' in kwargs:
-        raise DGPUComputeError('sorry binary_inputs > 1 not implemented yet')
+        kwargs['generator'] = torch.manual_seed(int(kwargs['generator']))
-    if len(inputs) == 0:
+    return params.runtime_args, kwargs
        binary, input_type = inputs[0]
        match input_type:
            case 'png':
                image = crop_image(
                    binary, params['width'], params['height'])
                _params['image'] = image
                _params['strength'] = float(params['strength'])
            case _:
                raise DGPUComputeError(f'Unknown input_type {input_type}')
    else:
        _params['width'] = int(params['width'])
        _params['height'] = int(params['height'])
    return (
        params['prompt'],
        float(params['guidance']),
        int(params['step']),
        torch.manual_seed(int(params['seed'])),
        params['upscaler'] if 'upscaler' in params else None,
        _params
    )
 class SkynetMM:
    def __init__(self, config: dict):
        self.upscaler = init_upscaler()
-        self.initial_models = (
+        self.initial_models: list[ModelParams] = (
-            config['initial_models']
+            [ModelParams(**model) for model in config['initial_models']]
            if 'initial_models' in config else DEFAULT_INITAL_MODELS
        )
@ -78,35 +53,28 @@ class SkynetMM:
        self._models = {}
        for model in self.initial_models:
-            self.load_model(model, False, force=True)
+            self.load_model(model)
    def log_debug_info(self):
        logging.info('memory summary:')
        logging.info('\n' + torch.cuda.memory_summary())
-    def is_model_loaded(self, model_name: str, image: bool):
+    def is_model_loaded(self, model: ModelParams):
-        for model_key, model_data in self._models.items():
+        return model.get_uid() in self._models
            if (model_key == model_name and
                model_data['image'] == image):
                return True
        return False
    def load_model(
        self,
-        model_name: str,
+        model: ModelParams
        image: bool,
        force=False
    ):
-        logging.info(f'loading model {model_name}...')
+        logging.info(f'loading model {model.name}...')
-        if force or len(self._models.keys()) == 0:
+        if len(self._models.keys()) == 0:
-            pipe = pipeline_for(
+            pipe = pipeline_for_v2(
-                model_name, image=image, cache_dir=self.cache_dir)
+                model, cache_dir=self.cache_dir)
-            self._models[model_name] = {
+            self._models[model.get_uid()] = {
                'pipe': pipe,
-                'generated': 0,
+                'params': model,
-                'image': image
+                'generated': 0
            }
        else:
@ -119,42 +87,41 @@ class SkynetMM:
            del self._models[least_used]
-            logging.info(f'swapping model {least_used} for {model_name}...')
+            logging.info(f'swapping model {least_used} for {model.get_uid()}...')
            gc.collect()
            torch.cuda.empty_cache()
-            pipe = pipeline_for(
+            pipe = pipeline_for_v2(
-                model_name, image=image, cache_dir=self.cache_dir)
+                model, cache_dir=self.cache_dir)
-            self._models[model_name] = {
+            self._models[model.get_uid()] = {
                'pipe': pipe,
-                'generated': 0,
+                'params': model,
-                'image': image
+                'generated': 0
            }
-        logging.info(f'loaded model {model_name}')
+        logging.info(f'loaded model {model.name}')
        return pipe
-    def get_model(self, model_name: str, image: bool) -> DiffusionPipeline:
+    def get_model(self, model: ModelParams) -> DiffusionPipeline:
-        if model_name not in MODELS:
+        if model.name not in MODELS:
-            raise DGPUComputeError(f'Unknown model {model_name}')
+            raise DGPUComputeError(f'Unknown model {model.name}')
-        if not self.is_model_loaded(model_name, image):
+        if not self.is_model_loaded(model):
-            pipe = self.load_model(model_name, image=image)
+            pipe = self.load_model(model)
        else:
-            pipe = self._models[model_name]['pipe']
+            pipe = self._models[model.get_uid()]['pipe']
        return pipe
    def compute_one(
        self,
        request_id: int,
-        method: str,
+        request: ComputeRequest,
        params: dict,
        inputs: list[tuple[Any, str]]
-    ):
+    ) -> list[tuple[bytes, str]]:
        def maybe_cancel_work(step, *args, **kwargs):
            if self._should_cancel:
                should_raise = trio.from_thread.run(self._should_cancel, request_id)
@ -165,44 +132,24 @@ class SkynetMM:
        maybe_cancel_work(0)
        output_type = 'png'
-        if 'output_type' in params:
+        if 'output_type' in request.params.runtime_kwargs:
-            output_type = params['output_type']
+            output_type = request.params.runtime_kwargs['output_type']
-        output = None
+        outputs = None
        output_hash = None
        try:
-            match method:
+            match request.method:
                case 'diffuse':
-                    arguments = prepare_params_for_diffuse(params, inputs)
+                    model = self.get_model(request.params.model)
                    prompt, guidance, step, seed, upscaler, extra_params = arguments
                    model = self.get_model(params['model'], 'image' in extra_params)
-                    output = model(
+                    args, kwargs = unpack_diffuse_params(request.params)
-                        prompt,
+
-                        guidance_scale=guidance,
+                    outputs = model(
-                        num_inference_steps=step,
+                        *args, **kwargs,
                        generator=seed,
                        callback=maybe_cancel_work,
-                        callback_steps=1,
+                        callback_steps=1
-                        **extra_params
+                    )
                    ).images[0]
-                    output_binary = b''
+                    output = outputs.images[0]
                    match output_type:
                        case 'png':
                            if upscaler == 'x4':
                                input_img = output.convert('RGB')
                                up_img, _ = self.upscaler.enhance(
                                    convert_from_image_to_cv2(input_img), outscale=4)
                                output = convert_from_cv2_to_image(up_img)
                            output_binary = convert_from_img_to_bytes(output)
                        case _:
                            raise DGPUComputeError(f'Unsupported output type: {output_type}')
                    output_hash = sha256(output_binary).hexdigest()
                case _:
                    raise DGPUComputeError('Unsupported compute method')
@ -214,4 +161,4 @@ class SkynetMM:
        finally:
            torch.cuda.empty_cache()
-        return output_hash, output
+        return [(output, output_type)]
--- a/skynet/dgpu/daemon.py
+++ b/skynet/dgpu/daemon.py
@ -1,8 +1,9 @@
 #!/usr/bin/python
 import json
 import logging
 import time
 import random
 import logging
 import traceback
 from hashlib import sha256
@ -19,6 +20,7 @@ from skynet.constants import MODELS, VERSION
 from skynet.dgpu.errors import *
 from skynet.dgpu.compute import SkynetMM
 from skynet.dgpu.network import SkynetGPUConnector
 from skynet.protocol import ComputeRequest, ModelParams, ParamsStruct, RequestRow
 def convert_reward_to_int(reward_str):
@ -87,9 +89,12 @@ class SkynetDGPUDaemon:
    async def should_cancel_work(self, request_id: int):
        self._benchmark.append(time.time())
-        competitors = self.conn.get_competitors_for_request(request_id)
+        status = self.conn.get_status_for_request(request_id)
-        if competitors == None:
+        competitors = [
-            return True
+            s.worker
            for s in status
            if s.worker != self.account
        ]
        return bool(self.non_compete & set(competitors))
    async def generate_api(self):
@ -106,25 +111,37 @@ class SkynetDGPUDaemon:
        return app
-    def find_best_requests(self) -> list[dict]:
+    def find_best_requests(self) -> list[tuple[RequestRow, ComputeRequest]]:
        queue = self.conn.get_queue()
-        # for _ in range(3):
+        for _ in range(3):
-        #     random.shuffle(queue)
+            random.shuffle(queue)
-        # queue = sorted(
+        queue = sorted(
-        #     queue,
+            queue,
-        #     key=lambda req: convert_reward_to_int(req['reward']),
+            key=lambda req: convert_reward_to_int(req.reward),
-        #     reverse=True
+            reverse=True
-        # )
+        )
        requests = []
        for req in queue:
-            rid = req['nonce']
+            rid = req.nonce
            # parse request
-            body = json.loads(req['body'])
+            try:
-            model = body['params']['model']
+                req_json = json.loads(req.body)
                compute_request = ComputeRequest(**req_json)
                compute_request.params = ParamsStruct(**req_json['params'])
                compute_request.params.model = ModelParams(**req_json['params']['model'])
                model = compute_request.params.model.name
            except TypeError as e:
                logging.warning(f'Couldn\'t parse request: {e}')
                continue
            except json.JSONDecodeError as e:
                logging.warning(f'Couldn\'t parse request: {e}')
                continue
            # if model not known
            if model not in MODELS:
@ -140,7 +157,7 @@ class SkynetDGPUDaemon:
            if model in self.model_blacklist:
                continue
-            my_results = [res['id'] for res in self.conn.get_my_results()]
+            my_results = [res.id for res in self.conn.get_my_results()]
            # if this worker already on it
            if rid in my_results:
@ -150,13 +167,17 @@ class SkynetDGPUDaemon:
            if status == None:
                continue
-            if self.non_compete & set(self.conn.get_competitors_for_request(rid)):
+            if self.non_compete & set([
                s.worker
                for s in status
                if s.worker != self.account
            ]):
                continue
            if len(status) > self.max_concurrent:
                continue
-            requests.append(req)
+            requests.append((req, compute_request))
        return requests
@ -164,24 +185,26 @@ class SkynetDGPUDaemon:
        # check worker is registered
        me = self.conn.get_on_chain_worker_info(self.account)
        if not me:
-            ec, out = await self.conn.register_worker()
+            res = await self.conn.register_worker()
-            if ec != 0:
+            if 'error' in res:
                raise DGPUDaemonError(f'Couldn\'t register worker! {out}')
            me = self.conn.get_on_chain_worker_info(self.account)
            if not me:
                raise DGPUDaemonError('Unknown error while registering')
        # find if reported on chain gpus match local
        found_difference = False
        for i in range(self.mm.num_gpus):
-            chain_gpu = me['cards'][i]
+            chain_gpu = me.cards[i]
            gpu = self.mm.gpus[i]
            gpu_v = f'{gpu.major}.{gpu.minor}'
-            found_difference = gpu.name != chain_gpu['card_name']
+            found_difference = gpu.name != chain_gpu.card_name
-            found_difference = gpu_v != chain_gpu['version']
+            found_difference = gpu_v != chain_gpu.version
-            found_difference = gpu.total_memory != chain_gpu['total_memory']
+            found_difference = gpu.total_memory != chain_gpu.total_memory
-            found_difference = gpu.multi_processor_count != chain_gpu['mp_count']
+            found_difference = gpu.multi_processor_count != chain_gpu.mp_count
            if found_difference:
                break
@ -189,20 +212,24 @@ class SkynetDGPUDaemon:
        if found_difference:
            await self.conn.flush_cards()
            for i, gpu in enumerate(self.mm.gpus):
-                ec, _ = await self.conn.add_card(
+                res = await self.conn.add_card(
                    gpu.name, f'{gpu.major}.{gpu.minor}',
                    gpu.total_memory, gpu.multi_processor_count,
                    '',
                    is_online
                )
-                if ec != 0:
+                if 'error' in res:
                    raise DGPUDaemonError(f'error while reporting card {i}')
        return found_difference
    async def all_gpu_set_online_flag(self, is_online: bool):
-        for i, chain_gpu in enumerate(me['cards']):
+        me = self.conn.get_on_chain_worker_info(self.account)
-            if chain_gpu['is_online'] != is_online:
+        if not me:
            raise DGPUDaemonError('Couldn\'t find worker info!')
        for i, chain_gpu in enumerate(me.cards):
            if chain_gpu.is_online != is_online:
                await self.conn.toggle_card(i)
    async def serve_forever(self):
@ -219,23 +246,24 @@ class SkynetDGPUDaemon:
                requests = self.find_best_requests()
                if len(requests) > 0:
-                    request = requests[0]
+                    request, compute_request = requests[0]
-                    rid = request['nonce']
+                    rid = request.nonce
-                    body = json.loads(request['body'])
+                    body = json.loads(request.body)
                    logging.info(f'trying to process req: {rid}')
-                    inputs = await self.conn.get_inputs(request['binary_inputs'])
+                    hash_buf = (
-
+                        str(request.nonce).encode()
                    hash_str = (
                        str(request['nonce'])
                        +
-                        request['body']
+                        request.body.encode()
                        +
-                        ''.join([_in for _in in request['binary_inputs']])
+                        b''.join([_in.encode() for _in in request.inputs])
                    )
-                    logging.info(f'hashing: {hash_str}')
+                    logging.info(f'hashing str of length {len(hash_buf)}')
-                    request_hash = sha256(hash_str.encode('utf-8')).hexdigest()
+                    request_hash = sha256(hash_buf).hexdigest()
-                    # TODO: validate request
+                    inputs = []
                    if len(request.inputs) > 0:
                        inputs = await self.conn.get_inputs(request.inputs)
                    # perform work
                    logging.info(f'working on {body}')
@ -247,19 +275,17 @@ class SkynetDGPUDaemon:
                    else:
                        try:
                            output_type = 'png'
-                            if 'output_type' in body['params']:
+                            if 'output_type' in compute_request.params.runtime_kwargs:
-                                output_type = body['params']['output_type']
+                                output_type = compute_request.params.runtime_kwargs['output_type']
-                            output = None
+                            outputs = []
                            output_hash = None
                            match self.backend:
                                case 'sync-on-thread':
                                    self.mm._should_cancel = self.should_cancel_work
-                                    output_hash, output = await trio.to_thread.run_sync(
+                                    outputs = await trio.to_thread.run_sync(
                                        partial(
                                            self.mm.compute_one,
-                                            rid,
+                                            rid, compute_request,
                                            body['method'], body['params'],
                                            inputs=inputs
                                        )
                                    )
@ -271,9 +297,9 @@ class SkynetDGPUDaemon:
                            self._last_benchmark = self._benchmark
                            self._benchmark = []
-                            ipfs_hash = await self.conn.publish_on_ipfs(output, typ=output_type)
+                            outputs = await self.conn.publish_on_ipfs(outputs)
-                            await self.conn.submit_work(rid, request_hash, output_hash, ipfs_hash)
+                            await self.conn.submit_work(rid, request_hash, outputs)
                        except BaseException as e:
                            traceback.print_exc()
--- a/skynet/dgpu/network.py
+++ b/skynet/dgpu/network.py
@ -16,11 +16,18 @@ import anyio
 from PIL import Image, UnidentifiedImageError
 from leap.cleos import CLEOS
-from leap.sugar import Checksum256, Name, asset_from_str
+from leap.sugar import (
    ListArgument,
    Checksum256,
    Name,
    asset_from_str
 )
 from skynet.constants import DEFAULT_IPFS_DOMAIN
 from skynet.ipfs import AsyncIPFSHTTP, get_ipfs_file
 from skynet.dgpu.errors import DGPUComputeError
 from skynet.protocol import CardStruct, ConfigRow, RequestRow, WorkerResultRow, WorkerRow, WorkerStatusStruct
 REQUEST_UPDATE_TIME = 3
@ -93,66 +100,66 @@ class SkynetGPUConnector:
        else:
            return default
-    async def data_updater_task(self):
+    async def data_updater_task(self, task_status=trio.TASK_STATUS_IGNORED):
        tasks = (
            (self._get_work_requests_last_hour, 'queue'),
            (self._find_my_results, 'my_results'),
            (self._get_workers, 'workers')
        )
-        while True:
+        async def _update():
            async with trio.open_nursery() as n:
                for task in tasks:
                    n.start_soon(self._cache_set, *task)
-            await trio.sleep(self._update_delta)
+        await _update()
-    def get_queue(self):
+        task_status.started()
        while True:
            await trio.sleep(self._update_delta)
            await _update()
    def get_queue(self) -> list[RequestRow]:
        return self._cache_get('queue', default=[])
-    def get_my_results(self):
+    def get_my_results(self) -> list[WorkerResultRow]:
        return self._cache_get('my_results', default=[])
-    def get_workers(self):
+    def get_workers(self) -> list[WorkerRow]:
        return self._cache_get('workers', default=[])
-    def get_status_for_request(self, request_id: int) -> list[dict] | None:
+    def get_status_for_request(self, request_id: int) -> list[WorkerStatusStruct]:
-        request: dict | None = next((
+        return next((
-            req
+            [WorkerStatusStruct(**status) for status in req.status]
            for req in self.get_queue()
-            if req['id'] == request_id), None)
+            if req.nonce == request_id), [])
-        if request:
+    async def _get_work_requests_last_hour(self) -> list[RequestRow]:
-            return request['status']
+        logging.debug('get_work_requests_last_hour')
-
+        result = []
-        else:
+        for row in (
-            return None
+            await failable(
    def get_competitors_for_request(self, request_id: int) -> list[str] | None:
        status = self.get_status_for_request(request_id)
        if not status:
            return None
        return [
            s['worker']
            for s in status
            if s['worker'] != self.account
        ]
    async def _get_work_requests_last_hour(self) -> list[dict]:
        logging.info('get_work_requests_last_hour')
        return await failable(
                partial(
                    self.cleos.aget_table,
                    self.contract, self.contract, 'queue',
                    index_position=2,
-                order='asc',
+                    key_type='i64',
-                limit=1000
+                    lower_bound=int(time.time()) - (60 * 60)
                ), ret_fail=[])
            ):
            row = RequestRow(**row)
            row.body = bytes.fromhex(row.body).decode()
            result.append(row)
-    async def _find_my_results(self):
+        return result
-        logging.info('find_my_results')
+
-        return await failable(
+    async def _find_my_results(self) -> list[WorkerResultRow]:
        logging.debug('find_my_results')
        return [
            WorkerResultRow(**row)
            for row in (
                await failable(
                    partial(
                        self.cleos.aget_table,
                        self.contract, self.contract, 'results',
@ -162,30 +169,38 @@ class SkynetGPUConnector:
                        upper_bound=self.account
                    )
                )
            )
        ]
-    async def _get_workers(self) -> list[dict]:
+    async def _get_workers(self) -> list[WorkerRow]:
-        logging.info('get_workers')
+        logging.debug('get_workers')
-        return await failable(
+        worker_rows = await failable(
            partial(
                self.cleos.aget_table,
                self.contract, self.contract, 'workers'
            )
        )
        result = []
        for row in worker_rows:
            row['cards'] = [CardStruct(**card) for card in row['cards']]
            result.append(WorkerRow(**row))
-    async def get_global_config(self):
+        return result
-        logging.info('get_global_config')
+
    async def get_global_config(self) -> ConfigRow | None:
        logging.debug('get_global_config')
        rows = await failable(
            partial(
                self.cleos.aget_table,
-                'telos.gpu', 'telos.gpu', 'config'))
+                self.contract, self.contract, 'config'))
        if rows:
-            return rows[0]
+            return ConfigRow(**rows[0])
        else:
            return None
-    async def get_worker_balance(self):
+    async def get_worker_balance(self) -> str | None:
-        logging.info('get_worker_balance')
+        logging.debug('get_worker_balance')
        rows = await failable(
            partial(
                self.cleos.aget_table,
@ -201,14 +216,14 @@ class SkynetGPUConnector:
        else:
            return None
-    def get_on_chain_worker_info(self, worker: str):
+    def get_on_chain_worker_info(self, worker: str) -> WorkerRow | None:
        return next((
            w for w in self.get_workers()
-            if w['account'] == w
+            if w.account == worker
        ), None)
    async def register_worker(self):
-        logging.info(f'registering worker')
+        logging.debug(f'registering worker')
        return await failable(
            partial(
                self.cleos.a_push_action,
@ -217,7 +232,9 @@ class SkynetGPUConnector:
                {
                    'account': self.account,
                    'url': self.worker_url
-                }
+                },
                self.account, self.key,
                permission=self.permission
            )
        )
@ -230,7 +247,7 @@ class SkynetGPUConnector:
        extra: str,
        is_online: bool
    ):
-        logging.info(f'adding card: {card_name} {version}')
+        logging.debug(f'adding card: {card_name} {version}')
        return await failable(
            partial(
                self.cleos.a_push_action,
@ -244,34 +261,40 @@ class SkynetGPUConnector:
                    'mp_count': mp_count,
                    'extra': extra,
                    'is_online': is_online
-                }
+                },
                self.account, self.key,
                permission=self.permission
            )
        )
    async def toggle_card(self, index: int):
-        logging.info(f'toggle card {index}')
+        logging.debug(f'toggle card {index}')
        return await failable(
            partial(
                self.cleos.a_push_action,
                self.contract,
                'togglecard',
-                {'worker': self.account, 'index': index}
+                {'worker': self.account, 'index': index},
                self.account, self.key,
                permission=self.permission
            )
        )
    async def flush_cards(self):
-        logging.info('flushing cards...')
+        logging.debug('flushing cards...')
        return await failable(
            partial(
                self.cleos.a_push_action,
                self.contract,
                'flushcards',
-                {'worker': self.account}
+                {'worker': self.account},
                self.account, self.key,
                permission=self.permission
            )
        )
    async def begin_work(self, request_id: int):
-        logging.info('begin_work')
+        logging.debug('begin_work')
        return await failable(
            partial(
                self.cleos.a_push_action,
@ -288,7 +311,7 @@ class SkynetGPUConnector:
        )
    async def cancel_work(self, request_id: int, reason: str):
-        logging.info('cancel_work')
+        logging.debug('cancel_work')
        return await failable(
            partial(
                self.cleos.a_push_action,
@ -305,7 +328,7 @@ class SkynetGPUConnector:
        )
    async def maybe_withdraw_all(self):
-        logging.info('maybe_withdraw_all')
+        logging.debug('maybe_withdraw_all')
        balance = await self.get_worker_balance()
        if not balance:
            return
@ -330,10 +353,9 @@ class SkynetGPUConnector:
        self,
        request_id: int,
        request_hash: str,
-        result_hash: str,
+        outputs: list[str]
        ipfs_hash: str
    ):
-        logging.info('submit_work')
+        logging.debug('submit_work')
        return await failable(
            partial(
                self.cleos.a_push_action,
@ -343,8 +365,7 @@ class SkynetGPUConnector:
                    'worker': self.account,
                    'request_id': request_id,
                    'request_hash': Checksum256(request_hash),
-                    'result_hash': Checksum256(result_hash),
+                    'outputs': ListArgument(outputs, 'string')
                    'ipfs_hash': ipfs_hash
                },
                self.account, self.key,
                permission=self.permission
@ -352,19 +373,9 @@ class SkynetGPUConnector:
        )
    # IPFS helpers
-    async def publish_on_ipfs(self, raw, typ: str = 'png'):
+    async def publish_on_ipfs(self, outputs: list[tuple[bytes, str]]) -> list[str]:
        Path('ipfs-staging').mkdir(exist_ok=True)
-        logging.info('publish_on_ipfs')
+        logging.debug('publish_on_ipfs')
        target_file = ''
        match typ:
            case 'png':
                raw: Image
                target_file = 'ipfs-staging/image.png'
                raw.save(target_file)
            case _:
                raise ValueError(f'Unsupported output type: {typ}')
        if self.ipfs_gateway_url:
            # check peer connections, reconnect to skynet gateway if not
@ -373,12 +384,32 @@ class SkynetGPUConnector:
            if gateway_id not in [p['Peer'] for p in peers]:
                await self.ipfs_client.connect(self.ipfs_gateway_url)
-        file_info = await self.ipfs_client.add(Path(target_file))
+        ipfs_outs = []
        async def _publish_one(target: str):
            file_info = await self.ipfs_client.add(Path(target))
            file_cid = file_info['Hash']
            await self.ipfs_client.pin(file_cid)
            logging.debug(f'published {file_cid}.')
-        return file_cid
+            ipfs_outs.append(file_cid)
        async with trio.open_nursery() as n:
            i = 0
            for output, otype in outputs:
                target_file = ''
                match otype:
                    case 'png':
                        target_file = f'ipfs-staging/image-{i}.png'
                        output.save(target_file)
                        n.start_soon(_publish_one, target_file)
                    case _:
                        raise ValueError(f'Unsupported output type: {otype}')
                i += 1
        return ipfs_outs
    async def get_input_data(self, ipfs_hash: str) -> tuple[bytes, str]:
        results = {}
@ -389,7 +420,7 @@ class SkynetGPUConnector:
        async with trio.open_nursery() as n:
            async def get_and_set_results(link: str):
                res = await get_ipfs_file(link, timeout=1)
-                logging.info(f'got response from {link}')
+                logging.debug(f'got response from {link}')
                if not res or res.status_code != 200:
                    logging.warning(f'couldn\'t get ipfs binary data at {link}!')
--- a/skynet/protocol.py
+++ b/skynet/protocol.py
@ -0,0 +1,83 @@
 from msgspec import Struct
 from skynet.utils import hash_dict
 class ModelParams(Struct):
    name: str
    pipe_fqn: str
    setup: dict
    def get_uid(self) -> str:
        return f'{self.pipe_fqn}:{self.name}-{hash_dict(self.setup)}'
 class ParamsStruct(Struct):
    model: ModelParams
    runtime_args: list
    runtime_kwargs: dict
 class ComputeRequest(Struct):
    method: str
    params: ParamsStruct
 # telos.gpu smart contract types
 TimestampSec = int
 class ConfigRow(Struct):
    token_contract: str
    token_symbol: str
    nonce: int
 class AccountRow(Struct):
    user: str
    balance: str
 class CardStruct(Struct):
    card_name: str
    version: str
    total_memory: int
    mp_count: int
    extra: str
    is_online: bool
 class WorkerRow(Struct):
    account: str
    joined: TimestampSec
    left: TimestampSec
    url: str
    cards: list[CardStruct]
 class WorkerStatusStruct(Struct):
    worker: str
    status: str
    started: TimestampSec
 class RequestRow(Struct):
    nonce: int
    user: str
    reward: str
    min_verification: int
    body: str
    inputs: list[str]
    status: list[WorkerStatusStruct]
    timestamp: TimestampSec
 class WorkerResultRow(Struct):
    id: int
    request_id: int
    user: str
    worker: str
    result_hash: str
    ipfs_hash: str
    submited: TimestampSec
--- a/skynet/utils.py
+++ b/skynet/utils.py
@ -1,238 +1,14 @@
 #!/usr/bin/python
 import io
 import os
 import sys
 import time
-import random
+import json
-import logging
+import hashlib
 from typing import Optional
 from pathlib import Path
 import asks
 import torch
 import numpy as np
 from PIL import Image
 from basicsr.archs.rrdbnet_arch import RRDBNet
 from diffusers import (
    DiffusionPipeline,
    EulerAncestralDiscreteScheduler
 )
 from realesrgan import RealESRGANer
 from huggingface_hub import login
 import trio
 from .constants import MODELS
-def time_ms():
+def hash_dict(d) -> str:
    d_str = json.dumps(d, sort_keys=True)
    return hashlib.sha256(d_str.encode('utf-8')).hexdigest()
 def time_ms() -> int:
    return int(time.time() * 1000)
 def convert_from_cv2_to_image(img: np.ndarray) -> Image:
    # return Image.fromarray(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))
    return Image.fromarray(img)
 def convert_from_image_to_cv2(img: Image) -> np.ndarray:
    # return cv2.cvtColor(numpy.array(img), cv2.COLOR_RGB2BGR)
    return np.asarray(img)
 def convert_from_bytes_to_img(raw: bytes) -> Image:
    return Image.open(io.BytesIO(raw))
 def convert_from_img_to_bytes(image: Image, fmt='PNG') -> bytes:
    byte_arr = io.BytesIO()
    image.save(byte_arr, format=fmt)
    return byte_arr.getvalue()
 def crop_image(image: Image, max_w: int, max_h: int) -> Image:
    w, h = image.size
    if w > max_w or h > max_h:
        image.thumbnail((max_w, max_h))
    return image.convert('RGB')
 def pipeline_for(
    model: str,
    mem_fraction: float = 1.0,
    image: bool = False,
    cache_dir: str | None = None
 ) -> DiffusionPipeline:
    assert torch.cuda.is_available()
    torch.cuda.empty_cache()
    torch.backends.cuda.matmul.allow_tf32 = True
    torch.backends.cudnn.allow_tf32 = True
    # full determinism
    # https://huggingface.co/docs/diffusers/using-diffusers/reproducibility#deterministic-algorithms
    os.environ["CUBLAS_WORKSPACE_CONFIG"] = ":16:8"
    torch.backends.cudnn.benchmark = False
    torch.use_deterministic_algorithms(True)
    model_info = MODELS[model]
    req_mem = model_info['mem']
    mem_gb = torch.cuda.mem_get_info()[1] / (10**9)
    mem_gb *= mem_fraction
    over_mem = mem_gb < req_mem
    if over_mem:
        logging.warn(f'model requires {req_mem} but card has {mem_gb}, model will run slower..')
    shortname = model_info['short']
    params = {
        'safety_checker': None,
        'torch_dtype': torch.float16,
        'cache_dir': cache_dir,
        'variant': 'fp16'
    }
    match shortname:
        case 'stable':
            params['revision'] = 'fp16'
    torch.cuda.set_per_process_memory_fraction(mem_fraction)
    pipe = DiffusionPipeline.from_pretrained(
        model, **params)
    pipe.scheduler = EulerAncestralDiscreteScheduler.from_config(
        pipe.scheduler.config)
    pipe.enable_xformers_memory_efficient_attention()
    if over_mem:
        if not image:
            pipe.enable_vae_slicing()
            pipe.enable_vae_tiling()
        pipe.enable_model_cpu_offload()
    else:
        if sys.version_info[1] < 11:
            # torch.compile only supported on python < 3.11
            pipe.unet = torch.compile(
                pipe.unet, mode='reduce-overhead', fullgraph=True)
        pipe = pipe.to('cuda')
    return pipe
 def txt2img(
    hf_token: str,
    model: str = 'prompthero/openjourney',
    prompt: str = 'a red old tractor in a sunny wheat field',
    output: str = 'output.png',
    width: int = 512, height: int = 512,
    guidance: float = 10,
    steps: int = 28,
    seed: Optional[int] = None
 ):
    login(token=hf_token)
    pipe = pipeline_for(model)
    seed = seed if seed else random.randint(0, 2 ** 64)
    prompt = prompt
    image = pipe(
        prompt,
        width=width,
        height=height,
        guidance_scale=guidance, num_inference_steps=steps,
        generator=torch.Generator("cuda").manual_seed(seed)
    ).images[0]
    image.save(output)
 def img2img(
    hf_token: str,
    model: str = 'prompthero/openjourney',
    prompt: str = 'a red old tractor in a sunny wheat field',
    img_path: str = 'input.png',
    output: str = 'output.png',
    strength: float = 1.0,
    guidance: float = 10,
    steps: int = 28,
    seed: Optional[int] = None
 ):
    login(token=hf_token)
    pipe = pipeline_for(model, image=True)
    with open(img_path, 'rb') as img_file:
        input_img = convert_from_bytes_and_crop(img_file.read(), 512, 512)
    seed = seed if seed else random.randint(0, 2 ** 64)
    prompt = prompt
    image = pipe(
        prompt,
        image=input_img,
        strength=strength,
        guidance_scale=guidance, num_inference_steps=steps,
        generator=torch.Generator("cuda").manual_seed(seed)
    ).images[0]
    image.save(output)
 def init_upscaler(model_path: str = 'weights/RealESRGAN_x4plus.pth'):
    return RealESRGANer(
        scale=4,
        model_path=model_path,
        dni_weight=None,
        model=RRDBNet(
            num_in_ch=3,
            num_out_ch=3,
            num_feat=64,
            num_block=23,
            num_grow_ch=32,
            scale=4
        ),
        half=True
    )
 def upscale(
    img_path: str = 'input.png',
    output: str = 'output.png',
    model_path: str = 'weights/RealESRGAN_x4plus.pth'
 ):
    input_img = Image.open(img_path).convert('RGB')
    upscaler = init_upscaler(model_path=model_path)
    up_img, _ = upscaler.enhance(
        convert_from_image_to_cv2(input_img), outscale=4)
    image = convert_from_cv2_to_image(up_img)
    image.save(output)
 async def download_upscaler():
    print('downloading upscaler...')
    weights_path = Path('weights')
    weights_path.mkdir(exist_ok=True)
    upscaler_url = 'https://github.com/xinntao/Real-ESRGAN/releases/download/v0.1.0/RealESRGAN_x4plus.pth'
    save_path = weights_path / 'RealESRGAN_x4plus.pth'
    response = await asks.get(upscaler_url)
    with open(save_path, 'wb') as f:
        f.write(response.content)
    print('done')
 def download_all_models(hf_token: str, hf_home: str):
    assert torch.cuda.is_available()
    trio.run(download_upscaler)
    login(token=hf_token)
    for model in MODELS:
        print(f'DOWNLOADING {model.upper()}')
        pipeline_for(model, cache_dir=hf_home)
`@ -1,2 +1,3 @@`
	`#!/usr/bin/python`	`#!/usr/bin/python`

		`import pdbp`