Jiali
/

gpt4-clone

Model card Files Files and versions Community

Jiali commited on Jun 5, 2023

Commit

82f1db1

1 Parent(s): 57044da

Panda

Browse files

Files changed (17) hide show

code/PandaGPT +1 -0
code/gpt4-clone/demo.py +55 -0
code/gpt4-clone/eval_configs/minigpt4_eval.yaml +25 -0
code/gpt4-clone/gpt4clone/__init__.py +18 -0
code/gpt4-clone/gpt4clone/__pycache__/__init__.cpython-39.pyc +0 -0
code/gpt4-clone/gpt4clone/common/__pycache__/config.cpython-39.pyc +0 -0
code/gpt4-clone/gpt4clone/common/__pycache__/registry.cpython-39.pyc +0 -0
code/gpt4-clone/gpt4clone/common/__pycache__/utils.cpython-39.pyc +0 -0
code/gpt4-clone/gpt4clone/common/config.py +86 -0
code/gpt4-clone/gpt4clone/common/registry.py +91 -0
code/gpt4-clone/gpt4clone/common/utils.py +6 -0
code/gpt4-clone/gpt4clone/configs/default.yaml +5 -0
code/gpt4-clone/gpt4clone/configs/models/minigpt4.yaml +33 -0
code/gpt4-clone/gpt4clone/models/__init__.py +5 -0
code/gpt4-clone/gpt4clone/models/__pycache__/__init__.cpython-39.pyc +0 -0
code/gpt4-clone/gpt4clone/models/__pycache__/mini_gpt4.cpython-39.pyc +0 -0
code/gpt4-clone/gpt4clone/models/mini_gpt4.py +125 -0

code/PandaGPT ADDED Viewed

	@@ -0,0 +1 @@


1	+ Subproject commit 9b77e0412d42a468362b67d1892ff0f4f659a4f5

code/gpt4-clone/demo.py ADDED Viewed

	@@ -0,0 +1,55 @@

+import argparse
+import os
+import random
+import numpy as np
+import torch
+import torch.backends.cudnn as cudnn
+import gradio as gr
+from gpt4clone.common.config import Config
+from gpt4clone.common.registry import registry
+# imports modules for registration
+from gpt4clone.models import *
+def parse_args():
+    parser = argparse.ArgumentParser(description="Demo")
+    parser.add_argument("--cfg-path", required=True, help="path to configuration file.")
+    parser.add_argument("--gpu-id", type=int, default=0, help="specify the gpu to load the model.")
+    parser.add_argument(
+        "--options",
+        nargs="+",
+        help="override some settings in the used config, the key-value pair "
+        "in xxx=yyy format will be merged into config file (deprecate), "
+        "change to --cfg-options instead.",
+    )
+    args = parser.parse_args()
+    return args
+def setup_seeds(config):
+    seed = config.run_cfg.seed + get_rank()
+    random.seed(seed)
+    np.random.seed(seed)
+    torch.manual_seed(seed)
+    cudnn.benchmark = False
+    cudnn.deterministic = True
+# ========================================
+#             Model Initialization
+# ========================================
+print('Initializing Chat')
+args = parse_args()
+cfg = Config(args)
+model_config = cfg.model_cfg
+model_config.device_8bit = args.gpu_id
+model_cls = registry.get_model_class(model_config.arch)
+model = model_cls.from_config(model_config).to('cuda:{}'.format(args.gpu_id))

code/gpt4-clone/eval_configs/minigpt4_eval.yaml ADDED Viewed

	@@ -0,0 +1,25 @@

+model:
+  arch: mini_gpt4
+  model_type: pretrain_vicuna
+  freeze_vit: True
+  freeze_qformer: True
+  max_txt_len: 160
+  end_sym: "###"
+  low_resource: True
+  prompt_path: "prompts/alignment.txt"
+  prompt_template: '###Human: {} ###Assistant: '
+  ckpt: '/workspace/weights/minigpt4/prerained_minigpt4_7b.pth'
+datasets:
+  cc_sbu_align:
+    vis_processor:
+      train:
+        name: "blip2_image_eval"
+        image_size: 224
+    text_processor:
+      train:
+        name: "blip_caption"
+run:
+  task: image_text_pretrain

code/gpt4-clone/gpt4clone/__init__.py ADDED Viewed

	@@ -0,0 +1,18 @@

+import os
+import sys
+from omegaconf import OmegaConf
+from gpt4clone.common.registry import registry
+root_dir = os.path.dirname(os.path.abspath(__file__))
+default_cfg = OmegaConf.load(os.path.join(root_dir, "configs/default.yaml"))
+registry.register_path("library_root", root_dir)
+repo_root = os.path.join(root_dir, "..")
+registry.register_path("repo_root", repo_root)
+cache_root = os.path.join(repo_root, default_cfg.env.cache_root)
+registry.register_path("cache_root", cache_root)
+registry.register("MAX_INT", sys.maxsize)
+registry.register("SPLIT_NAMES", ["train", "val", "test"])

code/gpt4-clone/gpt4clone/__pycache__/__init__.cpython-39.pyc ADDED Viewed

Binary file (648 Bytes). View file

code/gpt4-clone/gpt4clone/common/__pycache__/config.cpython-39.pyc ADDED Viewed

Binary file (2.45 kB). View file

code/gpt4-clone/gpt4clone/common/__pycache__/registry.cpython-39.pyc ADDED Viewed

Binary file (2.48 kB). View file

code/gpt4-clone/gpt4clone/common/__pycache__/utils.cpython-39.pyc ADDED Viewed

Binary file (388 Bytes). View file

code/gpt4-clone/gpt4clone/common/config.py ADDED Viewed

	@@ -0,0 +1,86 @@

+import logging
+import json
+from typing import Dict
+from omegaconf import OmegaConf
+from gpt4clone.common.registry import registry
+class Config:
+    def __init__(self, args):
+        self.config = {}
+        self.args = args
+        # Register the config and configuration for setup
+        registry.register("configuration", self)
+        user_config = self._build_opt_list(self.args.options)
+        config = OmegaConf.load(self.args.cfg_path)
+        runner_config = self.build_runner_config(config)
+        model_config = self.build_model_config(config, **user_config)
+        # dataset_config = self.build_dataset_config(config)
+        # # Override the default configuration with user options.
+        self.config = OmegaConf.merge(
+            runner_config, model_config
+        )
+    def _build_opt_list(self, opts):
+        opts_dot_list = self._convert_to_dot_list(opts)
+        return OmegaConf.from_dotlist(opts_dot_list)
+    def _convert_to_dot_list(self, opts):
+        if opts is None:
+            opts = []
+        if len(opts) == 0:
+            return opts
+        has_equal = opts[0].find("=") != -1
+        if has_equal:
+            return opts
+        return [(opt + "=" + value) for opt, value in zip(opts[0::2], opts[1::2])]
+    @staticmethod
+    def build_runner_config(config):
+        return {"run": config.run}
+    @staticmethod
+    def build_model_config(config, **kwargs):
+        model = config.get("model", None)
+        assert model is not None, "Missing model configuration file."
+        model_cls = registry.get_model_class(model.arch)
+        assert model_cls is not None, f"Model '{model.arch}' has not been registered."
+        model_type = kwargs.get('model.model_type', None)
+        if not model_type:
+            model_type = model.get('model_type', None)
+        assert model_type is not None, "Missing model_type"
+        model_config_path = model_cls.default_config_path(model_type=model_type)
+        model_config = OmegaConf.create()
+        print('config[model]', config['model'])
+        model_config = OmegaConf.merge(
+            # model_config,
+            OmegaConf.load(model_config_path),
+            {"model": config['model']},
+        )
+        return model_config
+    @property
+    def model_cfg(self):
+        return self.config.model

code/gpt4-clone/gpt4clone/common/registry.py ADDED Viewed

	@@ -0,0 +1,91 @@

+class Registry:
+    mapping = {
+        "builder_name_mapping": {},
+        "task_name_mapping": {},
+        "processor_name_mapping": {},
+        "model_name_mapping": {},
+        "lr_scheduler_name_mapping": {},
+        "runner_name_mapping": {},
+        "state": {},
+        "paths": {},
+    }
+    @classmethod
+    def register_path(cls, name, path):
+        r"""Register a path to registry with key 'name'
+        Args:
+            name: Key with which the path will be registered.
+        Usage:
+            from minigpt4.common.registry import registry
+        """
+        assert isinstance(path, str), "All path must be str."
+        if name in cls.mapping["paths"]:
+            raise KeyError("Name '{}' already registered.".format(name))
+        cls.mapping["paths"][name] = path
+    @classmethod
+    def register(cls, name, obj):
+        r"""Register an item to registry with key 'name'
+        Args:
+            name: Key with which the item will be registered.
+        Usage::
+            from minigpt4.common.registry import registry
+            registry.register("config", {})
+        """
+        path = name.split(".")
+        current = cls.mapping["state"]
+        for part in path[:-1]:
+            if part not in current:
+                current[part] = {}
+            current = current[part]
+        current[path[-1]] = obj
+    @classmethod
+    def get_model_class(cls, name):
+        return cls.mapping["model_name_mapping"].get(name, None)
+    @classmethod
+    def register_model(cls, name):
+        r"""Register a task to registry with key 'name'
+        Args:
+            name: Key with which the task will be registered.
+        Usage:
+            from minigpt4.common.registry import registry
+        """
+        def wrap(model_cls):
+            if name in cls.mapping['model_name_mapping']:
+                raise KeyError(
+                    "Name '{}' already registered for {}.".format(
+                        name, cls.mapping["model_name_mapping"][name]
+                    )
+                )
+            cls.mapping['model_name_mapping'][name] = model_cls
+            return model_cls
+        return wrap
+    @classmethod
+    def get_path(cls, name):
+        return cls.mapping["paths"].get(name, None)
+registry = Registry()

code/gpt4-clone/gpt4clone/common/utils.py ADDED Viewed

	@@ -0,0 +1,6 @@

+import os
+from gpt4clone.common.registry import registry
+def get_abs_path(rel_path):
+    return os.path.join(registry.get_path("library_root"), rel_path)

code/gpt4-clone/gpt4clone/configs/default.yaml ADDED Viewed

	@@ -0,0 +1,5 @@

+env:
+  # For default users
+  # cache_root: "cache"
+  # For internal use with persistent storage
+  cache_root: "/export/home/.cache/minigpt4"

code/gpt4-clone/gpt4clone/configs/models/minigpt4.yaml ADDED Viewed

	@@ -0,0 +1,33 @@

+model:
+  arch: mini_gpt4
+  # vit encoder
+  image_size: 224
+  drop_path_rate: 0
+  use_grad_checkpoint: False
+  vit_precision: "fp16"
+  freeze_vit: True
+  freeze_qformer: True
+  # Q-Former
+  num_query_token: 32
+  # Vicuna
+  llama_model: "/workspace/weights/vicuna_7b/7b_v0/"
+  # generation configs
+  prompt: ""
+preprocess:
+  vis_processor:
+    train:
+      name: "blip2_image_train"
+      image_size: 224
+    eval:
+      name: "blip2_image_eval"
+      image_size: 224
+  text_processor:
+    train:
+      name: "blip_caption"
+    eval:
+      name: "blip_caption"

code/gpt4-clone/gpt4clone/models/__init__.py ADDED Viewed

	@@ -0,0 +1,5 @@

+from gpt4clone.models.mini_gpt4 import MiniGPT4
+__all__ = [
+    'MiniGPT4'
+]

code/gpt4-clone/gpt4clone/models/__pycache__/__init__.cpython-39.pyc ADDED Viewed

Binary file (229 Bytes). View file

code/gpt4-clone/gpt4clone/models/__pycache__/mini_gpt4.cpython-39.pyc ADDED Viewed

Binary file (981 Bytes). View file

code/gpt4-clone/gpt4clone/models/mini_gpt4.py ADDED Viewed

	@@ -0,0 +1,125 @@

+from gpt4clone.common.registry import registry
+from gpt4clone.models.blip2 import Blip2Base, disabled_train
+from gpt4clone.common.utils import get_abs_path
+@registry.register_model('mini_gpt4')
+class MiniGPT4(Blip2Base):
+    print('register mini_gpt4')
+    PRETRAINED_MODEL_CONFIG_DICT = {
+        "pretrain_vicuna": "configs/models/minigpt4.yaml",
+    }
+    def __init__(
+        self,
+        vit_model="eva_clip_g",
+        q_former_model="https://storage.googleapis.com/sfr-vision-language-research/LAVIS/models/BLIP2/blip2_pretrained_flant5xxl.pth",
+        img_size=224,
+        drop_path_rate=0,
+        use_grad_checkpoint=False,
+        vit_precision="fp16",
+        freeze_vit=True,
+        freeze_qformer=True,
+        num_query_token=32,
+        llama_model="",
+        prompt_path="",
+        prompt_template="",
+        max_txt_len=32,
+        end_sym='\n',
+        low_resource=False,  # use 8 bit and put vit in cpu
+        device_8bit=0,  # the device of 8bit model should be set when loading and cannot be changed anymore.
+    ):
+        super().__init__()
+        self.tokenizer = self.init_tokenizer()
+        self.low_resource = low_resource
+        print('Loading VIT')
+        self.visual_encoder, self.ln_vision = self.init_vision_encoder(
+            vit_model, img_size, drop_path_rate, use_grad_checkpoint, vit_precision
+        )
+        if freeze_vit:
+            for name, param in self.visual_encoder.named_parameters():
+                param.requires_grad = False
+            self.visual_encoder = self.visual_encoder.eval()
+            self.visual_encoder.train = disabled_train
+            for name, param in self.ln_vision.named_parameters():
+                param.requires_grad = False
+            self.ln_vision = self.ln_vision.eval()
+            self.ln_vision.train = disabled_train
+            logging.info("freeze vision encoder")
+        print('Loading VIT Done')
+        if freeze_qformer:
+            for name, param in self.Qformer.named_parameters():
+                param.requires_grad = False
+            self.Qformer = self.Qformer.eval()
+            self.Qformer.train = disabled_train
+            self.query_tokens.requires_grad = False
+            logging.info("freeze Qformer")
+        print('Loading Q-Former Done')
+        print('Loading LLAMA')
+    @classmethod
+    def default_config_path(cls, model_type):
+        return get_abs_path(cls.PRETRAINED_MODEL_CONFIG_DICT[model_type])
+    @classmethod
+    def from_config(cls, cfg):
+        print('from_config', cfg)
+        vit_model = cfg.get('vit_model', 'eva_clip_g')
+        q_former_model = cfg.get("q_former_model", "https://storage.googleapis.com/sfr-vision-language-research/LAVIS/models/BLIP2/blip2_pretrained_flant5xxl.pth")
+        img_size = cfg.get('image_size')
+        num_query_token = cfg.get("num_query_token")
+        llama_model = cfg.get("llama_model")
+        drop_path_rate = cfg.get("drop_path_rate", 0)
+        use_grad_checkpoint = cfg.get("use_grad_checkpoint", False)
+        vit_precision = cfg.get("vit_precision", "fp16")
+        freeze_vit = cfg.get("freeze_vit", True)
+        freeze_qformer = cfg.get("freeze_qformer", True)
+        low_resource = cfg.get("low_resource", False)
+        device_8bit = cfg.get("device_8bit", 0)
+        prompt_path = cfg.get("prompt_path", "")
+        prompt_template = cfg.get("prompt_template", "")
+        max_txt_len = cfg.get("max_txt_len", 32)
+        end_sym = cfg.get("end_sym", '\n')
+        model = cls(
+            vit_model=vit_model,
+            q_former_model=q_former_model,
+            img_size=img_size,
+            drop_path_rate=drop_path_rate,
+            use_grad_checkpoint=use_grad_checkpoint,
+            vit_precision=vit_precision,
+            freeze_vit=freeze_vit,
+            freeze_qformer=freeze_qformer,
+            num_query_token=num_query_token,
+            llama_model=llama_model,
+            prompt_path=prompt_path,
+            prompt_template=prompt_template,
+            max_txt_len=max_txt_len,
+            end_sym=end_sym,
+            low_resource=low_resource,
+            device_8bit=device_8bit,
+        )
+        ckpt_path = cfg.get("ckpt", "")  # load weights of MiniGPT-4
+        if ckpt_path:
+            print("Load BLIP2-LLM Checkpoint: {}".format(ckpt_path))
+            ckpt = torch.load(ckpt_path, map_location="cpu")
+            msg = model.load_state_dict(ckpt['model'], strict=False)
+        return model