PS D:\mergekit-phi-2> mergekit-yaml 11b.yml ./output-model-directory --cuda
C:\Users\jmes1\AppData\Local\Programs\Python\Python311\Lib\site-packages\transformers\utils\generic.py:441: UserWarning: torch.utils._pytree._register_pytree_node is deprecated. Please use torch.utils._pytree.register_pytree_node instead.
_torch_pytree._register_pytree_node(
C:\Users\jmes1\AppData\Local\Programs\Python\Python311\Lib\site-packages\transformers\utils\generic.py:309: UserWarning: torch.utils._pytree._register_pytree_node is deprecated. Please use torch.utils._pytree.register_pytree_node instead.
_torch_pytree._register_pytree_node(
โญโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ Traceback (most recent call last) โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฎ
โ C:\Users\jmes1\AppData\Local\Programs\Python\Python311\Lib\site-packages\transformers\dynamic_mo โ
โ dule_utils.py:595 in resolve_trust_remote_code โ
โ โ
โ 592 โ โ โ trust_remote_code = False โ
โ 593 โ โ elif has_remote_code and TIME_OUT_REMOTE_CODE > 0: โ
โ 594 โ โ โ try: โ
โ โฑ 595 โ โ โ โ signal.signal(signal.SIGALRM, _raise_timeout_error) โ
โ 596 โ โ โ โ signal.alarm(TIME_OUT_REMOTE_CODE) โ
โ 597 โ โ โ โ while trust_remote_code is None: โ
โ 598 โ โ โ โ โ answer = input( โ
โ โ
โ โญโโโโโโโโโโโโโโโโโโโโโโโโโโโ locals โโโโโโโโโโโโโโโโโโโโโโโโโโโโโฎ โ
โ โ has_local_code = False โ โ
โ โ has_remote_code = True โ โ
โ โ model_name = 'cognitivecomputations/dolphin-2_6-phi-2' โ โ
โ โ trust_remote_code = None โ โ
โ โฐโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฏ โ
โฐโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฏ
AttributeError: module 'signal' has no attribute 'SIGALRM'
During handling of the above exception, another exception occurred:
โญโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ Traceback (most recent call last) โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฎ
โ D:\mergekit-phi-2\mergekit\scripts\run_yaml.py:85 in main โ
โ โ
โ 82 โ โ data = yaml.load(file, yaml.SafeLoader) โ
โ 83 โ โ
โ 84 โ merge_config: MergeConfiguration = MergeConfiguration.model_validate(data) โ
โ โฑ 85 โ run_merge( โ
โ 86 โ โ merge_config, โ
โ 87 โ โ out_path, โ
โ 88 โ โ options=MergeOptions( โ
โ โ
โ โญโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ locals โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฎ โ
โ โ allow_crimes = False โ โ
โ โ clone_tensors = False โ โ
โ โ config_file = '11b.yml' โ โ
โ โ copy_tokenizer = True โ โ
โ โ cuda = True โ โ
โ โ data = { โ โ
โ โ โ 'slices': [ โ โ
โ โ โ โ { โ โ
โ โ โ โ โ 'sources': [ โ โ
โ โ โ โ โ โ { โ โ
โ โ โ โ โ โ โ 'model': 'cognitivecomputations/dolphin-2_6-phi-2', โ โ
โ โ โ โ โ โ โ 'layer_range': [0, 18] โ โ
โ โ โ โ โ โ } โ โ
โ โ โ โ โ ] โ โ
โ โ โ โ }, โ โ
โ โ โ โ { โ โ
โ โ โ โ โ 'sources': [ โ โ
โ โ โ โ โ โ { โ โ
โ โ โ โ โ โ โ 'model': 'cognitivecomputations/dolphin-2_6-phi-2', โ โ
โ โ โ โ โ โ โ 'layer_range': [0, 32] โ โ
โ โ โ โ โ โ } โ โ
โ โ โ โ โ ] โ โ
โ โ โ โ }, โ โ
โ โ โ โ { โ โ
โ โ โ โ โ 'sources': [ โ โ
โ โ โ โ โ โ { โ โ
โ โ โ โ โ โ โ 'model': 'cognitivecomputations/dolphin-2_6-phi-2', โ โ
โ โ โ โ โ โ โ 'layer_range': [14, 32] โ โ
โ โ โ โ โ โ } โ โ
โ โ โ โ โ ] โ โ
โ โ โ โ } โ โ
โ โ โ ], โ โ
โ โ โ 'merge_method': 'passthrough', โ โ
โ โ โ 'dtype': 'bfloat16' โ โ
โ โ } โ โ
โ โ file = <_io.TextIOWrapper name='11b.yml' mode='r' encoding='utf-8'> โ โ
โ โ lazy_unpickle = False โ โ
โ โ lora_merge_cache = None โ โ
โ โ low_cpu_memory = False โ โ
โ โ merge_config = MergeConfiguration( โ โ
โ โ โ merge_method='passthrough', โ โ
โ โ โ slices=[ โ โ
โ โ โ โ OutputSliceDefinition( โ โ
โ โ โ โ โ sources=[ โ โ
โ โ โ โ โ โ InputSliceDefinition( โ โ
โ โ โ โ โ โ โ model='cognitivecomputations/dolphin-2_6-phi-2', โ โ
โ โ โ โ โ โ โ layer_range=(0, 18), โ โ
โ โ โ โ โ โ โ parameters=None โ โ
โ โ โ โ โ โ ) โ โ
โ โ โ โ โ ], โ โ
โ โ โ โ โ base_model=None, โ โ
โ โ โ โ โ residual_weight=None, โ โ
โ โ โ โ โ parameters=None โ โ
โ โ โ โ ), โ โ
โ โ โ โ OutputSliceDefinition( โ โ
โ โ โ โ โ sources=[ โ โ
โ โ โ โ โ โ InputSliceDefinition( โ โ
โ โ โ โ โ โ โ model='cognitivecomputations/dolphin-2_6-phi-2', โ โ
โ โ โ โ โ โ โ layer_range=(0, 32), โ โ
โ โ โ โ โ โ โ parameters=None โ โ
โ โ โ โ โ โ ) โ โ
โ โ โ โ โ ], โ โ
โ โ โ โ โ base_model=None, โ โ
โ โ โ โ โ residual_weight=None, โ โ
โ โ โ โ โ parameters=None โ โ
โ โ โ โ ), โ โ
โ โ โ โ OutputSliceDefinition( โ โ
โ โ โ โ โ sources=[ โ โ
โ โ โ โ โ โ InputSliceDefinition( โ โ
โ โ โ โ โ โ โ model='cognitivecomputations/dolphin-2_6-phi-2', โ โ
โ โ โ โ โ โ โ layer_range=(14, 32), โ โ
โ โ โ โ โ โ โ parameters=None โ โ
โ โ โ โ โ โ ) โ โ
โ โ โ โ โ ], โ โ
โ โ โ โ โ base_model=None, โ โ
โ โ โ โ โ residual_weight=None, โ โ
โ โ โ โ โ parameters=None โ โ
โ โ โ โ ) โ โ
โ โ โ ], โ โ
โ โ โ models=None, โ โ
โ โ โ input_model_parameters=None, โ โ
โ โ โ parameters=None, โ โ
โ โ โ base_model=None, โ โ
โ โ โ dtype='bfloat16', โ โ
โ โ โ tokenizer_source=None โ โ
โ โ ) โ โ
โ โ out_path = './output-model-directory' โ โ
โ โ out_shard_size = 5000000000 โ โ
โ โ transformers_cache = None โ โ
โ โ trust_remote_code = False โ โ
โ โ verbose = False โ โ
โ โฐโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฏ โ
โ โ
โ D:\mergekit-phi-2\mergekit\merge.py:62 in run_merge โ
โ โ
โ 59 โ โ raise RuntimeError("No output requested") โ
โ 60 โ โ
โ 61 โ method = merge_methods.get(merge_config.merge_method) โ
โ โฑ 62 โ model_arch_info = [ โ
โ 63 โ โ get_architecture_info(m.config()) for m in merge_config.referenced_models() โ
โ 64 โ ] โ
โ 65 โ if not options.allow_crimes: โ
โ โ
โ โญโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ locals โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฎ โ
โ โ dtype = torch.bfloat16 โ โ
โ โ merge_config = MergeConfiguration( โ โ
โ โ โ merge_method='passthrough', โ โ
โ โ โ slices=[ โ โ
โ โ โ โ OutputSliceDefinition( โ โ
โ โ โ โ โ sources=[ โ โ
โ โ โ โ โ โ InputSliceDefinition( โ โ
โ โ โ โ โ โ โ model='cognitivecomputations/dolphin-2_6-phi-2', โ โ
โ โ โ โ โ โ โ layer_range=(0, 18), โ โ
โ โ โ โ โ โ โ parameters=None โ โ
โ โ โ โ โ โ ) โ โ
โ โ โ โ โ ], โ โ
โ โ โ โ โ base_model=None, โ โ
โ โ โ โ โ residual_weight=None, โ โ
โ โ โ โ โ parameters=None โ โ
โ โ โ โ ), โ โ
โ โ โ โ OutputSliceDefinition( โ โ
โ โ โ โ โ sources=[ โ โ
โ โ โ โ โ โ InputSliceDefinition( โ โ
โ โ โ โ โ โ โ model='cognitivecomputations/dolphin-2_6-phi-2', โ โ
โ โ โ โ โ โ โ layer_range=(0, 32), โ โ
โ โ โ โ โ โ โ parameters=None โ โ
โ โ โ โ โ โ ) โ โ
โ โ โ โ โ ], โ โ
โ โ โ โ โ base_model=None, โ โ
โ โ โ โ โ residual_weight=None, โ โ
โ โ โ โ โ parameters=None โ โ
โ โ โ โ ), โ โ
โ โ โ โ OutputSliceDefinition( โ โ
โ โ โ โ โ sources=[ โ โ
โ โ โ โ โ โ InputSliceDefinition( โ โ
โ โ โ โ โ โ โ model='cognitivecomputations/dolphin-2_6-phi-2', โ โ
โ โ โ โ โ โ โ layer_range=(14, 32), โ โ
โ โ โ โ โ โ โ parameters=None โ โ
โ โ โ โ โ โ ) โ โ
โ โ โ โ โ ], โ โ
โ โ โ โ โ base_model=None, โ โ
โ โ โ โ โ residual_weight=None, โ โ
โ โ โ โ โ parameters=None โ โ
โ โ โ โ ) โ โ
โ โ โ ], โ โ
โ โ โ models=None, โ โ
โ โ โ input_model_parameters=None, โ โ
โ โ โ parameters=None, โ โ
โ โ โ base_model=None, โ โ
โ โ โ dtype='bfloat16', โ โ
โ โ โ tokenizer_source=None โ โ
โ โ ) โ โ
โ โ method = <mergekit.merge_methods.passthrough.PassthroughMerge object at โ โ
โ โ 0x00000164EDC8A4D0> โ โ
โ โ options = MergeOptions( โ โ
โ โ โ allow_crimes=False, โ โ
โ โ โ transformers_cache=None, โ โ
โ โ โ lora_merge_cache=None, โ โ
โ โ โ cuda=True, โ โ
โ โ โ low_cpu_memory=False, โ โ
โ โ โ out_shard_size=5000000000, โ โ
โ โ โ copy_tokenizer=True, โ โ
โ โ โ clone_tensors=False, โ โ
โ โ โ trust_remote_code=False, โ โ
โ โ โ random_seed=None, โ โ
โ โ โ lazy_unpickle=False โ โ
โ โ ) โ โ
โ โ out_path = './output-model-directory' โ โ
โ โฐโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฏ โ
โ โ
โ D:\mergekit-phi-2\mergekit\merge.py:63 in <listcomp> โ
โ โ
โ 60 โ โ
โ 61 โ method = merge_methods.get(merge_config.merge_method) โ
โ 62 โ model_arch_info = [ โ
โ โฑ 63 โ โ get_architecture_info(m.config()) for m in merge_config.referenced_models() โ
โ 64 โ ] โ
โ 65 โ if not options.allow_crimes: โ
โ 66 โ โ if not all(a == model_arch_info[0] for a in model_arch_info[1:]): โ
โ โ
โ โญโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ locals โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฎ โ
โ โ .0 = <list_iterator object at 0x00000164F02B87F0> โ โ
โ โ m = ModelReference(path='cognitivecomputations/dolphin-2_6-phi-2', lora_path=None) โ โ
โ โฐโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฏ โ
โ โ
โ D:\mergekit-phi-2\mergekit\common.py:75 in config โ
โ โ
โ 72 โ โ return ModelReference(path=out_path) โ
โ 73 โ โ
โ 74 โ def config(self) -> PretrainedConfig: โ
โ โฑ 75 โ โ return AutoConfig.from_pretrained(self.path) โ
โ 76 โ โ
โ 77 โ def tensor_index(self, cache_dir: Optional[str] = None) -> ShardedTensorIndex: โ
โ 78 โ โ assert self.lora_path is None โ
โ โ
โ โญโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ locals โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฎ โ
โ โ self = ModelReference(path='cognitivecomputations/dolphin-2_6-phi-2', lora_path=None) โ โ
โ โฐโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฏ โ
โ โ
โ C:\Users\jmes1\AppData\Local\Programs\Python\Python311\Lib\site-packages\transformers\models\aut โ
โ o\configuration_auto.py:1085 in from_pretrained โ
โ โ
โ 1082 โ โ config_dict, unused_kwargs = PretrainedConfig.get_config_dict(pretrained_model_n โ
โ 1083 โ โ has_remote_code = "auto_map" in config_dict and "AutoConfig" in config_dict["aut โ
โ 1084 โ โ has_local_code = "model_type" in config_dict and config_dict["model_type"] in CO โ
โ โฑ 1085 โ โ trust_remote_code = resolve_trust_remote_code( โ
โ 1086 โ โ โ trust_remote_code, pretrained_model_name_or_path, has_local_code, has_remote โ
โ 1087 โ โ ) โ
โ 1088 โ
โ โ
โ โญโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ locals โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฎ โ
โ โ cls = <class โ โ
โ โ 'transformers.models.auto.configuration_auto.AutoConfig'> โ โ
โ โ code_revision = None โ โ
โ โ config_dict = { โ โ
โ โ โ '_name_or_path': 'microsoft/phi-2', โ โ
โ โ โ 'activation_function': 'gelu_new', โ โ
โ โ โ 'architectures': ['PhiForCausalLM'], โ โ
โ โ โ 'attn_pdrop': 0.0, โ โ
โ โ โ 'auto_map': { โ โ
โ โ โ โ 'AutoConfig': โ โ
โ โ 'cognitivecomputations/dolphin-2_6-phi-2--configuration_phiโฆ โ โ
โ โ โ โ 'AutoModelForCausalLM': โ โ
โ โ 'cognitivecomputations/dolphin-2_6-phi-2--modeling_phi.PhiFโฆ โ โ
โ โ โ }, โ โ
โ โ โ 'embd_pdrop': 0.0, โ โ
โ โ โ 'flash_attn': False, โ โ
โ โ โ 'flash_rotary': False, โ โ
โ โ โ 'fused_dense': False, โ โ
โ โ โ 'img_processor': None, โ โ
โ โ โ ... +17 โ โ
โ โ } โ โ
โ โ has_local_code = False โ โ
โ โ has_remote_code = True โ โ
โ โ kwargs = { โ โ
โ โ โ '_from_auto': True, โ โ
โ โ โ 'name_or_path': โ โ
โ โ 'cognitivecomputations/dolphin-2_6-phi-2' โ โ
โ โ } โ โ
โ โ pretrained_model_name_or_path = 'cognitivecomputations/dolphin-2_6-phi-2' โ โ
โ โ trust_remote_code = None โ โ
โ โ unused_kwargs = {'name_or_path': 'cognitivecomputations/dolphin-2_6-phi-2'} โ โ
โ โ use_auth_token = None โ โ
โ โฐโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฏ โ
โ โ
โ C:\Users\jmes1\AppData\Local\Programs\Python\Python311\Lib\site-packages\transformers\dynamic_mo โ
โ dule_utils.py:611 in resolve_trust_remote_code โ
โ โ
โ 608 โ โ โ โ signal.alarm(0) โ
โ 609 โ โ โ except Exception: โ
โ 610 โ โ โ โ # OS which does not support signal.SIGALRM โ
โ โฑ 611 โ โ โ โ raise ValueError( โ
โ 612 โ โ โ โ โ f"The repository for {model_name} contains custom code which must be โ
โ 613 โ โ โ โ โ f"load the model. You can inspect the repository content at https:// โ
โ 614 โ โ โ โ โ f"Please pass the argument `trust_remote_code=True` to allow custom โ
โ โ
โ โญโโโโโโโโโโโโโโโโโโโโโโโโโโโ locals โโโโโโโโโโโโโโโโโโโโโโโโโโโโโฎ โ
โ โ has_local_code = False โ โ
โ โ has_remote_code = True โ โ
โ โ model_name = 'cognitivecomputations/dolphin-2_6-phi-2' โ โ
โ โ trust_remote_code = None โ โ
โ โฐโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฏ โ
โฐโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฏ
ValueError: The repository for cognitivecomputations/dolphin-2_6-phi-2 contains custom code which must be executed to
correctly load the model. You can inspect the repository content at
https://hf.co/cognitivecomputations/dolphin-2_6-phi-2.
Please pass the argument `trust_remote_code=True` to allow custom code to be run.
PS D:\mergekit-phi-2> mergekit-yaml 11b.yml ./output-model-directory --cuda
C:\Users\jmes1\AppData\Local\Programs\Python\Python311\Lib\site-packages\transformers\utils\generic.py:441: UserWarning: torch.utils._pytree._register_pytree_node is deprecated. Please use torch.utils._pytree.register_pytree_node instead.
_torch_pytree._register_pytree_node(
C:\Users\jmes1\AppData\Local\Programs\Python\Python311\Lib\site-packages\transformers\utils\generic.py:309: UserWarning: torch.utils._pytree._register_pytree_node is deprecated. Please use torch.utils._pytree.register_pytree_node instead.
_torch_pytree._register_pytree_node(
โญโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ Traceback (most recent call last) โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฎ
โ C:\Users\jmes1\AppData\Local\Programs\Python\Python311\Lib\site-packages\transformers\dynamic_mo โ
โ dule_utils.py:595 in resolve_trust_remote_code โ
โ โ
โ 592 โ โ โ trust_remote_code = False โ
โ 593 โ โ elif has_remote_code and TIME_OUT_REMOTE_CODE > 0: โ
โ 594 โ โ โ try: โ
โ โฑ 595 โ โ โ โ signal.signal(signal.SIGALRM, _raise_timeout_error) โ
โ 596 โ โ โ โ signal.alarm(TIME_OUT_REMOTE_CODE) โ
โ 597 โ โ โ โ while trust_remote_code is None: โ
โ 598 โ โ โ โ โ answer = input( โ
โ โ
โ โญโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ locals โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฎ โ
โ โ has_local_code = False โ โ
โ โ has_remote_code = True โ โ
โ โ model_name = 'D:\\oobabooga_windows\\text-generation-webui\\models\\cognitivecomputaโฆ โ โ
โ โ trust_remote_code = None โ โ
โ โฐโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฏ โ
โฐโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฏ
AttributeError: module 'signal' has no attribute 'SIGALRM'
During handling of the above exception, another exception occurred:
โญโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ Traceback (most recent call last) โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฎ
โ D:\mergekit-phi-2\mergekit\scripts\run_yaml.py:85 in main โ
โ โ
โ 82 โ โ data = yaml.load(file, yaml.SafeLoader) โ
โ 83 โ โ
โ 84 โ merge_config: MergeConfiguration = MergeConfiguration.model_validate(data) โ
โ โฑ 85 โ run_merge( โ
โ 86 โ โ merge_config, โ
โ 87 โ โ out_path, โ
โ 88 โ โ options=MergeOptions( โ
โ โ
โ โญโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ locals โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฎ โ
โ โ allow_crimes = False โ โ
โ โ clone_tensors = False โ โ
โ โ config_file = '11b.yml' โ โ
โ โ copy_tokenizer = True โ โ
โ โ cuda = True โ โ
โ โ data = { โ โ
โ โ โ 'slices': [ โ โ
โ โ โ โ { โ โ
โ โ โ โ โ 'sources': [ โ โ
โ โ โ โ โ โ { โ โ
โ โ โ โ โ โ โ 'model': โ โ
โ โ 'D:\\oobabooga_windows\\text-generation-webui\\models\\cognitivecomputโฆ โ โ
โ โ โ โ โ โ โ 'layer_range': [0, 18] โ โ
โ โ โ โ โ โ } โ โ
โ โ โ โ โ ] โ โ
โ โ โ โ }, โ โ
โ โ โ โ { โ โ
โ โ โ โ โ 'sources': [ โ โ
โ โ โ โ โ โ { โ โ
โ โ โ โ โ โ โ 'model': โ โ
โ โ 'D:\\oobabooga_windows\\text-generation-webui\\models\\cognitivecomputโฆ โ โ
โ โ โ โ โ โ โ 'layer_range': [0, 32] โ โ
โ โ โ โ โ โ } โ โ
โ โ โ โ โ ] โ โ
โ โ โ โ }, โ โ
โ โ โ โ { โ โ
โ โ โ โ โ 'sources': [ โ โ
โ โ โ โ โ โ { โ โ
โ โ โ โ โ โ โ 'model': โ โ
โ โ 'D:\\oobabooga_windows\\text-generation-webui\\models\\cognitivecomputโฆ โ โ
โ โ โ โ โ โ โ 'layer_range': [14, 32] โ โ
โ โ โ โ โ โ } โ โ
โ โ โ โ โ ] โ โ
โ โ โ โ } โ โ
โ โ โ ], โ โ
โ โ โ 'merge_method': 'passthrough', โ โ
โ โ โ 'dtype': 'bfloat16' โ โ
โ โ } โ โ
โ โ file = <_io.TextIOWrapper name='11b.yml' mode='r' encoding='utf-8'> โ โ
โ โ lazy_unpickle = False โ โ
โ โ lora_merge_cache = None โ โ
โ โ low_cpu_memory = False โ โ
โ โ merge_config = MergeConfiguration( โ โ
โ โ โ merge_method='passthrough', โ โ
โ โ โ slices=[ โ โ
โ โ โ โ OutputSliceDefinition( โ โ
โ โ โ โ โ sources=[ โ โ
โ โ โ โ โ โ InputSliceDefinition( โ โ
โ โ โ โ โ โ โ โ โ
โ โ model='D:\\oobabooga_windows\\text-generation-webui\\models\\cognitiveโฆ โ โ
โ โ โ โ โ โ โ layer_range=(0, 18), โ โ
โ โ โ โ โ โ โ parameters=None โ โ
โ โ โ โ โ โ ) โ โ
โ โ โ โ โ ], โ โ
โ โ โ โ โ base_model=None, โ โ
โ โ โ โ โ residual_weight=None, โ โ
โ โ โ โ โ parameters=None โ โ
โ โ โ โ ), โ โ
โ โ โ โ OutputSliceDefinition( โ โ
โ โ โ โ โ sources=[ โ โ
โ โ โ โ โ โ InputSliceDefinition( โ โ
โ โ โ โ โ โ โ โ โ
โ โ model='D:\\oobabooga_windows\\text-generation-webui\\models\\cognitiveโฆ โ โ
โ โ โ โ โ โ โ layer_range=(0, 32), โ โ
โ โ โ โ โ โ โ parameters=None โ โ
โ โ โ โ โ โ ) โ โ
โ โ โ โ โ ], โ โ
โ โ โ โ โ base_model=None, โ โ
โ โ โ โ โ residual_weight=None, โ โ
โ โ โ โ โ parameters=None โ โ
โ โ โ โ ), โ โ
โ โ โ โ OutputSliceDefinition( โ โ
โ โ โ โ โ sources=[ โ โ
โ โ โ โ โ โ InputSliceDefinition( โ โ
โ โ โ โ โ โ โ โ โ
โ โ model='D:\\oobabooga_windows\\text-generation-webui\\models\\cognitiveโฆ โ โ
โ โ โ โ โ โ โ layer_range=(14, 32), โ โ
โ โ โ โ โ โ โ parameters=None โ โ
โ โ โ โ โ โ ) โ โ
โ โ โ โ โ ], โ โ
โ โ โ โ โ base_model=None, โ โ
โ โ โ โ โ residual_weight=None, โ โ
โ โ โ โ โ parameters=None โ โ
โ โ โ โ ) โ โ
โ โ โ ], โ โ
โ โ โ models=None, โ โ
โ โ โ input_model_parameters=None, โ โ
โ โ โ parameters=None, โ โ
โ โ โ base_model=None, โ โ
โ โ โ dtype='bfloat16', โ โ
โ โ โ tokenizer_source=None โ โ
โ โ ) โ โ
โ โ out_path = './output-model-directory' โ โ
โ โ out_shard_size = 5000000000 โ โ
โ โ transformers_cache = None โ โ
โ โ trust_remote_code = False โ โ
โ โ verbose = False โ โ
โ โฐโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฏ โ
โ โ
โ D:\mergekit-phi-2\mergekit\merge.py:62 in run_merge โ
โ โ
โ 59 โ โ raise RuntimeError("No output requested") โ
โ 60 โ โ
โ 61 โ method = merge_methods.get(merge_config.merge_method) โ
โ โฑ 62 โ model_arch_info = [ โ
โ 63 โ โ get_architecture_info(m.config()) for m in merge_config.referenced_models() โ
โ 64 โ ] โ
โ 65 โ if not options.allow_crimes: โ
โ โ
โ โญโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ locals โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฎ โ
โ โ dtype = torch.bfloat16 โ โ
โ โ merge_config = MergeConfiguration( โ โ
โ โ โ merge_method='passthrough', โ โ
โ โ โ slices=[ โ โ
โ โ โ โ OutputSliceDefinition( โ โ
โ โ โ โ โ sources=[ โ โ
โ โ โ โ โ โ InputSliceDefinition( โ โ
โ โ โ โ โ โ โ โ โ
โ โ model='D:\\oobabooga_windows\\text-generation-webui\\models\\cognitivecomputโฆ โ โ
โ โ โ โ โ โ โ layer_range=(0, 18), โ โ
โ โ โ โ โ โ โ parameters=None โ โ
โ โ โ โ โ โ ) โ โ
โ โ โ โ โ ], โ โ
โ โ โ โ โ base_model=None, โ โ
โ โ โ โ โ residual_weight=None, โ โ
โ โ โ โ โ parameters=None โ โ
โ โ โ โ ), โ โ
โ โ โ โ OutputSliceDefinition( โ โ
โ โ โ โ โ sources=[ โ โ
โ โ โ โ โ โ InputSliceDefinition( โ โ
โ โ โ โ โ โ โ โ โ
โ โ model='D:\\oobabooga_windows\\text-generation-webui\\models\\cognitivecomputโฆ โ โ
โ โ โ โ โ โ โ layer_range=(0, 32), โ โ
โ โ โ โ โ โ โ parameters=None โ โ
โ โ โ โ โ โ ) โ โ
โ โ โ โ โ ], โ โ
โ โ โ โ โ base_model=None, โ โ
โ โ โ โ โ residual_weight=None, โ โ
โ โ โ โ โ parameters=None โ โ
โ โ โ โ ), โ โ
โ โ โ โ OutputSliceDefinition( โ โ
โ โ โ โ โ sources=[ โ โ
โ โ โ โ โ โ InputSliceDefinition( โ โ
โ โ โ โ โ โ โ โ โ
โ โ model='D:\\oobabooga_windows\\text-generation-webui\\models\\cognitivecomputโฆ โ โ
โ โ โ โ โ โ โ layer_range=(14, 32), โ โ
โ โ โ โ โ โ โ parameters=None โ โ
โ โ โ โ โ โ ) โ โ
โ โ โ โ โ ], โ โ
โ โ โ โ โ base_model=None, โ โ
โ โ โ โ โ residual_weight=None, โ โ
โ โ โ โ โ parameters=None โ โ
โ โ โ โ ) โ โ
โ โ โ ], โ โ
โ โ โ models=None, โ โ
โ โ โ input_model_parameters=None, โ โ
โ โ โ parameters=None, โ โ
โ โ โ base_model=None, โ โ
โ โ โ dtype='bfloat16', โ โ
โ โ โ tokenizer_source=None โ โ
โ โ ) โ โ
โ โ method = <mergekit.merge_methods.passthrough.PassthroughMerge object at โ โ
โ โ 0x000002C3AD353950> โ โ
โ โ options = MergeOptions( โ โ
โ โ โ allow_crimes=False, โ โ
โ โ โ transformers_cache=None, โ โ
โ โ โ lora_merge_cache=None, โ โ
โ โ โ cuda=True, โ โ
โ โ โ low_cpu_memory=False, โ โ
โ โ โ out_shard_size=5000000000, โ โ
โ โ โ copy_tokenizer=True, โ โ
โ โ โ clone_tensors=False, โ โ
โ โ โ trust_remote_code=False, โ โ
โ โ โ random_seed=None, โ โ
โ โ โ lazy_unpickle=False โ โ
โ โ ) โ โ
โ โ out_path = './output-model-directory' โ โ
โ โฐโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฏ โ
โ โ
โ D:\mergekit-phi-2\mergekit\merge.py:63 in <listcomp> โ
โ โ
โ 60 โ โ
โ 61 โ method = merge_methods.get(merge_config.merge_method) โ
โ 62 โ model_arch_info = [ โ
โ โฑ 63 โ โ get_architecture_info(m.config()) for m in merge_config.referenced_models() โ
โ 64 โ ] โ
โ 65 โ if not options.allow_crimes: โ
โ 66 โ โ if not all(a == model_arch_info[0] for a in model_arch_info[1:]): โ
โ โ
โ โญโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ locals โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฎ โ
โ โ .0 = <list_iterator object at 0x000002C3AE9F87F0> โ โ
โ โ m = ModelReference( โ โ
โ โ โ โ โ
โ โ path='D:\\oobabooga_windows\\text-generation-webui\\models\\cognitivecomputations_dolpโฆ โ โ
โ โ โ lora_path=None โ โ
โ โ ) โ โ
โ โฐโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฏ โ
โ โ
โ D:\mergekit-phi-2\mergekit\common.py:75 in config โ
โ โ
โ 72 โ โ return ModelReference(path=out_path) โ
โ 73 โ โ
โ 74 โ def config(self) -> PretrainedConfig: โ
โ โฑ 75 โ โ return AutoConfig.from_pretrained(self.path) โ
โ 76 โ โ
โ 77 โ def tensor_index(self, cache_dir: Optional[str] = None) -> ShardedTensorIndex: โ
โ 78 โ โ assert self.lora_path is None โ
โ โ
โ โญโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ locals โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฎ โ
โ โ self = ModelReference( โ โ
โ โ โ โ โ
โ โ path='D:\\oobabooga_windows\\text-generation-webui\\models\\cognitivecomputations_doโฆ โ โ
โ โ โ lora_path=None โ โ
โ โ ) โ โ
โ โฐโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฏ โ
โ โ
โ C:\Users\jmes1\AppData\Local\Programs\Python\Python311\Lib\site-packages\transformers\models\aut โ
โ o\configuration_auto.py:1085 in from_pretrained โ
โ โ
โ 1082 โ โ config_dict, unused_kwargs = PretrainedConfig.get_config_dict(pretrained_model_n โ
โ 1083 โ โ has_remote_code = "auto_map" in config_dict and "AutoConfig" in config_dict["aut โ
โ 1084 โ โ has_local_code = "model_type" in config_dict and config_dict["model_type"] in CO โ
โ โฑ 1085 โ โ trust_remote_code = resolve_trust_remote_code( โ
โ 1086 โ โ โ trust_remote_code, pretrained_model_name_or_path, has_local_code, has_remote โ
โ 1087 โ โ ) โ
โ 1088 โ
โ โ
โ โญโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ locals โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฎ โ
โ โ cls = <class โ โ
โ โ 'transformers.models.auto.configuration_auto.AutoConfig'> โ โ
โ โ code_revision = None โ โ
โ โ config_dict = { โ โ
โ โ โ '_name_or_path': 'microsoft/phi-2', โ โ
โ โ โ 'activation_function': 'gelu_new', โ โ
โ โ โ 'architectures': ['PhiForCausalLM'], โ โ
โ โ โ 'attn_pdrop': 0.0, โ โ
โ โ โ 'auto_map': { โ โ
โ โ โ โ 'AutoConfig': 'configuration_phi.PhiConfig', โ โ
โ โ โ โ 'AutoModelForCausalLM': โ โ
โ โ 'modeling_phi.PhiForCausalLM' โ โ
โ โ โ }, โ โ
โ โ โ 'embd_pdrop': 0.0, โ โ
โ โ โ 'flash_attn': False, โ โ
โ โ โ 'flash_rotary': False, โ โ
โ โ โ 'fused_dense': False, โ โ
โ โ โ 'img_processor': None, โ โ
โ โ โ ... +17 โ โ
โ โ } โ โ
โ โ has_local_code = False โ โ
โ โ has_remote_code = True โ โ
โ โ kwargs = { โ โ
โ โ โ '_from_auto': True, โ โ
โ โ โ 'name_or_path': โ โ
โ โ 'D:\\oobabooga_windows\\text-generation-webui\\models\\cognโฆ โ โ
โ โ } โ โ
โ โ pretrained_model_name_or_path = 'D:\\oobabooga_windows\\text-generation-webui\\models\\cognโฆ โ โ
โ โ trust_remote_code = None โ โ
โ โ unused_kwargs = { โ โ
โ โ โ 'name_or_path': โ โ
โ โ 'D:\\oobabooga_windows\\text-generation-webui\\models\\cognโฆ โ โ
โ โ } โ โ
โ โ use_auth_token = None โ โ
โ โฐโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฏ โ
โ โ
โ C:\Users\jmes1\AppData\Local\Programs\Python\Python311\Lib\site-packages\transformers\dynamic_mo โ
โ dule_utils.py:611 in resolve_trust_remote_code โ
โ โ
โ 608 โ โ โ โ signal.alarm(0) โ
โ 609 โ โ โ except Exception: โ
โ 610 โ โ โ โ # OS which does not support signal.SIGALRM โ
โ โฑ 611 โ โ โ โ raise ValueError( โ
โ 612 โ โ โ โ โ f"The repository for {model_name} contains custom code which must be โ
โ 613 โ โ โ โ โ f"load the model. You can inspect the repository content at https:// โ
โ 614 โ โ โ โ โ f"Please pass the argument `trust_remote_code=True` to allow custom โ
โ โ
โ โญโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ locals โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฎ โ
โ โ has_local_code = False โ โ
โ โ has_remote_code = True โ โ
โ โ model_name = 'D:\\oobabooga_windows\\text-generation-webui\\models\\cognitivecomputaโฆ โ โ
โ โ trust_remote_code = None โ โ
โ โฐโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฏ โ
โฐโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฏ
ValueError: The repository for D:\oobabooga_windows\text-generation-webui\models\cognitivecomputations_dolphin-2_6-phi-2
contains custom code which must be executed to correctly load the model. You can inspect the repository content at
https://hf.co/D:\oobabooga_windows\text-generation-webui\models\cognitivecomputations_dolphin-2_6-phi-2.
Please pass the argument `trust_remote_code=True` to allow custom code to be run.