代码拉取完成,页面将自动刷新
同步操作将从 MindSpore/mindformers 强制同步,此操作会覆盖自 Fork 仓库以来所做的任何修改,且无法恢复!!!
确定后同步将在后台操作,完成时将刷新页面,请耐心等待。
model:
arch:
type: CLIPModel
model_config:
type: CLIPConfig
text_config:
type: CLIPTextConfig
vocab_size: 49408
hidden_size: 768
intermediate_size: 2048
num_hidden_layers: 12
num_attention_heads: 12
max_position_embeddings: 77
hidden_act: "quick_gelu"
attention_dropout: 0.0
drop_out: 0.0
initializer_range: 0.02
initializer_factor: 1.0
vision_config:
type: CLIPVisionConfig
hidden_size: 1024
intermediate_size: 3072
num_hidden_layers: 24
num_attention_heads: 16
image_size: 336
patch_size: 14
hidden_act: "quick_gelu"
dropout: 0.0
attention_dropout: 0.0
initializer_range: 0.02
initializer_factor: 1.0
dtype: float16 # type of tensors
checkpoint_name_or_path: clip_vit_l_14@336 # the loaded model type
projection_dim: 768 # feature dims
logit_scale_init_value: 2.6592
processor:
type: CLIPProcessor
image_processor:
type: CLIPImageProcessor
image_resolution: 336 # input image size
tokenizer:
type: CLIPTokenizer
pad_token: '!' # corresponding token id is 0
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。