Joe99
/

visionlanguageTransformer

Visual Question Answering

Model card Files Files and versions

visionlanguageTransformer

File size: 251 Bytes

5dc136f

{
  "do_normalize": true,
  "do_resize": true,
  "feature_extractor_type": "ViltFeatureExtractor",
  "image_mean": [
    0.5,
    0.5,
    0.5
  ],
  "image_std": [
    0.5,
    0.5,
    0.5
  ],
  "resample": 3,
  "size": 384,
  "size_divisor": 32
}