OFA预训练模型

News

2022年11月：
- 发布ModelScope 1.0版本，以下能力请使用1.0及以上版本。
- 新增OFA Tutorial。

OFA预训练模型是OFA在8个预训练任务（具体参见论文）上得到ckpt，是finetune下游任务的基础。

OFA是什么？

OFA(One-For-All)是通用多模态预训练模型，使用简单的序列到序列的学习框架统一模态（跨模态、视觉、语言等模态）和任务（如图片生成、视觉定位、图片描述、图片分类、文本生成等），详见我们发表于ICML 2022的论文：OFA: Unifying Architectures, Tasks, and Modalities Through a Simple Sequence-to-Sequence Learning Framework，以及我们的官方Github仓库https://github.com/OFA-Sys/OFA。

Github ｜ Paper ｜ Blog

OFA模型规模

Model	Params-en	Params-zh	Backbone	Hidden size	Intermediate size	Num. of heads	Enc layers	Dec layers
OFA_Tiny	33M	-	ResNet50	256	1024	4	4	4
OFA_Medium	93M	-	ResNet101	512	2048	8	4	4
OFA_Base	180M	160M	ResNet101	768	3072	12	6	6
OFA_Large	470M	440M	ResNet152	1024	4096	16	12	12
OFA_Huge	930M	-	ResNet152	1280	5120	16	24	12

OFA 模型任务矩阵

目前ModelScope上面所有已经上传的模型和任务可以在下面导航表格看到，点击链接可以跳转到相应modelcard。

模型规模	预训练	图像描述	视觉问答	视觉定位	视觉蕴含	文生图	图像分类	文字识别	文本摘要	文本分类
OFA_Tiny	英文	英文	-	英文	英文	-	-	-	-	-
OFA_Medium	英文	-	-	-	-	-	-	-	-	-
OFA_Base	中文/英文	中文电商	-	-	-	-	-	场景中文	-	-
OFA_Large	中文/英文	英文	英文	中文/英文	英文	英文	英文	-	英文	英文
OFA_Huge	英文	英文	英文	-	-	-	-	-	-	-
OFA_6B	-	英文	-	-	-	-	-	-	-	-

相关论文以及引用

如果你觉得OFA好用，喜欢我们的工作，欢迎引用：

@article{wang2022ofa,
  author    = {Peng Wang and
               An Yang and
               Rui Men and
               Junyang Lin and
               Shuai Bai and
               Zhikang Li and
               Jianxin Ma and
               Chang Zhou and
               Jingren Zhou and
               Hongxia Yang},
  title     = {OFA: Unifying Architectures, Tasks, and Modalities Through a Simple Sequence-to-Sequence
               Learning Framework},
  journal   = {CoRR},
  volume    = {abs/2202.03052},
  year      = {2022}
}