OFA-文本生成SQL

文本生成SQL是什么？

根据用户输入的自然语言文本，将之转化为数据库可以接受的SQL语言，从而可以在数据库中检索出想要的答案。

快速玩起来

玩转OFA只需区区以下数行代码，就是如此轻松！如果你觉得还不够方便，请点击右上角Notebook按钮，我们为你提供了配备好的环境（可选CPU/GPU），你只需要在notebook里输入提供的代码，就可以把OFA玩起来了！

from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks
from modelscope.outputs import OutputKeys
ofa_pipe = pipeline(
    Tasks.text2sql,
    model='damo/ofa_text2sql_spider_large_en'
)

text = 'Show all book categories and the number of books in each category.'
database = 'culture_company' # optional, default `culture_company`
input = {'text': text, 'database': database}
result = ofa_pipe(input)
print(result[OutputKeys.TEXT]) # select category, count(*) from book_club group by category

OFA-text2sql 模型效果

Model	Params	Exact Match
T5_base	220M	58.1
T5_3B+PICARD	3B	75.5
OFA_Base	180M	47.9
OFA_Large	470M	61.8

OFA是什么？

OFA(One-For-All)是通用多模态预训练模型，使用简单的序列到序列的学习框架统一模态（跨模态、视觉、语言等模态）和任务（如图片生成、视觉定位、图片描述、图片分类、文本生成等），详见我们发表于ICML 2022的论文：OFA: Unifying Architectures, Tasks, and Modalities Through a Simple Sequence-to-Sequence Learning Framework，以及我们的官方Github仓库https://github.com/OFA-Sys/OFA。

Github ｜ Paper ｜ Blog

OFA模型规模：

Model	Params-en	Params-zh	Backbone	Hidden size	Intermediate size	Num. of heads	Enc layers	Dec layers
OFA_Tiny	33M	-	ResNet50	256	1024	4	4	4
OFA_Medium	93M	-	ResNet101	512	2048	8	4	4
OFA_Base	180M	160M	ResNet101	768	3072	12	6	6
OFA_Large	470M	440M	ResNet152	1024	4096	16	12	12
OFA_Huge	930M	-	ResNet152	1280	5120	16	24	12

模型训练流程

训练数据介绍

本模型训练数据集是spider中的Text-to-SQL数据集。

训练流程

finetune能力请参考OFA Tutorial 1.4节。

模型局限性以及可能的偏差

训练数据集自身有局限，有可能产生一些偏差，请用户自行评测后决定如何使用。

相关论文以及引用信息

如果你觉得OFA好用，喜欢我们的工作，欢迎引用：

@article{wang2022ofa,
  author    = {Peng Wang and
               An Yang and
               Rui Men and
               Junyang Lin and
               Shuai Bai and
               Zhikang Li and
               Jianxin Ma and
               Chang Zhou and
               Jingren Zhou and
               Hongxia Yang},
  title     = {OFA: Unifying Architectures, Tasks, and Modalities Through a Simple Sequence-to-Sequence
               Learning Framework},
  journal   = {CoRR},
  volume    = {abs/2202.03052},
  year      = {2022}
}