Investigating Tradeoffs in Real-World Video Super-Resolution

模型描述

RealBasicVSR提出了一个预清理模块，其可以在传播之前抑制退化。在许多具有挑战性的情况下，将图像单次输入到预清理模块并不能有效地消除过度退化。一种简单而有效的方法是将图像多次输入预清理，以进一步抑制退化。通过动态优化方案，清理阶段会自动停止以避免过度平滑。这项工作采用了BasicVSR作为超分网络，因为它通过长期传播在非盲超分辨率中具有良好的性能，并且结构简单。

期望模型使用方式以及适用范围

本模型使用于一般视频超分辨率。

如何使用

在ModelScope框架上，提供输入视频，即可通过简单的Pipeline调用来使用。

代码范例

from modelscope.outputs import OutputKeys
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks

video = 'https://modelscope.oss-cn-beijing.aliyuncs.com/test/videos/000.mp4'
video_super_resolution_pipeline = pipeline(
    Tasks.video_super_resolution,
    'damo/cv_realbasicvsr_video-super-resolution_videolq')
result = video_super_resolution_pipeline(video)[OutputKeys.OUTPUT_VIDEO]

模型局限性以及可能的偏差

模型对于大部分真实场景效果良好，对于小部分降质十分严重的情况可能表现不佳。

测试数据介绍

VideoLQ

文件类型：.PNG

文件数量：50个视频片段

内容：每个视频片段包含100帧视频帧（除030、031、032、033外）

数据评估及结果

name	Dataset	NIQE
RealBasicVSR	VideoLQ	2.5693

import os
import tempfile

from modelscope.hub.snapshot_download import snapshot_download
from modelscope.msdatasets import MsDataset
from modelscope.msdatasets.task_datasets.video_super_resolution import \
    VideoSuperResolutionDataset
from modelscope.trainers import build_trainer
from modelscope.utils.constant import DownloadMode
from collections import Counter
import numpy as np

tmp_dir = tempfile.TemporaryDirectory().name
if not os.path.exists(tmp_dir):
    os.makedirs(tmp_dir)
model_id = 'damo/cv_realbasicvsr_video-super-resolution_videolq'
cache_path = snapshot_download(model_id)
dataset_test = MsDataset.load(
    'VideoLQ',
    namespace='huizheng',
    subset_name='default',
    split='test',
    download_mode=DownloadMode.REUSE_DATASET_IF_EXISTS)._hf_ds

clip_num_nframes = Counter(dataset_test['Clip Num'])
indices = np.cumsum([0] + list(clip_num_nframes.values()))
dataset = []
for index in range(len(indices) - 1):
    sub_test_dataset = []
    for frame in range(indices[index], indices[index + 1]):
        sub_test_dataset.append({'LQ Frame:FILE': dataset_test[frame]['LQ Frame:FILE'], 'Clip Num': 0})
    dataset.append(sub_test_dataset)

test_dataset = VideoSuperResolutionDataset(dataset[0])  # the first clip, 100 frames
kwargs = dict(
    model=model_id,
    train_dataset=None,
    eval_dataset=test_dataset,
    work_dir=tmp_dir)
trainer = build_trainer(default_args=kwargs)
metric_values = trainer.evaluate()
print(metric_values)