0%

Encoding in Style: a StyleGAN Encoder for Image-to-Image Translation

【图像生成】【CVPR2021】【paper】【code

摘要

ds;本文就是大名鼎鼎的 pSp,相比于 image2styleGAN 的逆映射后优化的方式,本文直接提出了一种以 ResNet 为 backbone,以 FPN 为架构的编码器,可以将任意图像通过训练好的编码器映射到隐空间。实现了人脸转向、特征融合、使用素描或分割图生成不同的人脸、人脸补全、人脸条件生成、人脸超分等任务。

概览

image-20230116090923513

阅读全文 »

Layered Neural Atlases for Consistent Video Editing

【视频编辑】【SIGA2021】【paper】【code

摘要

ds;本文使用基于 NeRF 的进行了视频编辑的工作。得到的模型将输入视频分为前景和背景并分别映射到两个图层。允许对背景图层或者前景图层的编辑并且一致性地传播到整个视频之中从而达到编辑视频的效果。本文除了 PSNR 之外没有其他数据指标,多为定性研究与消融实验。

概览

image-20221212163203372

阅读全文 »

A Style-Based Generator Architecture for Generative Adversarial Networks

【图像生成】【CVPR2019】【paper】【code

摘要

  本文基于 PGGAN 提出了一种按照尺度(非属性)解耦隐空间特征的 styleGAN 网络,这种尺度在 fine detail 上对于视觉的表现即为风格,因此除了生成和 PGGAN 一样的高分辨率图像之外,styleGAN 还可以对多个图像的不同尺度特征进行拼接,从而进行风格迁移。局限于这些特征都是 latent code,因此不能融合任意图像,但仍然挖下了解耦隐空间的坑。

概览

image-20230105204654476

阅读全文 »

Progressive Growing of GANs for Improved Quality, Stability, and Variation

【图像生成】【ICLR2018】【paper】【code

摘要

  本文使用逐步调大分辨率的生成方式成功生成了在当时还不错的高分辨率图像。具体来说是进行分阶段的训练,阶段按照分辨率进行分界。并且每个新的阶段要加入新的卷积层,为了防止没有经过训练的层回传梯度时影响训练好的层,本文还使用了一种平滑的融合策略。

概览

image-20230105204451398

阅读全文 »

PulseGAN: Learning to generate realistic pulse waveforms in remote photoplethysmography

【心率检测】【BHI2021】【paper】【code非官方

摘要

  本文引入了一种使用 GAN 训练的网络,网络并不直接从原始视频中获得 rppg 信号,而是使用其他方法已经估计出的粗糙 rppg 信号进行细化,BHI 是生物信息期刊,这篇文章相对其他论文具备更多的专业性指标,但是实验做得很少,没有在其他数据集内验证有效性。

概览

image-20221207193415813

阅读全文 »

PulseEdit: Editing Physiological Signal in Facial Videos for Privacy Protection

【心率检测】【TIFS2022】【paper】【code未开源

摘要

  本文提出了一种在不改变外观特征的情况下进行心率信号改变的方法,具体来说,使用一系列的图像处理步骤得到逐帧的像素更改区域以及更改量,直接更改 RGB 区域从而混淆估计器。区别于 privacy-phys,本文梯度更新的是扰动信号 $\delta$,而 privacy-phys 梯度直接更新结果,一致的是两篇文章都没有参数。

概览

image-20221207155000703

阅读全文 »

Learning Motion-Robust Remote Photoplethysmography through Arbitrary Resolution Videos

【心率监测】【AAAI2023】【paper】【code

摘要

  本文针对人脸在运动过程中产生的远近问题提出了两个即插即用的模块,将远近移动的问题转化为了多分辨率下的 rppg 信号估计问题,同时使用光流解决了人脸在转动的过程中可能导致的关键点缺失问题,在选择的 baseline(physnet)上取得了一定的进步。主要包括:1. 编码了分辨率信息从而对分辨率鲁棒的 PFE 模块,2. 使用光流恢复人脸运动从而对运动鲁棒的 TFA 模块。效果确实在对比的情况下有所进步,但是确实也缺乏一个 SOTA 的结果。

概览

image-20221206145520889

阅读全文 »

Contrast-Phys: Unsupervised Video-based Remote Physiological Measurement via Spatiotemporal Contrast

【心率监测】【ECCV2022】【paper】【code

摘要

  本文实现了一种新的对比学习框架,提出了一种新的数据增强策略,这个策略基于对同一人脸不同位置的 ppg 信号 PSD 基本一致的观察,以及对不同人脸的 ppg 信号 PSD 基本不一致的观察,并且使用一个 3DCNN 块对 ppg 信号进行提取,得到 channel-wise 的 ppg 信号,这种方式极大地扩展了正负样本的数量,时间上这篇文章早于 video-base SSL,但是效果实际上不相上下。

概览

image-20221205100842471

阅读全文 »

Video-based Remote Physiological Measurement via Self-supervised Learning

【心率监测】【arxiv2022】【paper】【code

摘要

  本文是基于对比学习进行 rppg 信号估计的又一 SOTA,在 UBFC、PURE、DEAP、MMVS 上展示了最好的性能。鉴于目前的 rppg 对比学习网络结构基本都基于孪生网络,在数据增强和代理任务上进行创新,本文主要采样的方法有:正样本:来自空间增强的 anchor $p_1$ 和 anchor 在同一个 video 的邻居 $p_2$,负样本:来自 LFA 模块 $n$,该模块可以在视觉不变的基础上进行频率重采样,代理任务:对比 $p_1$ 和 $p_2$ 拉进距离,对比 $p_1$ 和 $n$ 拉远距离,backbone:基于混合专家模型的 ResNet3D。并且对于多样的样本提出了多样的损失。

  整体来说起作用的我认为最可能是 LFA,该模块可以生成大量的负样本,或许负样本的数量是 CL 的关键。

概览

image-20221202123712050

阅读全文 »

Siamese-rPPG network: remote photoplethysmography signal estimation from face videos

【心率监测】【SAC2020】【paper】【code未开源

摘要

  本文提出了一种基于孪生网络的 rppg 估计网络,这种网络结构以一种十分简单的思路对人脸进行分割,通过简单的 3DCNN 取得了很好的结果,这篇文章当初觉得太简单没有看,但看数据居然和 Dual-GAN 差不多。这篇文章整体来说比较容易,但是一些处理能够引发思考:心率估计是否不太需要复杂的非线性计算能力?

概览

image-20221201152359197

阅读全文 »