CSY's blog

Contrast-Phys

发表于 2022-12-05 分类于 paper ， cv ， hr Valine：
本文字数： 4.4k 阅读时长 ≈ 4 分钟

Contrast-Phys: Unsupervised Video-based Remote Physiological Measurement via Spatiotemporal Contrast

【心率监测】【ECCV2022】【paper】【code】

摘要

本文实现了一种新的对比学习框架，提出了一种新的数据增强策略，这个策略基于对同一人脸不同位置的 ppg 信号 PSD 基本一致的观察，以及对不同人脸的 ppg 信号 PSD 基本不一致的观察，并且使用一个 3DCNN 块对 ppg 信号进行提取，得到 channel-wise 的 ppg 信号，这种方式极大地扩展了正负样本的数量，时间上这篇文章早于 video-base SSL，但是效果实际上不相上下。

概览

阅读全文 »

Video-based_rppg_SSL

发表于 2022-12-02 更新于 2022-12-03 分类于 paper ， cv ， hr Valine：
本文字数： 7.2k 阅读时长 ≈ 7 分钟

Video-based Remote Physiological Measurement via Self-supervised Learning

【心率监测】【arxiv2022】【paper】【code】

摘要

本文是基于对比学习进行 rppg 信号估计的又一 SOTA，在 UBFC、PURE、DEAP、MMVS 上展示了最好的性能。鉴于目前的 rppg 对比学习网络结构基本都基于孪生网络，在数据增强和代理任务上进行创新，本文主要采样的方法有：正样本：来自空间增强的 anchor $p_1$ 和 anchor 在同一个 video 的邻居 $p_2$，负样本：来自 LFA 模块 $n$，该模块可以在视觉不变的基础上进行频率重采样，代理任务：对比 $p_1$ 和 $p_2$ 拉进距离，对比 $p_1$ 和 $n$ 拉远距离，backbone：基于混合专家模型的 ResNet3D。并且对于多样的样本提出了多样的损失。

整体来说起作用的我认为最可能是 LFA，该模块可以生成大量的负样本，或许负样本的数量是 CL 的关键。

概览

阅读全文 »

Siamese-rPPG

发表于 2022-12-01 更新于 2022-12-02 分类于 paper ， cv ， hr Valine：
本文字数： 1.7k 阅读时长 ≈ 2 分钟

Siamese-rPPG network: remote photoplethysmography signal estimation from face videos

【心率监测】【SAC2020】【paper】【code未开源】

摘要

本文提出了一种基于孪生网络的 rppg 估计网络，这种网络结构以一种十分简单的思路对人脸进行分割，通过简单的 3DCNN 取得了很好的结果，这篇文章当初觉得太简单没有看，但看数据居然和 Dual-GAN 差不多。这篇文章整体来说比较容易，但是一些处理能够引发思考：心率估计是否不太需要复杂的非线性计算能力？

概览

阅读全文 »

图像对齐和图像拼接

发表于 2022-11-28 分类于 methods Valine：
本文字数： 6.8k 阅读时长 ≈ 6 分钟

👉👉👉👉👉👉本次实验选取来自论文的数据集 video2 的视频帧，通过 SIFT 特征点检测进行图像对齐，其第一帧的左，右视图如下：

阅读全文 »

DRNet

发表于 2022-10-16 更新于 2022-11-25 分类于 paper ， cv ， hr Valine：
本文字数： 3.8k 阅读时长 ≈ 3 分钟

DRNet: Decomposition and Reconstruction Network for Remote Physiological Measurement

【心率监测】【arxiv】【paper】【code未开源】

摘要

本文提出了一种非端到端的 bvp 信号估计网络，其基本思想来自 CVD 和 DualGan，可以简要概括为：将生理信号和非生理信号进行分离，并且通过互相组合使 rppg 估计器能够对各种噪声都具备鲁棒性。其整个网络基于两个无法证明的假设：1. STMap 的生理信号和非生理信号是线性组合的，2. 。同时本文提出了一种数据增强策略（仅针对 STMap）、一个即插即用的注意力模块（仅针对 STMap）、一种新的损失函数（并不新），在 VIPL、PURE、UBFC 上基本全指标超了 Dual-GAN，是新的 SOTA，暂未开源。

概览

阅读全文 »

Diffusion_Model

发表于 2022-10-16 更新于 2022-11-25 分类于 paper ， cv Valine：
本文字数： 12k 阅读时长 ≈ 11 分钟

Denoising Diffusion Probabilistic Models

【图像生成】【NIPS2020】【paper】【code】

摘要

本文将介绍扩散模型（diffusion model）的开山作 DDPM，着重介绍其数学原理，并给出一个简单的实现。简单来看，DDPM 包含两个过程：1.扩散过程，即将原始图像逐步加入高斯噪声最终变成 $\mathcal N(0,I)$ 的过程，此过程无参数；2.逆扩散过程，即通过训练一个神经网络，将从 $\mathcal N(0,I)$ 中采样的 $\epsilon$ 逐层迭代还原至原始输入的过程，此过程含参数。本质上，DDPM 就是将 VAE 进行了多层的扩展，区别在于：1.扩散过程中无参，2.模型的中间部分与原始输入 shape 保持一致；DDPM 和 VAE 同时都是使用最大似然估计的方式构造损失函数。

概览

阅读全文 »

Privacy-Phys

发表于 2022-10-16 更新于 2022-11-25 分类于 paper ， cv ， hr Valine：
本文字数： 2.1k 阅读时长 ≈ 2 分钟

Privacy-Phys: Facial Video-based Physiological Modification for Privacy Protection

【心率监测】【SPL2022】【paper】【code未开源】

摘要

本文提出了一种基于预训练的 3D-CNN 网络结构用于在保持视觉不变性的基础上修改视频中人脸的 rppg 信号，可以用于 IDEA 中的正样本生成模块之中。另外，本文讲故事的方式是：rppg 信号中具备人的生理和疾病等隐私信息，这些信息不希望被他人窃取，因此使用 PrivacyPhys 方法可以快速地修改 rppg 信号以干扰窃取，可以用于视频软件之中。

一个有意思的点在于：本文所谓的预训练的网络其实完全不参与微调，梯度也不用来更新网络参数，而是直接更新结果。

概览

阅读全文 »

CVD

发表于 2022-10-15 更新于 2022-11-25 分类于 paper ， cv ， hr Valine：
本文字数： 2.8k 阅读时长 ≈ 3 分钟

Video-Based Remote Physiological Measurement via Cross-Verified Feature Disentangling

【心率检测】【ECCV2020】【paper】【code】

摘要

本文提出了一种基于自编码器的架构的特征学习器，并且将输入的 video 表示为多尺度 STmap，通过多编码器-单解码器的方式生成编码不同特征的编码器，同时通过交叉验证解离（CVD）的策略训练。同时对解码出的特征估计时使用了可以输出多种生理信号的估计器，是结合了自编码器、解离表征、rppg 估计网络的 SOTA。

概览

阅读全文 »

Meta-rPPG

发表于 2022-10-15 更新于 2022-11-25 分类于 paper ， cv ， hr Valine：
本文字数： 3.6k 阅读时长 ≈ 3 分钟

Meta-rPPG: Remote Heart Rate Estimation Using a Transductive Meta-Learner

【心率监测】【ECCV2020】【paper】【code】

摘要

本文采用了元学习的方式探索了在跨数据集上的适应性问题，通过将每个 clip 的预测看做单个任务的方式构造多任务，并将每个 clip 区分为互不相交的 Q, S 进行 few-shot 学习。得到的网络结构理论上可以在预训练的基础上支持 zero-shot 学习，通过梯度合成生成器快速学习无标签数据。缝合元学习的基础上在 MAHNOB-HCI 取得了 SOTA，在 UBFC 上效果普通。