- Today
- Total
- Graph
- array
- μμμ λ ¬
- λ°±μλ
- λ°μ΄ν°λ² μ΄μ€
- λ¬Έλ²
- PS
- λ°±μ€
- λ€μ΅μ€νΈλΌ
- 벨λ§ν¬λ
- BFS
- OOP
- spring
- μλ°
- CS
- database
- μλ£κ΅¬μ‘°
- 그리λ
- java
- leetcode
- μ‘Έμ μν
- ꡬν
- μΈν΄
- pytorch
- μλ°μμ μ
- MST
- dp
- tree
- νλ‘κ·Έλλ¨Έμ€
- Algorithm
Partially Committed
[Review] Zero-Reference Deep Curve Estimation for Low-Light Image Enhancement (CVPR2020) λ³Έλ¬Έ
[Review] Zero-Reference Deep Curve Estimation for Low-Light Image Enhancement (CVPR2020)
WonderJay 2023. 2. 4. 14:13
Zero-Reference Deep Curve Estimation for Low Light Image Enhancement (CVPR 2020)
* Low - light Enhancement
0. Abstract
μ λ Όλ¬Έμ Zero-Reference Deep Curve Estimation(Zero-DCE) λ°©λ²μ μ μνλ€. ν΄λΉ λ°©λ²μ light - enhancement λ₯Ό deep network λ₯Ό μ΄μ©ν image-specific curve estimation dask λ‘ formulate νλ€. dynamic range λ‘ μ£Όμ΄μ§ image λ₯Ό μ‘°μ νκΈ° μν΄ pixel-wise λ° high-order fcurve λ₯Ό μΆμ νλ€. curve estimation μ pixel κ° λ²μ, monotonicity, differentiability λ₯Ό κ³ λ €νμ¬ μ€κ³λμλ€. Zero-DCE λ reference image μ λν΄ relaxed assumption μ ν μ μλ€λ μ μμ μ’λ€. train μ paired or unpaired data κ° νμνμ§ μλ€λ μλ―Έμ΄λ€. μ΄λ₯Ό κ°λ₯νκ² νλ κ²μ non-reference loss function μ μ£ΌμκΉκ² μ€κ³νκΈ° λλ¬Έμ΄λ€. λ³Έ λ Όλ¬Έμμ μ μνλ λ°©λ²μ μ§κ΄μ μ΄κ³ κ°λ¨ν λΉμ ν curve λ‘ λ¬μ±ν μ μλ€. λ¨μνμ§λ§ μΌλ°νλ μ±λ₯μ 보μ¬μ£Όλ©°, λ€μν 쑰건μμ μ μλνλ€.
1. Introduction
νκ²½ λ° κΈ°μ μ μ μ½μ λ°λΌμ μ‘°λͺ μ‘°κ±΄μ΄ μ΅μ νλμ§ μμμ μ μ‘°λ μ΄λ―Έμ§κ° μ»μ΄μ§λ κ²½μ°κ° λ§κ³ μ΄λ 물체/μΌκ΅΄ μΈμ κ³Ό κ°μ task μμ μλͺ»λ λ©μΈμ§ μ λ¬λ‘ μ΄μ΄μ§λ€. λ³Έ μ°κ΅¬μμλ deep learning κΈ°λ°μ Zero-Reference Deep Curve Estimation(Zero DCE) μ μ΄μ©νμ¬ low-light image enhancement task λ₯Ό ν΄κ²°νλ€. κ· μΌνμ§ μκ³ μ μ‘°λ 쑰건μ λνμ¬ λμ²κ° κ°λ₯νλ€. μ΄λ₯Ό μν΄ image to image mapping μ΄ μλ image-specific curve-estimation problem μΌλ‘ μ¬κ΅¬μ±νμ¬, μ μ‘°λ μμμ input μΌλ‘ νμ¬ high-order curve λ₯Ό output μΌλ‘ μμ±νλ€. ν΄λΉ curve λ enhanced image λ₯Ό μ»κΈ° μν input μ dynamic range μ λν pixel-wise adjustment μ μ¬μ©λλ€. curve estimation μ μΈμ ν½μ μ contrast λ₯Ό μ μ§ν μ μλλ‘ μ€κ³λμλ€.
μ€μν κ²μ ν΄λΉ λ°©λ²μ΄ λ―ΈλΆ κ°λ₯νκΈ° λλ¬Έμ deep convolutional neural network λ₯Ό μ΄μ©νμ¬ curve μ parameter μ μ‘°μ ν μ μλ€λ κ²μ΄λ€. λ³Έ λ Όλ¬Έμμ μ μνλ network λ κ°λ²Όμ°λ©° λ³΄λ€ robust νκ³ accurate ν dynamic range adjustment λ₯Ό μν΄ λ°λ³΅μ μΌλ‘ μ μ©λλ€.
ν΄λΉ λ°©λ²μ μ₯μ μ zero-reference λΌλ κ²μ΄λ€. CNN μ΄λ GAN based method μλ λ¬λ¦¬ paired or unpainred data κ° training λ¨κ³μμ νμνμ§ μλ€. μ΄λ₯Ό μν΄ 4 κ°μ§ μ’ λ₯μ non-reference loss function μ μ¬μ©νλ€. (spatial consistency loss, exposure control loss, color constancy loss, illumination smoothness loss) Zero-DCE μμλ CNN, GAN based method μ 겨룰 μ μλ μ±λ₯μ 보μ νλ€.(paired or unpaired data κ° μλλ°λ!) Zero-DCE λ image μ κ³ μ μμκ³Ό λλ°ν μ μ μ§νλ©° image λ₯Ό λ°κ²νλ€. CNN based μ GAN based λ°©λ²μ under - enhancement, over-enhancement λ₯Ό μΌκΈ°νλ€.
λ³Έ μ°κ΅¬μ Contribution μ μμ½νλ©΄ μλμ κ°λ€.
1. κ³Όμ ν©μ νΌνκΈ° μν΄ paired λ° unpaired train data μ λ 립μ μΈ low-light wnhancement network λ₯Ό μ μνλ€. λ€μν μ‘°λͺ 쑰건μ λν΄μ μΌλ°νλ μ±λ₯μ 보μΈλ€.
2. λ°λ³΅μ μΌλ‘ μ μ©νμ¬ pixel-wise μ higher-order curve λ₯Ό μ€κ³νλ€. μ΄λ¬ν image λ³ curve λ λμ dynamic range λ΄μμ mapping μ ν¨κ³Όμ μΌλ‘ μνν μ μλ€. (Dynamic range λ ννν μ μλ κ°μ₯ μ΄λμ΄ μ λμ κ°μ₯ λ°μ μ λμ μ°¨μ΄λ₯Ό μλ―Ένλ€. Dynamic range κ° λμΌλ©΄ λ°μ λΆλΆκ³Ό μ΄λμ΄ λΆλΆμ νννλ λ²μκ° λμ΄μ λ λ§μ μ 보λ₯Ό μ λ¬ν μ μκ² λλ κ²μ΄λ€.)
3. image enhancement μ±λ₯μ κ°μ μ μΌλ‘ νκ°νλ task-specific non-reference loss function μ ν΅ν΄ reference image κ° μμ λ network λ₯Ό training ν μ μλ κ°λ₯μ±μ 보μ¬μ€λ€.
Zero-DCE λ°©λ²μΌλ‘ μ μ μ°μ°μΌλ‘λ μΌκ΅΄ μΈμκ³Ό κ°μ λμ μμ€μ μκ°μ μΈ μμ μ κ°μ ν μ μλ€. GPU μμ 640x480x3 image μ κ²½μ° 500 FPS νλ ¨μ 30 λΆμ΄ μμλλ€.
2. Related Work
[Conventional Methods] HE-based methods(Histogram Equalization) λ μ΄λ―Έμ§μ dynamic range λ₯Ό νμ₯νμ¬ light enhancement λ₯Ό μννλ€. μΌλ°μ μΌλ‘ image λ₯Ό reflectance μ illumination μΌλ‘ λΆν΄νλ Retinex theory λ₯Ό μ¬μ©νλ€. reflectance λ μΌλ°μ μΌλ‘ λͺ¨λ μ‘°λͺ 쑰건μμ consistenct ν κ²μΌλ‘ κ°μ νλ―λ‘ light enhancement λ illumination estimation problem μΌλ‘ λ°λΌλ³Ό μ μλ€. Illumination map μ estimation νλ κ²μ optimization problem μ ν΄κ²°νλ κ²μ΄λ€. histogram distribution μ λ³νλ₯Ό κ°μ Έμ€κ±°λ λΆμμ°μ€λ¬μ΄ 물리 λͺ¨λΈμ μμ‘΄νλ μ ν΅μ μΈ λ°©λ²κ³Όλ λ¬λ¦¬ Zero-DCE method λ image-specific curve mapping μ ν΅ν΄μ enhanced result λ₯Ό μμ±νλ€. μ΄λ¬ν μ λ΅μ λΉνμ€μ μΈ artifcats λ₯Ό μμ±νμ§ μλλ€.
Yuan κ³Ό Sun μ automatic exposure correction method λ₯Ό μ μνμλ€. ν΄λΉ λ°©λ²μ μ£Όμ΄μ§ μ΄λ―Έμ§μ λν S-shape curveκ° global optimization algorithm μ μν΄ estimation λκ³ κ°κ°μ segemnted region μ curve mapping μ μν΄ optimal zone μΌλ‘ push λλ€. μ΄λ¬ν Yuan and Sun λ°©λ²κ³Όλ λ¬λ¦¬ Zero-DCE λ μμν λ°μ΄ν° κΈ°λ° λ°©λ²μΌλ‘ non-reference loss function μ μ€κ³ν¨μΌλ‘μ¨ multiple light enhancement factors λ€μ κ³ λ €νκΈ° λλ¬Έμ λ³΄λ€ robust νκ³ image μ dynamic range κ° λ λμΌλ©° μ°μ°λμ΄ μ λ€.
[Data-Driven Methods] Data-Driven method λ CNN-based μ GAN-based method μΌλ‘ λΆλ₯ν μ μλ€. λλΆλΆμ CNN-based solution μ paired data μ μμ‘΄νλ supervised trainning μ μ§ννλ―λ‘ resource-intensive νλ€λ νΉμ§μ΄ μλ€. Paired data λ automatic light degradation, changing the settings of cameras during data capturing, synthesizing data via image retouching λ±μ ν΅ν΄ μμ§λλ€. μλ₯Ό λ€μ΄ LL-Net μ Gamma correction μ simulation νλλ‘ νλ ¨λ λ€νΈμν¬μΌλ‘ LOL dataset μ LL-Net μΌλ‘λΆν° μ»μ΄μ§ paired low/normal light image data sets μ΄λ€.
μ΅κ·Όμ Wang et al μ illumuination map μ μΆμ μ μν underexposed photo enhancement network μ μ μνμλ€. μ΄ network λ paired data λ‘λΆν° νλ ¨λμλ€. μ΄λ¬ν Paired data λ₯Ό κΈ°λ°μΌλ‘ νλ light enhancement solution μ μΆ©λΆν paired data μμ§μ cost κ° λ§μ΄ λ€λ©°, λν paired data μμ± μ λ€μ λΉνμ€μ μ΄κ³ μΈμμ μΈ λ°μ΄ν°κ° ν¬ν¨λ μ λ°μ μλ€λ μ μΌλ‘λΆν° λΉμ€μ©μ μΈ λ°©λ²μ΄λΌκ³ μΆλ‘ ν μ μλ€. μ΄λ¬ν μ μ½μ¬νμ generalization μ±λ₯μ΄ λ¨μ΄μ§κ²λ λ§λ λ€. μ€μ μ΄λ―Έμ§κ° μ£Όμ΄μ§λ©΄ λ€μν κ²°μ μ΄ λ°μν μ λ°μ μλ€.
Unsupervised GAN-based methods λ paired data λ₯Ό trainning ν΄μΌ νλ€λ μ μ½μ¬νμ μ κ±°νλ€. EnlightenGAN μ΄ λνμ μΈ GAN-based pioneer method μΌλ‘ low-light images λ₯Ό unpaired low/normal light data λ‘λΆν° νμ΅νλ€. EnlightenGAN network λ μ κ΅νκ² μ€κ³λ discriminator μ loss function μΌλ‘ λΆν° νλ ¨λλ°, unsupervised GAN-based solution νΉμ± μ unpaired training data λ₯Ό μ μ€νκ² μ νν΄μΌ μ’μ μ±λ₯μ κ°μ Έμ¬ μ μλ€.
λ³Έ λ Όλ¬Έμμ μ μνλ Zero-DCE λ Data-Driven Method λ³΄λ€ μΈκ°μ§ μΈ‘λ©΄μμ μ°μνλ€.
1. zero reference νΉμ±μ μν΄ paired and unpaired data κ° νμνμ§ μλ€.
2. μ κ΅νκ² μ κ³λ non-reference loss function μ ν΅ν΄μ νλ ¨μ΄ μ§νλλ―λ‘ output image μ quality λ₯Ό λͺ λ°±νκ² νκ°ν μ μκ³ , μ΄ κ²°κ³Όλ network learning μμ λ°λ³΅λλ€.
3. Zero-DCE λ°©λ²μ cost-effective νλ€.
μ΄λ¬ν μΈκ°μ§ μΈ‘λ©΄μ μ₯μ μΌλ‘ λΆν° lightweight network structure μ effective non-reference loss function μ ꡬμ±ν μ μλ€.
3. Methodlogy
DCE-Net(Deep Curve Estimation Network) λ μ£Όμ΄μ§ μ λ ₯ μ΄λ―Έμ§λ‘λΆν° κ°μ₯ μ ν©ν Light-Enhancement curve(LE-curve) set μ estimation νκΈ° μν΄ κ³ μλ κ²μ΄λ€. enhanced result λ₯Ό μ»κΈ° μν΄ curve λ₯Ό λ°λ³΅μ μΌλ‘ μ μ©νμ¬ input rgb channel μ λͺ¨λ pixel λ€μ mapping νλ€.
3.1. Light-Enhancement Curve (LE-curve)
Photo editing software μ curve adjustment λ°©μμμ μκ°μ μ»μ΄, low-light image λ₯Ό automatically νκ² enhanced version μΌλ‘ mapping νλ curve λ₯Ό design νλ €κ³ νμλλ°, self-adaptive curve parameters μ input image μ μν΄μλ§ κ²°μ λλλ‘ νλ€. curve λ μλ 3 κ°μ§ μ¬νμ λ§μ‘±ν΄μΌ νλ€.
1. enhanced image μ κ°κ°μ pixel κ°μ normalized range μΈ [0, 1] μ¬μ΄μλ§ μ‘΄μ¬ν΄μΌ νλ€. κ·ΈλμΌλ§ overflow truncation μ μν μ 보 μ μ€μ λ°©μ§ν μ μλ€.
2. curve λ monotonous λ₯Ό μ μ§ν΄μΌλ§ νλ€. κ·ΈλμΌλ§ neighboring pixel κ°μ μ°¨μ΄μΈ contrast λ₯Ό 보쑴ν μ μλ€.
3. curve μ ννλ κ°λ₯ν λ¨μν΄μΌ νλ©° λ―ΈλΆκ°λ₯ ν΄μΌ νλ€.(backpropagation)
μ λͺ©νμ λ¬μ±μ μν΄ μλμ κ°μ΄ quadratic curve λ₯Ό design νμλ€.
κ°κ°μ pixel μ [0, 1] λ‘ normalization λλ©°, λͺ¨λ μ°μ°μ pixel-wise λ‘ μνλλ€. LE-curve κ° illuminiation μ±λμ μ μ©νλ κ² λμ μ RGB channel μ λνμ¬ λΆλ¦¬νμ¬ μ μ©νλ€. μ΄λ μμμ λ³΄λ€ μ 보쑴νμ¬ over-saturation μ risk(μ±λκ° κ³Όν΄μ§) μ μ€μΈλ€. a κ°μ μν΄ λ³νλ LE-curve μ ννλ μλ κ·Έλ¦Όμ (b) μ κ°λ€. LE-curve λ input image μ dynamic range λ₯Ό increase νκ±°λ decrease ν μ μλ€. μ΄λ low-light enhancing λΏλ§μ΄ μλλΌ over-exposure artifact λ₯Ό μ κ±°νλ ν¨κ³Όλ₯Ό κ°μ Έμ€κΈ°λ νλ€.
LE-curve λ₯Ό λ°λ³΅μ μΌλ‘ μ μ©ν μ μλ€λ©΄ λμ± low-light ν condition μλ μ μ©μ΄ κ°λ₯νλ€.
μ΄μ κ°μ higher-order curve λ₯Ό νμ©νλ©΄ λ wide ν dynamic range μμ image adjustment κ° κ°λ₯νλ€. μ μν μ μ a κ°μ μ‘°μ νλ κ²μ global adjustment μ΄λ€. μ΄λ local region μμ over-/under- enhance λ₯Ό μΌκΈ°ν μ μλ€. μ΄λ₯Ό νΌνκΈ° μν΄ a κ°μ pixel-wise parameter λ‘ μ€μ ν νμκ° μλ€. κ°κ°μ ν½μ μ κ°κ°μ a κ°μ κ°μ§κ³ μ΄μ mapping λλ curve λ₯Ό κ°μ§κ² λλ€.
local region λ΄μ pixel λ€μ κ°μ intensity λ° κ°μ adjustment curve λ₯Ό κ°μ§λ€κ³ κ°μ νμ¬ enhanced image λ monotonous λ₯Ό μ μ§νκ² λλ€.
μ κ·Έλ¦Όμ 보면 input image μ r,g,b channel κ°κ°μ λνμ¬ μμΈ‘λ curve parameter map μ 보μ¬μ£Όλλ°, μ μ¬ν tendency λ₯Ό κ°μ§μ§λ§ value λ κ°κ° λ€λ₯Έ κ²μ νμΈν μ μλ€. μ΄μ κ°μ΄ pixel-wise λ‘ curve mapping μ ν΅ν΄ enhanced image λ₯Ό μ»μ μ μκ² λλ€.
3.2. DCE-Net (Deep Curve Estimation Network)
input image μ best-fitting curve parameter maps κ°μ mapping μ νμ΅νκΈ° μν΄ Deep Curve Estimation Network(DCE-Net) μ μ μνλ€. DCE-Net μ Input μ low-light image μ΄κ³ output μ pixel λ³λ‘ curve parameter maps set μ΄λ€. λμΉμ μΌλ‘ μ°κ²°λ (Symmetrical concatenation) 7 κ°μ Convolutional layer λ‘ κ΅¬μ±λ CNN μ μ¬μ©νλ€. κ°κ°μ Layer μ 3x3 ν¬κΈ°μ kernel μ stride = 1 λ‘ νμ¬ 32 κ°λ₯Ό ν΅κ³Όμν¨ λ€μ ReLU activation function μ ν΅κ³Όμν¨λ€. μ΄λ down-sampling κ³Ό batch normalization μ μ¬μ©νμ§ μμμΌλ‘μ¨ neighboring pixel μ relation μ΄ κΉ¨μ§μ§ μλλ‘ ν κ²μ μ μνλ€. λ§μ§λ§ convolutional layer μ Tanh activation function μ μ¬μ©νλ€. 8 λ²μ iteration μ΄ λλλ©΄ 24 κ°μ parameters map μ μ»μ μ μλ€. κ°κ°μ λ°λ³΅μμ 3 κ°μ μ±λλ§λ€ νλμ parameter map μ΄ μμ±λκΈ° λλ¬Έμ΄λ€. DCE-Net μ trainable parameters μ 79,416 κ°μΌλ‘ 5.21G Flops μΌλ‘ μ°μ°μ΄ κ°λ₯ν κ²½λ λͺ¨λΈμ΄λ€. input size λ 256x256x3 μ΄λ©°, mobile κ³Ό κ°μ΄ μ νλ resource device μμλ μ¬μ©μ΄ κ°λ₯νλ€.
3.3. Non-Reference Loss Functions
Zero-reference λ‘ DCE-Net μ νμ΅νκΈ° μν΄μλ enhanced image λ₯Ό νκ°νλ non-reference loss function μ μ μν΄μΌ νλ©° μ΄λ₯Ό μν΄ μλμ 4 κ°μ§ loss function μ μ μνμλ€.
1. Spatial Consistency Loss (L_spa)
: input image μ enhanced image κ° difference of neighboring regions μ 보쑴νμ¬ enhanced image κ° spatial coherence κ° μ μ§λλλ‘ νλ€.
λ³Έ λ Όλ¬Έμμλ local region μ size λ₯Ό 4 x 4 λ‘ μ§μ νμμ§λ§, λ€λ₯Έ μ¬μ΄μ¦λ₯Ό μ¬μ©νμ¬λ L_spa λ μμ μ μΈ κ²½ν₯μ΄ λ³΄μΈλ€κ³ νλ€.
2. Exposure Control Loss (L_exp)
: under-/over-exposed region μ μ ννκΈ° μν΄ exposure lever μ L_exp λ₯Ό μ΄μ©νμ¬ control νλ€. Exposure control loss λ average intensity value of local region κ³Ό averawge intensity value of well-exposedness level E κ°μ distance λ₯Ό μΈ‘μ νλ€. RGB color space μμ gray level μ E λ‘ μ€μ νμκ³ , λ³Έ λ Όλ¬Έμμ E λ 0.6 μΌλ‘ μ νμλ€.
3. Color Constancy Loss (L_col)
: RGB channel μ νκ· μ΄ Gray κ° λλ€λ Gray - World color constancy hypothesis λ₯Ό λ°λΌ, enhanced image μμ λ°μν μ μλ color deviation μ correction νλ color constancy loss λ₯Ό design νλ€. ν΄λΉ loss function μ μλ‘ adjust λ 3 κ°μ§ μ±λ κ° κ΄κ³λ₯Ό μ‘°μ ν΄μ€λ€.
4. Illumination Smoothness Loss (L_tvA)
: neighboring pixel κ° monotonicity λ₯Ό λ°©μ§νκΈ° μν΄ illumination smoothness loss λ₯Ό κ°κ°μ curve parameter map A μ μΆκ°νλ€.
4. Experiments
Wide dynamic range μ λν adjustment μ΄ λ°μνλλ‘ low-light image λΏλ§μ΄ μλλΌ over-exposed image λν train dataset μΌλ‘ ν¬ν¨νμλ€. EnlightenGAN μ train μλ νμ© λ SICE(Single Image Contrast enhancement) dataset μ Part 1(360 multi-exposure sequences) λ₯Ό train set μ ν¬ν¨μν¨λ€. κ·Έλ¦¬κ³ 3,022 κ°μ μλ‘ λ€λ₯Έ exposure level μ κ°μ§ image λ₯Ό random split νμ¬ 2,422 κ°λ₯Ό train set μ μ¬μ©νκ³ λλ¨Έμ§λ₯Ό validation set μΌλ‘ μ¬μ©νλ€. μ΄λ train input image λ 512x512 λ‘ fix νλ€.
NVIDIA 2080Ti μμ Pytorch λ₯Ό μ΄μ©νμ¬ κ΅¬ννμκ³ , batch size λ 8 λ‘ μ€μ νλ€. κ°κ°μ layer λ mean=0, std=0.02 μ gaussian function μΌλ‘ initialization νμλ€. optimizer μΌλ‘λ ADAM (λΆκ°μ μΈ parameter μ€μ x)μ μ¬μ©νμκ³ learning rate λ 1e-4 λ‘ κ³ μ νλ€. Total loss μμ W_col κ³Ό W_tvA λ 0.5, 20 μΌλ‘ μ€μ νλ€.
4.1. Ablantion Study
Contribution of Each Loss
κ°κ°μ Loss function μ΄ train μ λ―ΈμΉλ μν₯μ νμ νκΈ° μν΄ Total Loss μμ ꡬμ±μ λ³κ²½νμ¬ μ€νμ μ§ννλ€.
Spatial consistency loss (L_spa) λ₯Ό μ κ±°ν λ€ νλ ¨μ μ§ννλ©΄ lower contrast λ₯Ό κ°μ§κ² λλ€. μ΄λ L_sap κ° μ΄μ μμκ³Όμ μ°¨μ΄λ₯Ό 보쑴νκΈ° μν΄ μ€μν μν μ μννλ€λ κ²μ μμ¬νλ€.
Exposure control loss (L_exp) λ₯Ό μ κ±°ν λ€μ νλ ¨μ μ§ννλ©΄ low-light region μ recovery κ° λ°μνμ§ μλλ€.
Color constancy loss (L_col) μ μ κ±°νλ©΄ μμ λ³νκ° μκΈ°μΉ λͺ»νκ² λ°μνλ€. μ΄λ rgb channel κ° κ΄κ³μ±μ 무μνκ³ curve mapping μ΄ μνλλ λ¬Έμ λ₯Ό μΌκΈ°ν μ μλ€.
Illumination smoothness loss (L_tvA) λ₯Ό μ κ±°νλ©΄ μ΄μ μμκ°μ correlation μ΄ μ΄μ§λ½νμ Έμ artifact κ° λͺ λ°±νκ² λ°μνλ€.
Effect of Parameter Setting
DCE-Net μ depth(conv layer κ°μ), width(layer λΉ fiter κ°μ), number of iteration μ λ°λΌ μ΄λ ν ν¨κ³Όκ° λ°μνλ μ§ μ€νμ μ§ννλ€.
(b) : 3 κ°μ conv layer λ§ μ¬μ©νμ¬λ satisfactory result λ₯Ό μ»μ μ μμλ€.
(e) μ (f) κ° κ°μ₯ μκ°μ μΌλ‘ 보μμ λ μμ°μ€λ¬μ΄λ° μ΄λ‘λΆν° interation νμκ° μ΄λμ λ ν΄ μλ‘ natural exposure κ³Ό proper constrast λ₯Ό μ»μ μ μμμ μ μ μλ€.
(d) μμλ iteration μ 1λ²λ§ μ§ννμλ€. μ΄λ κ² νλ©΄ curve μ μ©μ 1λ²λ§ νκ² λκ³ μ΄λ light-enhancement μ μ±λ₯μ νλ₯Ό μΌκΈ°νλ€λ κ²μ μ μ μλ€.
* μ΄λ¬ν μ€ν κ²°κ³Όλ‘λΆν° 7-32-8 μ optimal ν parameter λ‘ μ ννμλ€.
Impact of Training Data
Zero-DCE Network λ₯Ό μλ‘ λ€λ₯Έ λ°μ΄ν°μ μ μ΄μ©νμ¬ νλ ¨μμΌ, training dataset μ λ°λ₯Έ impact λ₯Ό μ΄ν΄λ³Έλ€.
* Zero-DCE_Low : 900 κ°μ low-light image λ§μ μ¬μ©
* Zero-DCE_LargeL : DARK FACE dataset μμ 9,000 μ₯μ unlabeld low light image λ₯Ό μ¬μ©
* Zero-DCE_LargeLH : SICE dataset μμ Part1, Part2 μμ data augmentation μ μ μ©ν multi-exposure image λ₯Ό μ¬μ©
μ κ²°κ³Όλ₯Ό 보면 over-exposed image κ° ν¬ν¨λμ§ μλ κ²½μ°μλ (c) μ (d) μ²λΌ input image μμ μλλΆν° λ°μλ μμμ over-enhance(face μμ) λλ€. low-light image μ κ°μλ₯Ό λ리λ κ²μ μ΄λ₯Ό ν΄κ²°ν μ μλ μ루μ μ΄ μλμλ€. (e) μ κ°μ΄ multi - exposure(λ ΈμΆ μνκ° λ€μ) image λ₯Ό μ¬μ©νλ©΄ low-light enhancement μ±λ₯μ΄ κ°μ₯ λ°μ΄λλ κ²μ κ΄μ°°ν μ μλ€.
4.2 Benchmark Evaluations
λ³Έ λ Όλ¬Έμμ μ μν Zero-DCE λ₯Ό μ¬λ¬ κ°μ§ state-of-the-art method μ λΉκ΅λ₯Ό μ§ννλ€. 3 κ°μ§ conventional methods μΈ SRIE, LIME, Li et al κ³Ό 2 κ°μ§ CNN - based methods μΈ RetinexNet, Wang et al κ·Έλ¦¬κ³ GAN-based method μΈ EnlightenGAN λͺ¨λΈκ³Όμ λΉκ΅λ₯Ό μννλ€.
test image set μ NPE(Naturalness Preserved Enhancement) 84 images, LIME(Low-light Image Enhancement via illumination Map Estimation) 10 images, MEF(Multi-Exposure Image Fusion) 17 images, DICM 64 images, VV 24 images λ₯Ό μ¬μ©νλ€.
Zero-DCE model μ μ μ ν exposure κ³Ό detail μ λͺ ννκ² μ΄λ¦° λ°λ©΄ SRIE, LIME, Wang et al, EnlightenGAN μ face λ₯Ό λͺ λ°±νκ² recovery νμ§ λͺ»νμλ€. RetinexNet μ over-exposed artifacts λ₯Ό μμ°νλ€.
Zero-DCE model μ dark region μ enhance ν¨κ³Ό λμμ input image μ color μ 보쑴νμμ§λ§ Li et al μ noise λ₯Ό μ¦ννκ³ color deviation μ μμ°νλ©° over - smoothe νλ€.
Peak Signal-to-Noise Ration(PSNR, dB) μ Structural Similarity(SSIM), Mean Absolute Error (MAE) metric μ μ¬μ©νμ¬ μ λμ μΌλ‘ λΉκ΅νμλ€. Zero-DCE λ λͺ¨λ case μμ best value λ₯Ό λ¬μ±νμλ€. (zero-reference μμλ!) Zero-DCE λ λν computationally efficient νλ€.
4.2.3 Face Detection in the Dark
DARK FACE dataset μ μ΄μ©νμ¬ μ μ‘°λ νκ²½μμ Face Detection μ±λ₯μ λΉκ΅νλ€. Face detection μΌλ‘λ Dual Shot Face Detector (DSFD) λ₯Ό μ¬μ©νλ€.
κ·Έ κ²°κ³Ό, RetinexNet κ³Ό Zero-DCE Net μ΄ κ°μ₯ Best ν κ²μ νμΈν μ μλ€. High recall area μμλ Zero-DCE Net μ΄ λ³΄λ€ μ°μνλ€. μ΄μ κ°μ΄ Zero-DCE λ₯Ό μ΄μ©νμ¬ face λ₯Ό lightens up νλ©΄ extremely dark regions μμλ μΆ©λΆν μ νν face detection μνμ΄ κ°λ₯ν¨μ μμ¬νλ€.
5. Conclusion
λ³Έ λ Όλ¬Έμμλ low-light image enhancement λ₯Ό μν deep network μΈ Zero-DCE Net μ μ μνλ€. μ΄λ end-to-end with zero-reference images λ‘ νλ ¨μ΄ κ°λ₯νλ€. low-light image enhancement task λ₯Ό image-specific curve estimation problem μΌλ‘ λ°λΌλ³΄κ³ non-reference loss λ₯Ό μ€κ³νκΈ° λλ¬Έμ reference image κ° νμνμ§ μλ€. Experiments λ€λ‘λΆν° Zero-DCE λ°©λ²μ΄ λ°μ΄λ μ±λ₯μ 보μ΄λ κ²μ΄ μ¦λͺ λμμΌλ©°, ν₯ν μ°κ΅¬μμ noise μ μν₯μ κ³ λ €ν hard case λ₯Ό ν΄κ²°νκΈ° μν μλ―Έμλ μ 보λ₯Ό μ μν μ μλλ‘ μ§μμ μΌλ‘ νꡬν κ²μ΄λ€.
6. Implementation
λ³Έ λ Όλ¬Έμμ μ μν λͺ¨λΈμΈ Zero-DCE λ₯Ό ꡬννκ³ νμ΅μ μ§νν΄λ³΄μλ€.
https://hayunjong83.tistory.com/54