图像表示
- 数字图像
- 由有限的离散元素组成 $f(x,y)$
- 每个元素称为像素
- 图像在内存中的存储
- 大小: 分辨率, 宽 x 高
- 颜色空间: rgb, cmyk
- 通道: 1, 2, 3, 4, gray & color
- 深度: 每个通道的位数
- cv_8uc1: 8 位无符号整型单通道矩阵
- cv_32fc2: 32 位浮点型双通道矩阵
- 坐标系: 左手, 右手
- 交叉存储, 顺序存储
- 邻域: 周围的像素
- 采样: 数字化坐标
- 决定图像的分辨率
- 决定图像的细节
- 量化: 数字化幅值
- 决定强度层数
- 决定图像的对比光滑程度, 避免锯齿
几何操作
空间变换: 𝑔(𝑥,𝑦)=𝑓(𝑥′,𝑦′)=𝑓[𝑎(𝑥,𝑦),𝑏(𝑥,𝑦)]
灰度级插值
- 重采样
- 最近邻
- 双线性
- 三次立方
- 重采样
基于空域的灰度图像增强方法
r: 输入像素, s: 输出像素, T:转换函数, L: 最大灰度值
- 灰度变换
- 线性: 255 - r, 用于反色
- 对数: 将范围较窄的低灰度值映射到较宽的灰度空间, 范围较宽的映射到较窄的灰度空间, 或者在傅里叶变换中压缩动态范围, 显示频谱细节
- 指数: 增加对比度, 对图像进行亮度修正
- 直方图处理
- ⚡直方图均衡化, $r_k$ 是像素灰度值, $n_k$ 是灰度值数量
- 计算直方图 $p(r_k)=\frac{n_k}{MN}$
- 计算变换函数, 得出均衡后的直方图 $$s_k=T(r_k)=\frac{(L-1)}{MN}\sum_{j=0}^kn_j,\quad k=0,1,2,···,L-1$$
- 将点四舍五入
- 直方图匹配(规定化)
- 图像增强中使用直方图统计
- ⚡直方图均衡化, $r_k$ 是像素灰度值, $n_k$ 是灰度值数量
- 空间域滤波器
- 线性滤波器
- 均值, 最大值
- 行列分离高斯滤波
- 导数滤波
- 一阶微分 - 梯度
- 二阶微分 - 拉普拉斯
- 线性滤波器
频率图像增强
- 傅里叶变换: 时间域转为频率域
- 基本记号
- 低通滤波
- 高通滤波
图像修复
- 图像恢复
- 只存在噪音的空间域图像恢复
- 自适应中值滤波
- 如果中值大于最小值, 小于最大值, 进行滤波
- 为否则扩大滤波器, 直至最大然后输出原像素点
- 滤波过程
- 如果原像素点大于最小值, 小于最大值, 输出原像素点, 否则输出中值
- 逆向滤波
形态学
- 膨胀: $\oplus $
- 桥接文字裂缝
- 腐蚀
- 消除图像细节部分
- 主要应用
- 开操作: 先腐蚀再膨胀
- 闭操作: 相反
- 边界提取: 先 b 对 a 腐蚀, a 减去腐蚀后的部分
- 区域填充: b 对 a 膨胀, 直到不再增加, 且限制在一定范围内以防填充满整个区域