暗水印

你发的这篇文章把暗水印的来龙去脉讲得很生动，下面我把其中的原理部分单独拎出来，用更系统的结构详细解释一遍。

一、什么是暗水印

暗水印是一种信息隐藏技术，它把一串肉眼看不见的标识数据（比如员工工号、时间戳、设备ID）嵌入到图片、视频、音频甚至文本中。这串数据是图像内容本身的一部分——不是叠在上面的一层，而是融进了像素里。所以无论你截图、旋转、缩放，还是拿手机对着屏幕拍照，只要图像主体还在，水印数据就大概率能被还原出来。

二、图片暗水印的两大主流技术原理

文章里提到的那个演示网站，正好展示了两种经典方案，原理其实并不复杂。

核心思路：直接修改像素颜色的最低有效位。

每个像素的颜色值在计算机里是一个 0~255 的整数，写成二进制就是 8 个比特。比如 180 的二进制是 10110100。

· 最高位（最左边那个 1）一变，颜色会巨变。
· 最低位（最右边那个 0）改成 1，数值从 180 变成 181，亮度变化不到 0.4%，人眼完全无法分辨。

水印嵌入过程：

特点：

· 优点：计算极快，肉眼毫无痕迹。
· 缺点：极不耐压缩。截图发微信、存成JPEG，压缩算法会粗暴地丢弃这些“没用”的最低有效位，水印瞬间丢失。

这是企业级暗水印真正在用的技术，也是你拿手机拍屏幕还能被找出来的原因。

核心思路：不在像素本身上动手脚，而是在图片的频率成分里藏信息。

· 低频：大块蓝天、纯色背景——代表图片的整体轮廓。
· 高频：毛发边缘、衣服纹理——代表图片的锐利细节。
· 中频：介于两者之间，既不明显影响观感，又不容易被压缩掉。

水印嵌入过程（以JPEG图片为例）：

为什么手机翻拍抹不掉？

· 手机对着屏幕拍照时，虽然经过了镜头畸变、摩尔纹干扰、二次压缩，但 DCT 中频系数的强弱关系被保留了下来。
· 企业级暗水印通常嵌入强度极高（相当于在频率上挖了一个很深的坑），并且会配合纠错编码。即使拍照损失了 30% 的数据，剩下的 70% 也足够算法通过校验位把完整的工号算出来。

三、AI生成的暗水印：SynthID 原理简析

文章末尾提到的 Gemini SynthID 代表了第三类水印——模型内生水印。

与传统的“先出图、后盖章”不同，SynthID 是在 AI 画图的过程中就直接干预生成。

· AI 画图时，模型会在人眼几乎无法察觉的极细微纹理处（比如草地的一片叶子方向、云朵的一丝纹理）注入特定模式。
· 这种模式不是像素值改动，而是视觉语义上的微小倾向，极其鲁棒，截图、拍照、甚至打印后扫描都能检测。

这很巧妙，不修改字形，只修改选词逻辑。

· 正常AI写诗会随机选同义词。
· 带水印的AI写诗时，会按照一个预设的数学规则（如哈希值校验）故意在 10% 的用词上选用 B方案而非 A方案。
· 检测方只要把这段文字跑一遍同样的规则，看命中率是否显著偏离自然概率，就能断定：“这段文字是AI写的，且出自我们家的模型”。

四、总结对比

技术类型藏在哪里防截图防拍照典型应用
LSB 最低位像素颜色个位数 ❌ 易丢 ❌ 秒没简单隐写术玩具
DCT 频域图片频率分布 ✅ 很强 ✅ 极强公司内网屏幕、机密文件
SynthID 生成模型参数倾向 ✅ 极强 ✅ 极强鉴别AI生成内容

最后借你文章里那句诗收尾，因为原理讲完再看这句，会更明白它有多准：

指尖轻点处，云端已记名。莫道无人见，暗纹即汝名。