上世纪末的作品《攻壳机动队》中,全身义体化的素子,怀疑自己是否仍然存在。身体、记忆和其他人的关系,当这些事物都能够被复制,也就无法成为肉身生命的论据。7 F e0 Y: Z+ ]1 j( l9 N$ {
- J0 A3 P2 f& C G; ~. ^! J
# y6 I( |/ X( O6 }) _; p
AI 歌手爆火之时,孙燕姿也在回应里提出类似的观点,你并不特别,你已经是可预测的,而且不幸你也是可定制的。" g1 O! R& z& u8 Z/ @2 M! i% H F
4 K6 t# F; C% ?) G" @# s我们可以加上一句,任何人都是可以被 AI 描述和生成的,哪怕你从未做过某些事情。3 t8 R+ g G/ X% M' y/ f3 G' q
4 e5 y- }8 K2 u8 W/ o3 R, V! b G鲁迅真的说过,一见短袖子,立刻想到白臂膊。人类的想象力是共通的,毫不意外,每当技术有新进展,某个垂直赛道会被开发得越发成熟:搞黄色。" t3 ^; i1 [* ~( n9 { {
, X) x5 \: p) p# H# P/ X
从明星网红,到每个普通人1 e: Z. u. l) ^& I# _
) F' s: b2 h) C8 s
2017 年兴起的色情 Deepfake 有续集了。
3 J6 g1 B3 O5 B4 q% F* \ I% m, p/ @ p! }% N z) Y
之前是换脸的「移花接木」,眼下是数行文字的「无中生有」。
) |, j. m% T) G( a) y- ~
! x" ~& R/ P* gAI 作图发展到如今,已经有了很多分享 AI 模型的网站,你可以用来生成各种风格的图片,莫奈笔调风景画、韦斯·安德森配色产品图,当然也包括仿佛真人出镜的色情场景。
5 j2 k" w7 z+ v0 N
7 V1 C* F2 X+ p5 @& s「Create Anything(创造任何东西)」,这是其中一个网站(避免有宣传之嫌,名字就不透露了)打出的旗号。虽然啥都能干,不少用户更愿意在「十八禁」大展拳脚。) |) Y8 l" F$ ~# J5 ~! B* I
. K6 O& r/ \, Y6 w/ f2 x
3 p0 ]9 m7 h( M4 q) p
在文本框输入名人名字,加上「裸体」等提示词,就会得到一个模糊的图像。接下来是另外的价钱,每月 4 美元试水基础版,或者每月 15 美元尊享专业版。1 R4 H1 D0 _8 ?2 {1 N
! m, n) C w5 h5 _ p" ~! h
付费解锁界面,NSFW 意为「工作场所不宜」,一般指色情、暴力等内容. 0 @9 z! P, i. ~1 T
! B3 o' e) p) z* A- T1 B
不仅如此,生成图片之后,提示词公开可见,让类似喜好的其他用户沿用或者迭代都很方便。0 U7 O6 p0 ^* X1 l+ ]/ U" b
6 } r; b5 P# p" B$ K B# C
另外,这个网站在聊天软件 Discord 有 3000 多名成员和数十个聊天室,他们讨论的都是怎么精进提示词技巧,从而更符合自己对某个部位和姿势的想象。1 _& I+ a* i/ f: ~
8 b* d( W H* H) t% F好莱坞女星的 AI 模型,已经下载 1300 次. & `9 `# a% z" E) d: [- n
( C& z' p' Q p" ]+ Z$ w* ]1 Z' B/ Z. Z
网站的创始人在接受采访时说,NSFW 只占平台内容的一小部分,每月有 100 万个活跃的创作者产出独特的作品。/ L2 X7 T! E3 q! @& Y2 T
& m6 B$ {( s; p6 A
在另一个类似的网站,用户可以上传、共享和发现自定义模型,同样是什么风格都有,动漫风、游戏风、胶片复古风…… 但人性所致,带颜色的模型人气居高不下,最热门的几个已经被下载六七万次。
3 B+ [7 q4 X& A! ~/ f
& I5 L: \8 ~% R' g& ^ 一个「擦边球」模型. & q0 V7 O1 n1 a2 @8 @4 R3 ~
; t: d) h8 e" y# F8 {色情固然是互联网的一部分,然而问题在于,训练这些模型的真实人物图片,是在互联网擅自抓取的,并没有经过本人的同意。
! t8 j o3 n" ], k2 @- I1 i+ O+ d7 y
有些图片也不是完全露骨,而是让名人穿着内衣,或者某个部位看起来更大,但五十步笑百步的做法,仍然是不道德的。# s7 H8 z$ T& j2 U5 L/ E
0 f! b+ }" k$ n9 i, K
这时候就需要稍微解释下原理。很多个性化的 AI 模型,都是基于开源的 Stable Diffusion 微调,而 LoRA 又是一种主流的模型微调训练方法,因为它相对轻量化,用少量图片训练,便能生成特定的人物、物体或画风。
7 Q5 \ n# z) N$ L! X# Q7 G8 g ~4 z& [
之前很火的赛博 COSER 用的也是 LoRA. 图片来自:@勘云工造 # O- Y& i. U9 I+ O9 e
, o- I/ M0 J$ W& ]那么对于色图,谁成为了微调数据集呢?
/ J6 q( z n5 s6 [% l$ Q
9 t+ A: ~6 W7 {& P. @3 J独立媒体公司 404 Media 调查发现,其中一个模型的训练数据,来自「美版贴吧」Reddit 的几个成人主题社区。
$ }$ y6 j: g+ v/ X# I
6 h2 @, W- H% h+ v5 r) A% S
) ~7 R! T" j- L) h. O1 S* b7 h+ Y" {% ]. d4 R9 e
愿意上传图片,不代表愿意充当 AI 的口粮。一位负责管理社区的 Reddit 用户怀疑,大多数在 Reddit 发布裸照的人,可能并不知道照片正在被用来喂养 AI 模型。$ Z! O5 I5 |+ ?# r3 r
" ^7 i4 r) M' b: p: V0 ]倒也不是发出裸照才有威胁。7 月初,德国电信发了一条关于儿童数据安全的广告,展现个人数据被拿去使用是多么容易,后果又是多么严重,呼吁家长尽量少在互联网分享儿童隐私。+ f" Z) e$ m) @$ P% D5 |
6 K" }- v. \: ^德国电信广告部分截图,儿童照片可能会被用于制造成人内容. ! l; @: g" }, B1 `( X" i, V2 g& w* f
9 Q7 E0 P; J: H+ Z O1 g: c这也意味着,威胁不仅在明星和网红头上盘旋,也可能击中在互联网路过的普通人,恐怕离人人都有一个 AI 模型的未来也不远了,只要你我在互联网上有过数字痕迹。/ F: u' V+ H7 D& H$ V# T5 w b
- \' n4 V6 o/ X* U# j W
根据今年 7 月的互联网状况统计报告,近 50 亿人(48.8 亿)活跃在社交媒体上,占世界总人口的 60.6%。
' y$ }9 J5 i" D; g& d/ V/ X- j+ v, f! w# _ ^# y! {
1 W+ B4 D1 s& S( b6 t3 {' t$ j
或许有人会问,这不是 Deepfake 换脸时就有的毛病吗?是的,但伪造图片的脚步不会停下,已经存在的问题变本加厉。9 V) H5 ~# S) v p D w: ^7 k# z
2 A9 C* B/ b5 R! a) P/ W% g从基于生成式对抗网络的 Deepfake,到模拟粒子热运动过程的扩散模型,训练数据集扩大了、算法框架迭代了、算力水平也提升了。更直观的是,普通人在 AI 上也有参与感了。
& o) | t" B) i/ h$ \) ]+ Y$ O" n9 \, Q' Q8 V
从前我们更偏向 AI 消费者,或是刷到真假难辨的汤姆·克鲁斯微微一哂,保持看热闹的旁观心态,或是换上好玩的滤镜跟进社交媒体潮流,交出去的基本是自己的个人信息。
9 l2 B( R6 i% H0 v9 E" Z& U) U+ @2 e+ [; K/ R& c9 X% t
TikTok 的「汤姆·克鲁斯」,本人看了也得犯迷糊.
' J- p, P0 P5 z* \+ e/ O
2 N- C |8 u1 ^0 U2 ~+ v现在我们都可以是 AI 生产者,登录 AI 模型网站,在文本框输入提示词,由云计算处理需求,几分钟就可以生成某位名人的定制 AI 作品,哪怕质量不好,用户规模和图片数量是空前的,每个月产出上百万张图片不在话下。4 ]' K* u+ A* |3 |0 W
* B) u& N* u3 h s$ K7 @
某 AI 模型网站的生成速度,最多需要 1 分钟. 5 r8 d# j- a' w5 C% p. d
: p! C1 q( N) _+ T/ g6 v
AI 成人内容的可怕之处还在于,既要从真人取材,也要回归「真实」。2 T/ R) q$ ?1 p/ K# f, B! Y5 m; k2 t
- I9 {% v, {$ T6 I
各网站最受欢迎的模型之一非常强调现实感,用户们还在 Reddit 讨论怎么给某个器官特写。行业里最优秀的创作者,甚至称自己的作品就像「1080P+ 视频的定格帧」。
9 J7 x1 p! j1 H2 ?9 X- m S& V/ p5 L0 b7 Y; T# Y. L0 s. T0 W8 G# ?, w
可想而知,骚扰和勒索也可能会增加,技术的恶面往往最先向无法自保的人刀剑相向。5 w5 o- q, C) I1 Q: I5 Z) u( a+ ?, {
8 y' k! b& O5 H, k
是兴趣,更是交易
! p) {( g- h( Y( b( N8 ?! D# h9 B \# B) H8 P4 ^# J0 z2 G) v! Q1 v
和性搭上了边,那就不缺交易。买家是出于个人兴趣,卖家则是因为真金白银。除了上文提到的订阅模式,用 AI 色图赚钱的方式还有很多,虽然基本都是「打零工」。5 p9 ~+ j* S! L4 D. e$ i
: N3 r6 I. _1 B* R6 q p
在 Patreon、Ko-fi 等具有打赏、赞助功能的平台,可以找到创作者的踪影。一位创作者在 Patreon 有 100 多名付费会员,巅峰时期每个月能赚到 1500 美元。
) \+ g+ g8 C, z+ d) r. l4 n7 D" M7 N" p: Y" C+ O4 d+ [1 @
他还顺便加入了另外一个平台的「创作者计划」,每张图片入账 0.001 美元,虽然单价低,但好在他使唤 AI 的速度够快。
9 T( i+ m& |9 }2 z, U
: A' D, G% b/ S$ A2 W) [+ QPatreon 的订阅界面.
9 _" h8 w* G$ f% [6 M; X* X
* m @6 a- X% B* N8 d4 p# l任务众包平台 Fiverr 也值得一提,它是一个连接甲方乙方的中介,几乎可以购买和出售任何数字化「零活」,比如写作、翻译、设计,不少 AI 创作者明码标价,按照模型和图片数量阶梯收费。' w/ k( N+ @" A* u
* x! g9 O: N- q3 q! H( u. B
一位 Fiverr 创作者的接活界面. - B- t" n! P1 k$ b8 L3 u+ n! G
! V7 S4 N9 }$ q
还有作风更加极客的创作者,直接在 AI 模型网站贴出比特币钱包地址。
6 o- I6 a9 V2 t
/ O2 i( y F# G' y7 E) Y别说个体创作者了,平台同样赚得盆满钵满。7 I @9 }- V/ g4 ~3 m2 U
$ f9 n& R& A9 M9 I. \; _# g有的 AI 模型网站自己也有打赏功能,同时提供每月 5 美元的会员福利,让用户可以抢先体验新功能,并在官网和 Discord 上的用户名后面戴上独特的徽章。3 p$ g7 O4 h* H, w/ K6 Z
5 {+ [* v" J' ~8 u
AI 模型网站的打赏功能. ) }+ ?1 b9 u' H& T: i* {
" g! k. r! O9 O0 U* L' a
号称全世界第二大成人网站的 OnlyFans,不像 P 站收入主要来自广告并按视频点击量和创作者分成,创作者可以通过用户订阅和按次付费赚钱。
( ]9 g% j2 X( t3 L2 Z: d- ?% ^
' o6 k# p3 i9 ~# }有观点认为,OnlyFans 改变了成人产业,因为创作者拿回了主导权,通过自己的作品直接获得收入。/ f) G, |: a' E' N+ C- ]# z' N" `
7 k: ]% S( O$ g4 |6 o6 K) r# \然而现在,出图更快的「AI 师傅」也在复刻这套商业模式,「传统手艺人」的生财之路可能再次被打断。 J( I7 D2 L- A2 T
) U, F* |8 R2 O' }+ N/ f/ `! T1 P0 h; ]$ L$ X- u
这一集我们在 Deepfake 视频大行其道的时候就看过。彭博社采访的一位 29 岁网红,是其中一位惴惴不安的受害者。, q5 s; W: B" R1 T+ |7 ]; e
& C, V# E1 _7 F) E _. [
放在以前,如果想看她玩电子游戏,可以每月花 5 美元订阅 Twitch,如果想看她尺度更大的内容,可以每月花 15 美元订阅 OnlyFans。& Y6 Z( H3 z3 A% k* |3 T# w$ B5 h7 s
9 D2 X% Y9 t! l. m7 ?( r' M7 F
4 ?- S( ?/ _/ h然而现在,粉丝可以花更少的钱或者免费观看她的 Deepfake 视频,只要带着她的大名搜索 Google。与此同时,心理创伤如影随形:7 n& j9 i( [8 e# x' t" J8 F J
+ M% D7 i; o$ y; E# B人们总是在发布新视频,在你不同意的情况下看到自己出现在色情片中,感觉很恶心。
: N6 I% J! m: i- M6 ? S" p/ o4 L9 _
AI 色图这把火,也迟早烧到真人头上。一位在 Reddit 发图的「女菩萨」很是悲观:
- d7 y4 B) S9 a# ?, w% v# ~. t& }4 j. \5 T I' G+ {% E
过去没有采取任何措施来保护我们,所以我不明白为什么现在会激励任何保护措施。$ v( H5 z% l' S& p4 K
( H. [0 O3 r: ^; M
操作猛如虎,维权打地鼠
% g/ w' C4 l! x- L& {
& J- f% t4 E u$ N; Y$ f作恶成本低、维权成本高,是 2017 年「黄色」Deepfake 兴起之时就有的毛病了,现在它只会变得更加严重。, C. ]! M+ M8 A2 m
2 C; h' o& t# M7 r% A$ \5 b
撤下未经本人同意的 AI 色图,往往是靠受害者自行发现,或者平台事后补救。# k }# K. S/ ^4 I
: S S6 k0 {2 l u; p0 W8 b2 R
! z# i0 b# h. c$ B3 x按照 Google 的服务条款,如果证据充分,用户可以请求 Google 删除某条具体的链接。然而「野火烧不尽」,这就像一个没有终点的打地鼠游戏。
* C) C1 h, g, O/ b
2 R- ~6 Y6 e- s% S不过,Google 也在改进排名系统,减少此类内容的出现。
, N$ i3 G% \% _, r/ p+ T" o* I0 Y# P4 d5 @: n( }
Google 的服务条款. . i- q6 q- @1 T4 k
2 j, C, D9 W8 u3 t2 ^; b d; e: `
提供 AI 模型的平台们也并非没有意识到,技术存在被滥用的可能,但前所未有的内容规模,已经不允许平台只是沿用以前的审核策略。 V' S1 b( ]: w8 m3 C" h8 I1 l
% e! t4 {1 q& S8 n. S404 Media 记者发现,某 AI 模型网站的服务条款允许色情内容,也允许真人内容,但不允许两者兼而有之的真人色情内容,尤其涉及到未成年时。+ Y2 |5 a+ @ X! o" L* G
o$ w$ L8 \# @$ l* u- D8 Q然而,此类内容仍然不断发布,部分被平台删除,部分已经「幸存」了几个月。3 j1 m+ b7 l) a# T X2 U& W
5 ~7 w/ s) V! L% A某 AI 模型网站的服务条款.
* ~* t# E8 e* C9 { ?+ s% O: E, H7 z+ v- D
只能说,意识到位了,但方法没有。对技术的规范,总是相对技术落后半步。5 J5 y: h# ^: k7 e1 N u9 n# x
0 p9 M( ~+ D- G4 R* K G# k o类似地,生成真人色情图像,违反了 Discord 的社区规则,但管理起来并不容易,靠的主要是用户自觉。/ \/ M6 X& W! T* Z. I
7 R6 e3 n$ Q k) O4 h& |
Discord 的信任与安全团队,负责检查用户、版主或记者的报告,如果有人确实违反了社区准则,那就发出警告、删除内容、关停账号等,存在一定的被动性。5 `* p( G- B& @' ~
$ V% I2 E% x4 E( t# }/ |& ^9 f- e& lDiscord 的社区准则,上为原文下为翻译.
7 y+ D8 O) O4 A8 V/ c% b
' ~* X% D' s" b$ M( I; b! v讽刺的是,把 AI 色图分享到 Discord,也会被 AI 模型网站的用户内部批评,不是问心有愧,而是因为这坏了规矩,有可能让社区被禁:「你可以在网站上创建它,但不能在这里分享。」
% L# e3 m7 s8 l7 ?& r/ Y
/ p# |+ i0 x& e7 m7 Z% i% x7 @6 t: m4 U# c甚至法律也不一定派上用场,就像 Deepfake 存在这么久了,美国只有几个州在为它立法,但因为杂乱无章,很难真正执行,并且有些创作者想尽办法隐藏身份,既然找不到人维权,很多时候受害者只能吃下哑巴亏。
`5 j3 v, x' b: \- w' t& T4 f9 @9 F, d- r# H7 w5 F' z( o
好在几个更加主流的文生图工具,用技术为技术事先附加了制约。1 n/ l( q3 {: n. C
4 r* S! I+ Z; T9 R0 A$ j, m3 C4 Y0 d& ?* H
OpenAI 旗下的 Dall-E,尽可能减少了训练数据中的裸体图像,并且在实际使用过程中,阻止某些提示词的输入,以及在图片显示给用户之前扫描输出结果。" @0 [9 g V, h' z6 z+ w* C
5 R% h) ]7 I0 r6 H
Midjourney 也有屏蔽词和人工审核,还计划推出更先进的、能够关联上下文的过滤功能。
9 I9 H- f# j. l: }0 y+ s
! \, [! V( k6 W V4 uStable Diffusion 背后的公司 Stability AI 也曾回应过类似的问题,「对任何开源代码所做的事情都是无法控制的」。
) ^3 P6 u/ Y' n. {2 J* Y# c b. i( N2 i
尽管如此,Stability AI 认为,识别此类行为并将其定为犯罪,还有很多事情可以做,开发者社区和互联网基础设施提供商也应该参与进来。
; @( _2 I6 V" z% ?" | y" J. w# A1 _ m/ ]
+ L1 k! d4 P9 o; k简言之,对技术的规范就像钝刀子割肉,不能立刻起效,而 AI 色图的问题远比以前严重,靠的是一条运行顺畅的「生产链」:8 P6 L$ a/ R& F; N$ R T
' w8 Y, d: H0 t. _( L
提供训练图像的内容社区;
7 q1 O: U% F0 |! m' p
% d& F. L: Q; Y N% `# v: O生成色图的开源技术;; y( b: |+ G" J
( c8 l/ N) f _5 j4 Z9 w将 AI 模型和图片商业化的平台;
4 M5 J+ z! p+ W' r% Y8 U; e3 M+ T. ~- r0 a/ ^
自从 Deepfake 问世,我们就遇到了同样的问题。人性难测,技术的普及和滥用只有一步之遥,工具更加容易上手了,商业模式也走通了,那么创建和分发色图的动力就更大了。+ T/ @3 G- ?' }, f
* k" E7 y3 h. T* d2 y6 C% }* I
7 b w e/ _! `9 _很多时候,互联网的成人行业已经被「非人化」地看待,当真正非人的 AI 取而代之,继续满足刻板印象,可能导致物化更上一层楼,而不是停止物化。
% X0 w6 v$ g& g3 T: |0 N; G; Y0 K5 U$ j- U9 }/ ?# y! y
就像《攻壳机动队》提出的问题那样,真实和虚假不再沟壑分明。完全像你的人做出了你从来不会做的事,但你很难证明那不是你,数据就是你,存在过的痕迹就是你。
5 M* j3 Z6 k9 `; e1 r
( v$ P8 a3 D6 _3 E每当 AI 被最先应用到色情产业,总有人说,这会加速技术普及,或者不再需要真人。有人用金钱兑换欲望,有人不经意被投入技术熔炉,却没有谁会为伤害买单。
4 Q) Y3 d0 J, V: Z1 Y/ N* w% j0 W$ A5 Y9 O3 I3 O: B0 A% Q
来源:爱范儿 张成晨! v0 ?# }: e) S7 b* a- O
|