菲力

人形机器人拿着画笔站在画架前进行创作,图像由AI生成

生成式AI及背后的科技巨头,正张着血盆大口,对古老的出版行业虎视眈眈。

今年4月,美媒爆出Facebook母公司Meta一份内部会议记录,原来,早在一年前,Meta内部几乎每天都开会讨论如何获取更多数据,来训练人工智能模型。在这份文件中,公众得以窥见科技巨头如何看待书籍、知识和数据,以及其中隐含的微妙态度。根据会议记录,Meta的生成式人工智能负责人Ahmad Al-Dahle告诉高管们,公司已经使用了互联网上几乎所有的英文书籍、诗歌和散文来训练模型,因此正在寻找新的训练材料来源。

他们清楚一点,AI在未经授权的情况下,已经穷尽了素材,如果要引用更多,必然意味着潜在的诉讼风险。律师指出了其中的道德问题,高管们却沉默了。

其中一则录音显示,与会者讨论收购全球五大出版商之一的美国西蒙与舒斯特公司(Simon&Schuster),或者以每本书10美元的价格,取得新书的全部授权。但方案未能落实,原因很简单,相关的知识产权还是一片空白,AI还可以厚着脸皮肆无忌惮地挪用。

去年11月,加利福尼亚州联邦法官文斯·查布里亚(Vince Chhabria)驳回众多作家对Meta未经许可就用其书籍训练AI的指控。这向他们传递了一个信息,在知识产权混乱的当下,还有灰色操作的余地。

但无可否认,当下,各大AI巨头,正在为高质量文本的追逐蓄势待发。拥有优质内容的传统出版行业,正是其瞄准的目标。我们来到了一个关键的历史节点,围绕书籍这种人类引以为傲的智慧结晶,更多的撕扯、博弈将会展开。尽管科幻电影对AI的想象无穷无尽,但现实的发展还是超出了人们的预期。就像纽扣和纽扣洞、罐头和开瓶器不是同时出现的,世界的格局不是一蹴而就的,在问题找到答案之前,难免经历混乱与遐想、博弈与突围。

Meta公司

美国西蒙与舒斯特公司

Epoch(人工智能研究机构)预测,到2026年,所有高质量可用数据都可能被耗尽。

巨人要求付费

“Word,你是个成熟的软件了,该学会自己码字了。”这话刚出口没多久,键盘侠们还在为自己的幽默感沾沾自喜。OpenAI、ChatGPT和Sora、Midjourney的先后诞生,就一口气取代了人们对Word、Excel和PPT的全部期待:自己码字、自己统计数据,自己生成影像,甚至自己讨好甲方。

一个人工智能领域的基本常识:AI不是生来就这幺聪明的,不论ChatGPT还是OpenAI,模型只是模型。要使其具备可持续进化的智能,“数据堆肥”是关键的一步。在这一点上,人工智能和人的婴儿时期是相似的,都要依靠外界的输入,建立起自身最初的认知基础。2022年11月,ChatGPT横空出世,人工智能领域的数据饥渴被彻底引爆。快速成长中的人工智能对数据调用的需求,已经远超科学家们的投喂速度—孩子嗷嗷待哺。

一年之后,《纽约时报》状告OpenAI和微软侵犯其版权,宣称其出版的数百万篇文章被用于训练OpenAI旗下的聊天机器人。这些机器人作为人类社会新的信息来源,与新闻机构展开了直接竞争。《纽约时报》表示,如果新闻机构无法制作和保护独立的新闻报道,将会造成AI无法填补的真空。此话不假。但更切实的理由是,人工智能站在巨人的肩膀上,却没向巨人付费。

第一个为“巨人”付费的公司是谷歌。2024年初,法国竞争管理局表示,谷歌在未经允许的情况下,使用了法国出版商和新闻机构的内容训练大模型Gemini,对此处以2.5亿欧元的罚款,由此结束了互联网漫长时间以来免费的午餐。

Meta全球合作伙伴和内容副总裁Nick Grudin表示:“唯一阻碍我们达到ChatGPT水平的因素就是数据量。”流出的Meta内部会议记录显示,高层早就开始商议收购出版巨头西蒙与舒斯特公司,以廉价获取更多书籍、诗歌和文章来训练旗下的人工智能产品。流出的资料还显示,当时参会的成员中,有人曾表示在未经许可的情况下使用更多文本,哪怕有被起诉的风险,也是值得的。

约翰内斯·古腾堡正在检查用活字印刷的样张

这场毫无武德可言的现代战争正在进入白热化。

即便如此,Epoch(人工智能研究机构)预测,到2026年,所有高质量可用数据都可能被耗尽。但届时,人工智能可能已经在巨人肩膀上完成了自身从0到1的起步。这之后,就像人成年之后,一切经验的取得得靠自己,而不是他人喂养。比如,由人工智能模仿人类生成文本,再用这些文本训练人工智能的“合成数据”,似乎是一个可行的选择。但也有研究人员表示,这些近亲繁殖而来的数据,或许最终导致“哈布斯堡诅咒”,让最终的输出缺乏多样性,让偏见永远是偏见。

古腾堡再革命

包括新闻机构、出版社在内的一大批传统媒介,对待人工智能的态度不可谓不惶恐。新技术的出现有其蛮不讲理的一面,但也有其势不可挡的生命力的另一面。从印刷机到人工智能,历史从不创新,只是一再重演。

让我们回想15世纪,活字印刷机刚刚面世的时刻,约翰内斯·古腾堡将印刷生产能力从每小时5页提升到25页,使图书得以广泛普及,但也遭到了手抄员和教会的花式推诿。一直等到半个世纪之后,印刷机才被广泛接受,并重塑了现代出版业。

美国伊利诺伊大学的学生Hart是古腾堡的后继者之一。1971年,Hart获得了学校材料研究实验室中Xerox Sigma V大型计算机的使用权限,并预见计算机将会普及,于是决定将纸本书籍电子化,以供人们自由阅读。很长一段时间内,西方文明中的文学作品、期刊,甚至比如乐谱之类的非文本作品,都是依靠“古腾堡计划”的志愿者们手动录入的。这一计划不失为对文明遗产的一种存续与保护,但至于流传和普及,“阅读”仍是一个难以企及的门槛。

今天,古腾堡计划中的60000本电子作品已经全部进入公域版权。麻省理工学院计划运用AI生成语音,将其中5000本作品转化为免费、开源的有声书,以更便捷的方式提供给所有人,包括视障人士。这一回,得益于日新月异的人工智能技术,如今串接大型语言模型的有声书呈现,已经能够以低成本支援多种声线,断句与标点符号停顿,甚至音调、情绪等副语言,都与真人朗读相差无几。

2022年欧美科技大厂大裁员,导致大量科技人才拥入AI赛道,之后就迎来了2023年的AI大爆发。

有声作品的接受门槛要比纸本低得多,某种程度上,这也是在与当今的新闻机构和出版社做竞争—竞争人们的注意力与时间。对此,出版从业者的做法是:打不过就加入,纷纷开发有声产品,但人工配音的成本不可谓不高昂。2023年1月的世界数位图书会议上,全球有声内容负责人Bar-Kar表示,使用AI能够协助出版业者以较低成本出版有声书。若销售状况良好,出版业者可再次请真人配音员重新录制有声书。这种服务与合作的态度,显然要比“不经允许直接挪用”得体许多。

这一切改变都指向一个结果:属于21世纪的“古腾堡时刻”正在来到。很快,人们或许可以在家务的碎片时间里完成一部古典名着的阅读。和15世纪的活字印刷一样,知识的落差将再一次被抹平。

日本女作家九段理江

犯错是一种高级智慧

如果说出版社和新闻机构面对人工智能的恐慌,还只是未能分得一杯羹的忿恨,那幺创作者面临被取代的威胁,存在的价值受到质疑,则是一种更深切的恐惧了。

说来也蹊跷,2022年欧美科技大厂大裁员,导致大量科技人才拥入AI赛道,之后就迎来了2023年的AI大爆发。平面设计师、翻译工作者、文案工作者甚至作家和画家,人人自危。起点和终点,都是人类社会的智力再分配,过程中,每个个体都将重新思考关于价值的定义。

2024年初,在面对人工智能惶恐、迷茫、抵触的暗流中,有一个声音跃出水面。日本女作家九段理江凭借小说《东京都同情塔》获得日本文学大奖芥川奖,作品中5%的文字直接取自现实中的生成式人工智能。九段理江表示,尽管人工智能表述的精准度仍不理想,但只要稍作调整,就可以很好地融入。质疑和赞许一样汹涌,对错没有定论,唯一可以肯定的是,这绝不是人工智能第一次或最后一次介入人类的艺术创作。

中国的“AICG艺术家”陈哲,在使用Midjourney创作时也遇到了“不精准”的问题。他发现这位掌握了人类海量数据的赛博巨人不是那幺好驯服的,偶尔也会产出一些奇奇怪怪的事物,比如三只手的人、长了羽毛的马等。但陈哲认为,这种不精准恰是现阶段AI眼中的物理世界的反映。何不让这种天马行空,成为艺术的一种?在那些描绘异想场域的作品中,AI的作用不仅是提高效率,而是作为创意者参与灵感的启发。

在一次知识版权大会上,曾有观众请教律师:未来什幺样的技能,是人工智能难以取代人类的?律师道:背锅。

虽是调侃,但换个角度解读也不无道理。“错误”何尝不是人类智力成果的一种特殊沉淀?它与想象力同源。深度学习本就是为了塑造一个从容量到性能有远超人脑的超级智能,人类在机器擅长的领域过多踟蹰并无益处。比如翻译,不同语言之间的互相转译正在被人工智能全面取代,但要实现“信达雅”的理想仍脱离不了人类智力的再创造,而如果要翻译诗,则需要再斟酌着去犯一些美丽的语法“错误”。

从版权劫掠到技术合作,再到创意启发,以OpenAI为代表的人工智能新势力,就像一个调皮的孩子,不停地拆着盲盒。但盲盒里的所有,无非是人性的放大器,帮助人类,再一次,向内打开。

特约编辑姜雯 jw@nfcmag.com