
【摘要】人工智能技术深度介入内容生产与传播环节,在一定程度上提升了传播效率,促进了传受之间的互动,但与此同时,也带来了版权方面的问题。正确认识人工智能给报业版权保护带来的新挑战,才能更好地加以应对,推动报业健康发展。
近年来,在信息传播领域,人工智能(AI)技术迅速推广并渐呈爆发之势,从传统报刊到网络门户再到社交媒体,大都已在AI支持下运行;生成式人工智能大模型(GAI)风起云涌,2024年共有302款生成式AI服务在国家网信办完成备案,一年之内新增238款;百度推出了AI搜,更有平台推出了AI日报……AI深度介入内容生产与传播环节,在一定程度上提升了传播效率,促进了传受之间的互动,但与此同时也带来了版权方面的问题。在AI技术广泛应用的背景下,作为报业核心资产的版权面临严峻挑战,使得在网络传播冲击下处于困境的报业更是雪上加霜。
“合理使用”:人工智能大模型内容生成的隐性“剽窃”
2024年12月27日,2024数字版权保护与发展论坛发布了《中国数字版权保护与发展报告2024》,其中重点介绍了数字版权保护与发展年度关键词,“AI大模型语料训练版权挑战”位列8个关键词的第三位,可见AI大模型语料训练中版权问题的严重性。数据、算法和算力是AI技术的三大核心要素,数据是基础,高质量且充足的数据为生成式人工智能大模型发展提供了基本保障。如果数据数量不足、质量不高,算法再高明、算力再强大,也仅仅是技术空壳而已,谈不上“智能”。从GAI服务开发企业来看,他们需要数以亿计的数据,当下甚至已经有训练数据即将枯竭的担忧。而从训练数据的生产者来看,版权则成为重要的关切点,不断有版权持有者对AI开发企业提起维权诉讼。但是,维权面临的一个巨大挑战是法律上“合理使用”与事实上未经授权隐性“剽窃”之间的冲突。
训练GAI的数据来源多样,相较政府职能部门定期发布的政策文件数据和科研院所的研究数据,大众传媒作为专业信息采集机构,每天都会产生大量数据,这些数据具有时效性强、权威性高、真实可信的特点,是GAI训练中不可或缺的优质数据。与其他带有强烈独有特质的人类声音符号和体态符号不同,文字符号最容易排列重组,甚至可以做到以相同风格表达相同思想而“复制比”不超标。因此,在GAI产生之后,报业首当其冲面临着版权方面的挑战。虽然眼下诸多AI应用尚处于探索阶段,没有实现高额回报,但其购买会员等方式已形成了基本盈利模式,而作为重要数据来源的报业却不能从中获得任何分成。
对此,报业当然应积极维护自身权益,通常会进行版权诉讼。在诉讼中需要证明GAI使用报业原创内容训练构成了法律意义上的侵权,但GAI侵权的确证相当困难。与传统侵权不同,GAI通过学习诸多数据之后生成的是新文本,即便相同问题在不同时间提问,GAI给出的答案从思想、主旨和风格上可能相似,但在文本表达上却可能完全不同。无论中外,大多数版权相关法律都不可能以思想相似作为侵权标准。我国的著作权法也同样明确了“思想”“表达”二分法,对思想雷同不加追究,仅把侵权责任定位于“表达”层面。因此,一些法律专家也认为GAI生成内容不构成侵权,其利用报业新闻报道进行训练属于“合理使用”。
以2023年12月底纽约时报诉OpenAI案为例,纽约时报指控OpenAI未经授权使用该报版权文章训练ChatGPT,并索赔数十亿美元,而OpenAI应诉强调他们是“合理使用”。从目前来看,GAI训练和数据生成过程是一个“黑箱”,很难找到直接证据证明其侵权,因此保留用户数据成为唯一有希望的明证,但用户数据若长久保留可能会对个人隐私造成威胁。
当下,借助“合理使用”的法律保护,诸多GAI开发者仍不愿意公布训练数据源,他们依托技术优势,从构成事实的基本要素到思想精神,再到表达风格,都可能对报业新闻报道进行无形“剽窃”,报业则因为“表达”相异在法律诉讼中很难实现维权目标。
法难责众:AI技术嵌入传播链的流量“劫持”
除GAI内容生成时的隐性“剽窃”外,报业版权面临的更大威胁是诸多不同身份主体利用AI技术全面嵌入传播链,进行着流量“劫持”。
传统意义上,报纸发行由报业机构掌控,作为信息运营分发的唯一主体,报业机构以“二次售卖”方式获得广告回报。在AI技术普遍应用后,报业机构已很难控制自有内容的数字化分发过程,因为在传播链中出现了大量其他主体,对内容进行着“分发”。这主要包括以下几种情况:一是无意识侵权的自媒体、电商平台和其他组织账号。在社会热点事件出现后,出于引流需要,这些账号会直接转发报业生产的新闻内容。当下,AI技术应用已成为很多人日用而不觉的行为,这些非专业信息服务主体甚至意识不到随意转发存在侵权风险。二是明知故犯的一些自媒体人、公司和企业等。为博得流量,这些主体会毫不犹豫“拿来”报业生产的新闻报道,为避免侵权责任,在转发时会标注“版权属于原作者”之类的声明。这些主体利用法律上的“避风港”原则,为自身侵权免责做了一定准备。三是拥有强大技术能力的聚合类信息服务平台。这些平台利用算法推荐技术分析用户画像,同时通过智能搜索、抓取、分类技术进行信息与用户的匹配,从而实现个性化推荐。其以强大的技术能力抓取报业生产的新闻报道,按照新闻热度构建平台内容,获得了更大流量。在以上不同网络主体的嵌入下,报业新闻工作者付出大量时间和精力采写的作品被无偿使用,虽然一些商业平台通过签约方式给予报业一定比例补偿,但无疑杯水车薪。
当下,人们已经习惯从微博、微信、今日头条、抖音、快手、小红书甚至各浏览器的“热搜榜”获取信息,很少有人会专门选择报业两微一端作为信息来源。普通的网络用户并不会特别在意新闻来源,对他们而言,只要能够迅速获得自己需要的信息即可。同时,在碎片化信息接触中,用户进行网络阅读通常是粗略浏览,不会注意转载标注的信源,用户注意力集中于转载的平台,流量自然也归于该平台。这种情形的流量“劫持”不但造成报业经济损失,更导致报业影响力日益衰落。
被称为“传统媒体告赢网络媒体非法转载”第一案的现代快报社诉字节跳动公司(今日头条)非法转载其4篇文章一案,历时3年才胜诉,而获赔经济损失仅仅为10万元。此案并没有掀起报业维权热潮,因为如前所述,侵权主体极为复杂,人数众多,任何一个报业机构都无力对抗如此庞大的人群,何况针对具体文章非法使用的诉讼会涉及诸多撰稿者。维权耗时久、代价大、所得有限,报业机构难有动力对诸多侵权主体进行一一维权,陷入了法难责众的尴尬境地。
个人至上:AI“个性化”信息服务冲击报业公共价值
通常认为报业版权涉及的主要是财产权,但保护报业版权的意义不仅仅是保护报业的财产,因为,对报业而言,通过新闻传播推动社会文明进步才是根本价值,报业版权实际维护的正是这种公共价值。AI技术介入信息生产、传播、接收全流程,其突出优势就是“个性化”,“个性化”已成为信息获取的趋势之一。很多信息服务平台以个性化服务为标签,但这种个性化服务可能导致某些用户的“个人至上”,使得报业建构的公共价值在版权被普遍侵犯的情况下面临巨大挑战。
在个性化算法推荐之下形成的“信息茧房”,让用户避开与个人观点相异的内容,按照施拉姆媒介选择的或然率公式,用户是否选择某一媒介,主要依据报偿的程度,如果能够以最低代价获得最大报偿,用户无疑会作出选择。有了算法推荐,似乎永远能够让用户报偿最大化。AI在生成内容时会迎合提问者,总能给人提供看起来“完美”的答案,由于其对用户特点的准确把握,其答案甚至总能符合用户预设。因此,一些人已形成对各种信息服务平台的深度依赖,陷入“信息茧房”中。一旦偶然接触到“茧房”外不一致的信息,容易产生强烈的内心不和谐感,按照认知平衡理论,他们又极度需要恢复内心和谐,而实现和谐的办法则是对不同观点加以否认。因此,我们会发现,当下网络世界里常常出现观点极度对立的情况,网络暴力造成的严重伤害一起接着一起。算法推荐的个性化服务实际上总是包含着对个人的迎合与诱导,使用户养成不顾及他人感受、以自我为中心的信息接收与表达习惯,随之出现了个人主义泛滥和社会责任感淡薄的问题。
在报业发展过程中,媒体人逐步建立起对核心功能的价值认知,把服务公共利益作为立身之本和存在之基,监测环境、传递信息、传承文化、消除社会隔阂、推动社会沟通、促进共识达成等,构成了报业的基本价值。报业原创作品正是在这一职业精神和价值理念支撑下,按照专业规范完成的,保护原创作品不受侵犯,本质上也是对报业公共价值的守望。
AI技术介入信息生产与传播过程,依据用户个人喜好对报纸原创作品随意切割,进行碎片化传播,破坏了作品的完整性,甚至对作品思想断章取义,不但歪曲作品本意,而且可能带来谣言传播真相丢失、情绪泛滥理性缺乏,形成沟通障碍,导致价值撕裂,推高社会运行成本。这种理性判断力的缺失会助长人的自我中心主义,造成私语表达削弱公共对话、个人至上代替社会关怀等深层问题。
超越利益:版权的本质是保护人类创造力
AI技术普遍应用带来的报业版权保护问题,不只是报业与侵权个人和组织间的经济利益冲突,更为关键的是,在AI技术日益强大的当下如何保护人类创造力。
创造力是人类文明进步的根本所在。马克思曾提出从必然王国向自由王国飞跃的人类文明进阶的著名论断,认为到达自由王国的标志是“作为目的本身的人类能力的发展”,一切有助于人类能力发展、促进自由的力量就是积极进步的;反之,一切削弱人类能力、对人形成束缚的力量,就是消极的、应该被战胜的。
就AI技术而言,其产生之初主要聚焦于信息检索与分类等,提高了用户的工作效率,人类可以自主掌控。自从算法推荐、智能生成等技术出现后,AI展现了惊人的“运用符号进行思维”的能力,虽然从科技角度看这不过是在创造新数据,但是如果把GAI放到人类文明史中去评估,会惊讶地发现,由于GAI的出现,运用语言进行表达的能力已非人类独有,它颠覆了人类关于自身的基本认知,因此,也引发了关于主体性之争等诸多问题,版权保护只不过是这些问题中的一个而已。
GAI内容生产快速高效、规模巨大、类型丰富,天然具有独特优势和强大吸引力;同时,AI技术支持下各主体对原创作品的无偿使用和隐性侵害,打击着人们的原创积极性,人类趋利避害的本能使得很多人不再费力进行原创,而是利用GAI生成所需文本。当日益陷于智能生成内容包围之中时,人类的思维水平、道德水平和创造能力并不会获得提升,真相也不会因为信息量的增加而自动出现,正如尤瓦尔·赫拉利所言“信息常常被用来创造秩序而非发现真相”。人类表达秩序一旦由AI主宰,将不可避免地反作用于人类的表达方式与思维模式,正如有学者指出的那样,AI正逐步构建起一套本体论美学和语义体系,人类作为数字文化的接收者,会在不知不觉中接受并认可其呈现世界的方式,从而形成反馈机制的闭环。逐渐AI化,是人类面临的一大危险。有文章指出,开发GAI的公司,以及其背后资本对训练AI的版权作品“用完即销”,这不是蓄意(willingful)“非法复制”版权作品,而是“蔑视了全人类的精神创造力”。AI开发者不是出于提升人类创造力的目的,而是企图用机器智能挑战人类智慧,我们需警惕这种挑战可能带来的风险。由此可见,报业版权保护归根结底是对人类创造力进行保护。
在日益进步的AI技术面前,我们既不能因为对于技术的崇拜而任由其发展,也不能因为对技术的恐惧而止步不前。2025年8月,《关于深入实施“人工智能﹢”行动的意见》发布,为我国AI发展与应用规划了美好的蓝图,同时也强调要“加强知识产权保护、转化与协同应用”。AI技术背景下的版权保护,在促进报业健康发展的同时,也将为“防范模型的黑箱、幻觉、算法歧视等带来的风险”“推动AI应用合规、透明、可信赖”作出贡献。当下,报业版权保护工作面临的形势严峻,维权任重道远,需要相关各方不懈努力。
(作者:陈秀云 沈阳师范大学新闻与传播学院教授)
本文刊发于《中国报业》2025年10月(上)刊
责任编辑:张晓燕
| 推荐阅读频道







京公网安备 11010502035903号