苹果被三个YouTube博主告了,用公开数据训练AI到底算不算偷
技术笔记 1 次阅读

苹果被三个YouTube博主告了,用公开数据训练AI到底算不算偷

封面

苹果被三个YouTube博主告了,这官司有意思

最近科技圈出了个事,让我觉得挺值得聊聊的。

三个YouTube频道——h3h3Productions、MrShortGame Golf 和 Golfholics——把苹果给告了。理由很简单:苹果偷偷抓了它们几百万条视频,拿去训练自己的AI模型。

这事儿不是上周才发生的,其实今年4月就有人起诉了,只是苹果这周才正式回应,说"你们告得没道理,我要法院驳回"。

苹果的逻辑是什么

苹果的辩解很有意思。它说,你们把视频公开上传到YouTube,任何人都能看,不需要密码、不用付费、没有锁,那我凭什么不能抓?

从技术角度讲,这话确实有道理。YouTube上的视频确实是公开的,理论上任何人都可以访问。但问题是,YouTube本身是有"反爬机制"的——也就是技术手段防止别人批量下载。苹果相当于绕过了这层防护。

三个频道的运营者当然不干了。他们说,你苹果这是"蓄意绕过"YouTube的防护措施,拿来训练商业模型赚钱,还不给我们一分钱分成。h3h3Productions的主播Ethan Klein说,AI行业已经万亿美金规模了,可创作者们一分钱没见着。

不只是苹果一家被告

有意思的是,这三个频道不只告了苹果。Meta、英伟达、字节跳动甚至Snap都被他们告了,理由一模一样。看起来这是一场有组织的维权行动,背后站着的是整个内容创作者群体。

我查了一下,h3h3Productions有几百万人订阅,影响力不小。他们这场诉讼的意义不在于赔多少钱,而在于给整个AI行业划定一条边界——公开数据到底能不能随便抓?

这个问题其实没标准答案

老实说,苹果的说法也不是完全没道理。数据只要公开了,到底算不算"商业机密"?YouTube的服务条款确实禁止批量下载,但版权法和合同法是两回事。

美国《数字千年版权法》(DMCA)里有个关键点:你只有"限制公众访问"的内容才受特殊保护。换句话说,你把视频公开了,就不能说别人访问是违法的。但反爬措施又让这件事变得模糊——我设了锁,你撬开了,这算不算入侵?

目前这个案子还在审理中,加州北区联邦法院接手了。短期内不会有结果,但这个判例对AI行业的影响会非常大。如果法院支持创作者,那以后所有AI公司用公开数据训练模型,都得先问问版权人同不同意。

对普通开发者意味着什么

说白了,这事儿跟每个做AI相关开发的人都有关系。如果你在公司里用网上扒的数据训练模型,最好留意一下这个案件的进展。一旦判例确立,数据合规的成本会大幅上升。

我自己也在做一些AI相关的项目,以前觉得公开数据拿来用天经地义,现在回头想想,确实不那么简单。内容创作者花时间精力做出来的东西,被机器批量吃掉,产出竞品,换谁都不舒服。

案子还在进行中,我打算继续关注。不知道最后会怎么判,但可以肯定的是,AI和版权之间的拉扯,才刚刚开始。

分享

评论 (0)

评论通过后显示

暂无评论,来写第一条吧 ✍️