Wikimedia 呼吁 AI 公司使用付费 API 合规获取数据

evan 行业资讯 11-13 213

Wikimedia 基金会近日呼吁各大人工智能公司停止爬取 Wikipedia 内容，转而通过 付费 API（Wikimedia Enterprise） 合规使用数据。基金会强调，AI 模型的能力离不开人类志愿者长期积累与维护的开放知识，而这一平衡需要被尊重和回馈。

在官方博客中，Wikimedia 表示，生成式 AI 的发展严重依赖于维基百科等平台所提供的内容。为维持开放知识生态的可持续性，Wikimedia 呼吁 AI 开发者 明确引用信息来源，并通过付费 API 支持平台的运营和公益使命。

Wikimedia Enterprise 为企业提供大规模数据访问接口，既能避免对服务器造成负载压力，又能让企业在合法框架下高效使用 Wikipedia 数据。同时，这一收入也将反哺基金会的非营利项目，保障全球知识共享的持续发展。

尽管如此，Wikimedia 表示目前 不会对爬取行为采取法律行动，但希望 AI 企业能以负责任的方式使用网站内容，遵循透明、公平与可持续的原则。

近期，维基百科正面临访问结构的显著变化。据 TechCrunch 报道，人类访客数量同比下降约 8%，同时，Wikimedia 发现 5 月至 6 月的访问高峰中，大量流量来自伪装成人类用户的 AI 爬虫。调整检测系统后，基金会确认这些流量主要用于 AI 模型训练数据采集。

Wikimedia 指出，信息来源的透明度是建立公众信任的关键。当内容平台未标注出处时，知识的质量与延续性都将受到威胁。访问量下降意味着 志愿者贡献减少、捐款下降，从而影响项目的长期运作。

值得一提的是，基金会自身也在使用 AI 技术辅助志愿者工作，例如用于 反破坏检测与文章翻译，但其目标是“让人更高效”，而非取代人工编辑。

通过此次声明，Wikimedia 传达了一个明确信息：可靠技术的未来离不开人类知识的持续创造。若无持续的人类参与与贡献，AI 的知识根基终将动摇。