Copilot 侵犯隐私、抄袭代码、无视许可证…… 这届 GitHub 变了?
SegmentFault
共 1955字,需浏览 4分钟
·
2021-07-05 16:54
这几天,程序员们最关心的莫过于 GitHub 新推出的 AI 编程工具 Copilot 了。
这款号称“AI 结对编程队友”(Your AI pair programmer)基于一种叫做 OpenAI Codex 的新算法构建,并使用从 GitHub 上提取的万亿字节公开可用代码以及英语示例进行训练,能够自动补全整行代码或整段函数、基于注释生成对应代码,还能编写测试、快速发现解决问题的替代方法。
GitHub 带头“抄”代码?
Copilot 承认基于大量 GPL 代码进行训练,这难道不是将开源代码清洗(laundering)为商业产品的形式吗?“它通常不会重现精确的代码块”,这样的措辞并不令人满意。 版权不仅涉及复制粘贴,还涵盖衍生作品。GitHub Copilot 基于开源代码训练,它所知道的一切都来自于开源代码。“衍生”不可能不包含这层含义。
GPL 明确声明“不要把我的工作放在专有软件中”(proprietary software,又称非自由软件),而 Copilot 的机制恰恰将其工作置于专有软件中。
隐私安全问题
https://twitter.com/eevee/status/1410037309848752128 https://mobile.twitter.com/mitsuhiko/status/1410886329924194309 https://mobile.twitter.com/kylpeacock/status/1410749018183933952 https://copilot.github.com/
https://www.gnu.org/licenses/licenses.html https://www.gnu.org/licenses/gpl-faq.zh-cn.html#GPLRequireSourcePostedPublic
评论