微软AI掌门人引争议：网上内容几乎可自由用于训练，但存灰色地带

AI每日新闻2年前 (2024)发布 shen

1,925 0 0

随着生成式AI技术的迅猛发展，其背后的数据获取与利用问题日益成为公众关注的焦点。微软AI部门新任首席执行官穆斯塔法・苏莱曼（Mustafa Suleyman）近日在接受CNBC采访时，就生成式AI从网络获取数据的问题发表了看法，引发了广泛讨论。

苏莱曼表示，对于已经在网上公开的内容，自90年代以来，这些内容的社会契约就是“合理使用”，即任何人都可以复制、重新创作、再现这些内容。他进一步指出，这些内容一直被视作“免费软件（freeware）”，是公众的共识。这番言论无疑在业界和版权保护领域掀起了波澜。

AI旋风认为，苏莱曼的观点在一定程度上反映了当前AI技术发展中的现实困境。随着AI技术的不断进步，其对于数据的需求也呈几何级数增长。而网络作为信息的重要载体，自然成为了AI训练数据的重要来源。然而，这也引发了关于版权保护和数据使用权限的争议。

苏莱曼在采访中还特别提到了一种“灰色地带”的情况。他指出，当一个网站、出版商或新闻机构明确表示，其内容仅允许被用于索引和查找，而不允许被用于其他目的时，AI公司如何获取和使用这些数据就成了一个亟待解决的问题。苏莱曼认为，这个问题需要在法院中逐渐得到解决。微软AI掌门人引争议：网上内容几乎可自由用于训练，但存灰色地带