合成数据正成为下一代人工智能最重要的战略组成部分之一。对于SAS拉丁美洲创新总监布鲁诺·马亚而言,这项技术不仅仅是一种技术解决方案,更是在不损害安全性的前提下,释放生产力、保护隐私并加速企业采用人工智能的关键所在。
“合成数据既能保护个性,又能保持训练模型所需的逻辑,”Maia 在Revolução AI上说道,这是一个由 Magalu Cloud 支持的NeoFeed项目。
这项技术能够创建与原始数据集在统计学上高度一致的人工生成数据集——换句话说,它是模拟真实世界数据而生成的信息。这解决了人工智能领域最关键的瓶颈之一,即数据准备所花费的时间。
据 Maia 称,整个分析周期中约 70% 的时间都消耗在数据清洗、整合和处理上。而使用合成数据,这些步骤会变得更快、更具可扩展性且更安全。
另一个好处是能够保护敏感信息,因为基于真实数据训练的模型可能会暴露数据库漏洞,甚至重现偏差。而合成模型则有助于消除此类漏洞,同时又不牺牲性能。
他说:“这种方法可以让公司在不牺牲隐私或商业战略的前提下交换情报。”
虽然合成数据在人工智能行业已逐渐成为现实,但下一个重大技术前沿(或许也是最具颠覆性的)可能是量子计算。他预测,企业级应用将在大约三年内开始出现,从而深刻改变安全和处理模式。但他警告说,现在就必须关注这一课题。
这位专家在肯定人工智能技术诸多益处的同时,也指出人工智能的应用应更多地受战略而非炒作的驱动。他认为,并非所有企业问题都需要用人工智能来解决。相反,企业必须明确人工智能的价值所在,才能将其应用于实际场景;同时,还需了解如何规避风险和偏见,以及如何确保有效的治理。
“过去,解读模型很简单。但如今,随着机器学习的发展,决策树的走向变得难以解释,”他说道,并强调这种不透明性会带来切实的后果。“如果你无法解释模型的运行机制,首先,客户会不满。其次,你可能会被解雇。”