2022世界杯半决赛走地

常见问题

2022年6月22日

合成数据是人工智能的未来吗?

与亚历山大·林登进行问答

合成数据通常被视为低质量的替代品,当真实数据不方便获取、昂贵或受监管限制时才使用合成数据。然而,这种反应忽略了合成数据的真正潜力。Gartner估计,到2030年,人工智能模型中的合成数据将完全盖过真实数据。

Gartner的分析师将在即将到来的会议上讨论合成数据的用例和前景高德纳数据与分析峰会,从8月到11月在该地区举行。

我们赶上了亚历山大·林登,了解合成数据的前景,以及为什么它对人工智能的未来至关重要。想参加即将举行的会议和/或与亚历山大交谈的媒体成员可以联系劳伦斯Goasduff

问:合成数据的前景是什么?什么时候使用它?

答:合成数据是人工生成的一类数据。这与从现实世界中直接观察到的真实数据形成了对比。虽然真实数据几乎总是洞察数据的最佳来源,但由于隐私法规的原因,真实数据往往昂贵、不平衡、不可用或不可用。合成数据可以作为真实数据的有效补充或替代,为构建准确、可扩展的AI模型提供更好的注释数据访问。当与真实数据结合时,合成数据创建一个增强的数据集,通常可以减轻真实数据的弱点。

组织可以使用合成数据来测试不存在实时数据或数据有偏差的新系统。他们还可以利用合成数据来补充目前被忽视的小型现有数据集。或者,当真实数据不能使用、不能共享或不能移动时,他们会选择合成数据。从这个意义上说,合成数据是人工智能的又一个推动者。

问:为什么合成数据是人工智能未来的必需品?

答:还有许多其他形式的合成数据,例如数据增强或伪化/匿名化,这些都是“数据合成”的进一步类型。这些方法是任何现代数据科学团队的必备品。但是,通过合成数据,专业人员将信息注入到他们的AI模型中,获得比直接观察更有价值的人工生成数据。

合成数据可以用于黑客马拉松、产品演示和内部原型,以复制一组具有正确统计属性的数据。例如,银行和金融服务机构通过建立多智能体模拟来使用合成数据来探索市场行为(如养老金投资和贷款),以做出更好的贷款决策或打击金融欺诈。零售商将合成数据用于自动结账系统、无收银员商店或客户人口统计数据分析。

此外,合成数据可以提高机器学习模型的准确性。现实世界的数据是偶然的,并不包含现实世界中可能发生的所有条件或事件的排列。合成数据可以通过生成边缘的数据,或针对尚未看到的条件来应对这种情况。

它的广泛适用性将使其成为人工智能的关键加速器。合成数据使人工智能成为可能,而缺乏数据会导致人工智能因偏见或无法识别罕见或前所未有的场景而无法使用。

问:合成数据的风险是什么?

答:虽然合成数据技术在成本效益和隐私保护方面得分很高,但它们也有很大的风险和局限性。合成数据的质量通常取决于创建它的模型和开发的数据集的质量。

使用合成数据需要额外的验证步骤,例如将模型结果与人工注释的真实数据进行比较,以确保结果的保真度。此外,合成数据可能具有误导性,并可能导致较差的结果,而合成数据在涉及到隐私时可能不是100%的故障安全。

由于这些技术挑战,用户的怀疑也可能是合成数据要克服的另一个困难挑战,因为用户可能会认为它是“劣质的”或“假的”数据。

最后,随着合成数据获得更广泛的采用,商业领袖可能会对数据生成技术的开放性提出质疑,特别是涉及到透明度和可解释性时。

高德纳数据与分析峰会

Gartner分析师将在2022年8月22日至24日举行的Gartner数据与分析峰会上提供合成数据未来的额外分析奥兰多,佛罗里达。9月14-16日东京9月19-20日孟买11月7日至8日悉尼.使用Twitter跟踪会议的新闻和更新# GartnerDA

Gartner的客户可以在报告中找到更多信息新兴技术:何时及如何使用合成数据.在免费的Gartner电子书中了解如何解锁数据驱动成功所需的关键D&A技能和能力D&A技能和能力的基本指南。

如果你是媒体人,想就这个话题与亚历山大·林登进一步交流,请与劳伦斯·戈斯达夫联系Laurence.Goasduff@Gartner.com.媒体成员可以在他们的文章中引用该材料,并适当地归因到Gartner。

世界杯足球比赛预选赛

Gartner, Inc.(纽约证券交易所代码:IT)为高管及其团队提供可操作的、客观的见解。我们的专世界杯欧洲杯赛程家指导和工具能够更快、更明智的决策和更强的绩效,在组织的关键任务优先级。欲了解更多,请访问gartner.com

联系人