根据计算,世界上的数据量正在以每天 2.5 艾字节(25 亿千兆字节)的速度大幅增长。这相当于每天 530 万亿首歌曲,或 500 万台笔记本电脑的内容。大量数据现在最终出现在各种机构的驱动器上,这些机构以前收集的数据要少得多,但目前正在想办法了解或更好地利用他们拥有的不断增长的数据湖。
与此同时,廉价计算能力的可用性迅速提高,这在一定程度上推动了一些新技术的涌现,此类技术旨在从这些数据中找出常规分析无法立即显现的模式。可以通过以下方面做出推论和惊人准确的预测
- 消费行为
- 金融市场
- 医疗记录
- 工程中的性能监测数据
一些技术(例如“深度学习”或神经网络)并不依赖于明确规定在每种情况下程序应该做什么的传统计算算法,而是基于生物大脑的功能进行建模。新兴的机器学习技术,无论是传统的还是非传统的,不仅能够很好地作出调整,以处理大量数据,因为它们需要大量数据才能工作,而且借助这些大型数据集,它们还能使最近在以下方面取得的重大进展成为可能
- 自然语言解释
- 计算机视觉。
它们是人工智能 (AI) 的基石。
正如科幻小说中描述的那样,完全的人工智能在未来仍有一段路要走,尽管渴望发挥这一商业潜力的营销部门毫不迟疑地使用这一术语,并围绕它进行了大量宣传。可以肯定的是,利用今天的技术,计算机可以完成几年前只能由人类完成的工作。计算机在转录和翻译语音、识别人脸、阅读印刷和手写字符,以及从不明显而且编写软件的程序员不一定能预见其可能性的数据中进行推断方面做得越来越好。
这些新功能的应用意义深远。它们包括
- 自动驾驶汽车:虽然完全自动驾驶汽车还不能在道路上合法行驶,但这项技术已经完成或接近完成。自动驾驶汽车和人类驾驶汽车一样安全或者更加安全,现在更大的问题在于定义一个法律框架,使它们能够与人类驾驶汽车一起运行。
- 先进的仓库和工厂机器人:机器人已经存在了几十年,但却一直在执行预定义到毫米级的动作,无法处理意外情况。较新的机器人能够更好地做到这一点,可以调整路线,绕过障碍物,并对未准确位于预定义位置的组件进行补偿。
- 聊天机器人:聊天机器人可以越来越多地使客户服务实现自动化。由于它们不必模仿人类的外貌和声音,因此可能很难区分它们。它们处理日常查询的能力不断增强,一旦客户的问题变得过于复杂,机器无法理解,就可以将其几乎无缝地交给人工操作。
- 医疗诊断:机器学习可以帮助分析医学扫描,这是一种图像识别形式。计算机在这一领域的能力正在提升,并且在补充人类专业知识方面已经很有价值。计算机能够对较简单的病例进行分类,并指出大量数据中的异常情况,从而使训练有素的医疗从业人员能够专注于更困难、更有价值的工作。医学诊断的另一种形式包括通过计算机分析患者的症状,并与大量医学知识和先例进行比较。这项技术可以帮助从一组复杂症状中分析所有可能的原因,并帮助降低漏掉重要诊断的几率,而人类医生可能会偶尔漏掉这些诊断。
- 预测性维护:飞机及其发动机、其他车辆和运输形式以及工厂设备等复杂的机械需要进行预测性维护。预测性维护可能代价高昂,因为它会在贵重的机器损坏之前将其停止使用,抢先对其进行维修。机器学习可以通过分析先进机械现在产生的大量性能数据,帮助优化预测性维护的时间安排。在某些情况下,机器学习可以检测到机器故障的早期迹象,并反过来保证机器不会出现故障,即使其定期维护已到期,也可以安全地推迟维护,从而节约成本。
- 金融市场预测:金融机构在采用机器学习方面处于领先地位。机器学习能够对市场走势做出非常短期的预测,可以带来明显的经济利益。用于此用途的机器学习技术通常是秘密的,但是机器学习还有其他金融应用,比如通过检测异常支出模式来防止欺诈;借款人信用分析;根据消费者的消费和储蓄行为,以及他们的收入模式和生活方式,为他们匹配金融产品。
Automation Consultants 了解目前正在改变世界的许多数据科学和机器学习技术。如果你的机构拥有大型数据集并希望更好地利用它们,可以在此处了解关于我们的能力的更多信息。