在比亚里利分析负责人的evan shellshear采访

Evan Shellshear是分析的负责人 比亚里里是一个应用高级数学方法来解决各种业务问题的公司。

在这次采访中,Shellshear先生解构公司如何利用AI和预测分析来援助决策者,同时概述了该过程中所需的若干技术和最佳实践。

什么 是你的背景,你是如何参与比亚里的?

I 在澳大利亚昆士兰州的Sunny Brisbane长大,发现了我的 对年轻时的数学热情。让抽象的美丽 数学指导我,我继续在数学中进行重大 大学,然后在诺贝尔奖获得博士学位,研究所 德国Bielefeld的数学经济学。再次 国外冒险我回到了澳大利亚,我现在在哪里 Biarri Analytics,该公司开发了萨斯解决方案以帮助 公司在所有行业垂直方面做出更好的决定 数学的力量。我领导了一支顶级数据科学家和 优化专家解决世界上一些世界’最艰难的挑战。 这是一个梦想工作,我采取抽象和深度数学 并将其变成了简单的基于Web的应用程序,即人们没有任何人 技术培训很容易用来解决他们最大的痛苦 points.  

谁是比亚里里,公司做了什么?

成立于2008年, 比亚里是一家全球经营的澳大利亚公司。比亚里是 founded to 革命 企业如何访问 数学 在他们的运营中。比亚里在北方澳大利亚运营 美国,欧洲和非洲有超过170人的员工。

曾经为Franz Edelman奖提名的三家澳大利亚公司之一(阿卡) 诺贝尔奖 为了 工业数学)对于我们在世界使用的热门工具背后的数学’最大的互联网提供商。比亚里里有纺出或联合促进10家公司,将先进的数学应用于各种行业。我们正在做分析的各个方面 数据科学预测建模,到端到端优化。

AI时间期刊资源
你学习数据科学吗?

Check out what 图书 帮助20多个成功的数据科学家在他们的职业生涯中成长。

什么是一个例子 每公司都可以使用的AI技术?

时间序列预测–这是无处不在的。每家公司都有宝贵的套管 时间序列 data –这是否是需求,供应,价格,成本或类似–每个人都希望能够 预测未来,有一些确定性。这可以通过适当的时间序列方法进行建模。一旦您掌握了时间序列,您将在您的AI工具包中拥有一个非常强大的工具集。

这个ai是什么 tool look like?

它有几个 main flavours:

  • 统计方法: 这些模型通常将时间序列分解为其组件(即趋势,季节性,循环性),并包括指数平滑(ETS方法)或自动增加模型(例如Arima)。
  • 机器学习方法: 这包括广义线性模型(GLMS),四分位随机林和深度学习(例如,RNN,LSTM,GU)。
  • 杂交方法: 机器学习和统计方法的动态组合。

什么是优缺点 每个不同类型的缺点?

统计模型 are 高度可诠释 并可以隐式模型 自相关,虽然努力利用外部信息 并且无法预测冲击或 “黑天鹅事件” if the 显式功能不存在。

另一方面,机器学习模型可以预测更复杂的时间序列 复杂的互动虽然需要在数据收集,预处理和特征(I.输入)工程中进行太多努力。可以开发模型来提供点估计和/或分布–可用于导出置信区间。更复杂的模型也可以在培训数据上容易出现–模型“了解”培训数据,但无法在“现实世界”中无法表现。虽然一些机器学习模型是高度可解释的(即glms),但其他机器 深度学习 由于难以解释内部工作而被称为“黑匣子”模型。

混合模型 attempt to capture 两者中最好的 统计和机器 learning models.

什么是最多的 在做时间序列时要注意的重要事项 forecasting?

真正 理解 the 问题 和你正在解决的环境,超越刚刚 the data.

例如,我们有 零售客户需要为其产品销售预测。它 wasn’T直到我们了解更大的画面– the product was 通常会与主要体育赛事一起购买– that we 能够准确预测销售。一旦我们收集了数据 主要体育赛事的发生并将其添加为额外的 特征,模型的准确性急剧提高。

什么是gotchas?

  • 自相关: 是观察之间的相似性作为时间的函数。例如,明天的股价与今天的收盘价高度相关。如果您未能解释自相关,则可能会导致表现不佳的模型。
  • 互动: 一些最重要的,易于解释的变化原因,可以归因于2或多个功能之间的交互–而不是个人特色。
  • 变量的正常化: 特别是在解释系数的重要性时,这可能导致悲伤。
  • 缺乏领域知识: 可能是最重要的。人们经常跳到问题的技术方面,而不适当地了解背景以及为什么重要。

我能怎么做 很快就会看到是否有价值在做更深层次的分析?

阿玛玛 或者 GLM. 模特,这应该是你的 基线。这些模型 在大多数包装(R,Python等)中存在开箱即用。如果你想 一些更基本的东西,您可以尝试一个天真的预测 最后一个观察到的值作为预测–或者价值相同 上周,上个月或去年的时间。

Excel, 还有一些基本工具,包括 预测 作为其分析工具PAK附加组件的一部分。它不如框外的r和python例程一样复杂,但如果您的数据以CSV格式或Excel表(而不是在数据库中)可以轻松启动。

在Python,一个可以 使用其他工具,如 Tsfresh. 加强你的 预测模型。它可以轻松提取原始的特征 时间序列数据可用于更复杂的ML模型。

如果您的模型是 能够以合理的准确度预测(检查 像均方的误差错误),那么它可能值得挖掘更深 拥有更先进的Arima或ML模型。如果没有,你有 没有直接驱动值的直觉,然后回到 drawing board :).

我做了什么 the basic model?

你需要 了解您的数据和业务问题的复杂性,以及 回答问题:

  • 您是否需要多个时间序列模型进行不同的子问题,或者是否足够大/一般模型?如果你有 高度维度 在您的数据中,需要一般模型,也许您需要查看类似的东西 深度学习.
  • 我们如何将数据源的摄取自动化为预测模型,因为它进入生产时?清洁,ETL等
  • 模型需要有多好,实际上是有用的? 80%是否足够? 90%?然后将您的努力逐步击中该要求。
  • 您是否提供了点估计或您提供的点数 概率分布?

比亚里里怎么做 differently?

我们开发了一个管道,为我们提供了极快的价值路径。一开始,我们遵循CRISP-DM步骤,并首先获得对数据的理解并将其设置为建模,但这是我们的管道,能够快速有效地具有工程师并测试成千上万的模型组合和测试数千个模型组合找到最好的模型。

另外,结束了 多年来,我们在整合外源性方面发展了深刻的专业知识 天气,体育,人口统计数据等因素等因素 丰富 existing 时间序列 数据 套和 获得更深的洞察力从分析。

特别是我们在比亚里的主要事情是为了确保我们的预测分析(即 预测) 导致 规定性分析(即 行动)。如果工作只需落在架子上,那么它就不了’T提供价值,它不起作用’帮助任何人。所以,如果需要,我们’LL构建基于Web的工具,并在预测上添加优化引擎,以帮助决策者 '如果?' 问题:所以我有预测,现在我该怎么办?我们帮助建立回答此关键问题的引擎。

'如果?' 问题:所以我有预测,现在我该怎么办?我们帮助建立回答此关键问题的引擎。

任务 ai时间杂志 是透过信息
关于人工智能的知识,改变
即将到来的是使用AI技术的新机会
益处人性。

加入AI时间杂志
加入助理编辑

您是否有兴趣分享AI的信息和知识,并与现场中的一些最聪明的思维联系起来?

了解加入作为一个 Associate Editor.

关于AI时间期刊编辑人员

任务 ai时间杂志 是透过信息 关于人工智能的知识,改变 即将到来的是使用AI技术的新机会 benefit humanity.

查看所有帖子由AI时间期刊编辑人员→