采访Ganna Pogrebna,领导行为数据科学,艾伦图灵研究所

Ganna Pogrebna是一名研究员 艾伦图灵研究所。她主持了A. 行为数据科学播客 最近被提名为AI时间杂志之一 数据科学家在2020年遵循.

我们感谢Ganna参加 数据科学访谈2020系列 并分享来自她的经验的几个富有识别反思,包括:

  1. 与不同领域的人交谈的重要性提出了开箱即用的解决方案。
  2. 她对数据科学领域的多样性和包容性的思考。
  3. 她作为播客主持人的活动。

1.你意识到你想要追求数据科学的职业生涯,你是如何进入的?

与许多人不同,我通过完全意外进入数据科学。我担任职业生涯作为决策者,致力于人类行为的量化模型。我在许多不同的大学工作,包括哥伦比亚大学在纽约市(美国),沃里克大学(英国),洪堡大学(德国)等。

我的初步工作是行为科学而不是数据科学。我的大部分作品是关于编写数学模型,试图预测人类行为,然后在实验室中测试这些模型。这项工作的方式是我会写一种人为决策模型,然后将邀请研究参与者到实验室,他们将作出一系列决定。然后,我将使用这些实验室会话的数据来查看模型是否有效。如果它没有工作 - 我会写一个不同的型号。

虽然令人兴奋的是预测人类行为,但实验室研究通常涉及数百名参与者;我一直想检查我的理论是否会在规模上工作,并将在现实世界中提供价值。

AI时间期刊资源
你学习数据科学吗?

Check out what 图书 帮助20多个成功的数据科学家在他们的职业生涯中成长。

因此,在2013年,我设法在Warwick制造集团(华威大学)获得工作,在那里我可以在广大数据集的消费者选择,数字转型和AI中的许多项目上与英国的业务合作。我的第一个项目看着使用智能家庭传感器数据来预测消费者决策。该项目改变了我的生活,从那时起,我就知道数据科学,而且,特别是行为数据科学,是我想做的。

2.如何在当前项目中创建价值的数据科学?

我的大部分作品都是关于了解人们的偏好。数据科学以3种方式在我的项目中创造价值:

(1)当我在决策理论和数据科学之间工作的混合模型(例如,我在过去18个月内发展的人为学习建模方法),数据科学使我能够培养新的知识。

(2)数据科学使我能够以规模解决问题 - 例如,最近我的团队在制定建议系统对消费者使用拟人学习方面更有用的取得了重大进展;

(3)最后,与其他工具不同,数据科学允许我创建前瞻性模型。例如,使用传统营销我们可以查看现有的产品/服务并预测什么类型的消费者希望购买该产品/服务(以某种方式,我们回到产品和服务的偏好)。通过行为数据科学,我们可以编写前瞻性型号 - 例如,我们可以预测一个特定消费者想要拥有的产品/服务的特征,然后不仅创建了这个个性化产品/服务,还可以提供它消费者使用大众定制工具。

简而言之,对我来说,一般的数据科学,特别是行为科学,尤其允许看到数据和数据驱动的洞察如何通过整个供应链或商业模式传播,以产生更多的业务价值,并提高客户满意度。

3.最佳投资之一是推进您的数据科学事业的最佳投资吗?

在我的情况下,最重要的是开发我的网络。通过这个网络,我遇到了帮助我理解我需要有什么技能的人,以解决我想解决的问题。在我看来,最好的事情是与不在我领域工作的人交谈。当你在盒子外面思考时,通常会出现最好的想法,结果,合作和项目。你不需要投入更多的时间,金钱或能量。您唯一需要的是倾听和理解不同观点的愿望和意愿。

在我看来,最好的事情是与不在我的领域工作的人交谈

4.您如何通过新的发展保持当前?

我很幸运能够在世界上最顶级的数据科学 - 艾伦图灵研究所工作。所以,我的第一个地方找出正在发生的事情是 艾伦图灵研究所,其网站,研讨会,会议等虚拟和面对面的事件。第二个地方是 arxiv,我总是阅读数据科学,机器学习和AI的最新论文。只有通过阅读原篇论文,您只能判断有价值的拟议模型创新是如何实际的。最后,我们的特殊兴趣小组在Alan图灵学院的行为数据科学以及 数据驱动聊天播客,我们邀请数据科学和相关领域最酷的人是对我来说是一个不断灵感和学习的源泉。

5.您目前作为专业数据科学家面临的最大挑战是什么?您如何解决它们?

对我来说的主要挑战之一总是关于学习新工具,或者找到学习新工具的时间。总有一些新的学习,很容易错过,因为有很多关于数据科学的信息。

例如,我现在意识到我对Python的了解对我所做的一切都不够,所以我学习朱莉娅,这需要时间来。对我来说的另一个重要挑战是考虑如何确保我开发的所有模型和工具以负责任的方式使用人们的数据。

伤害与数据科学工具的人很容易,因此我总是试图预测我发展的行为数据科学模型的潜在不利影响。

6.业务/行业的域名知识有多重要’作为数据科学家,你是如何获得的?

我是一个学术,所以我经常担任企业的顾问,提供行为数据科学解决方案(例如,我最近的项目正在开发个性化的Chatbot技术)。尽管如此,业务/行业/域名知识非常重要。我总是在我咨询的组织中拥有这种知识的人。让他们在船上的主要优点是(i)他们了解需要解决的问题,并可以制定数据科学家的问题陈述; (ii)他们知道数据来自哪里,这些数据是多么有价值/无用的,最重要的是,不同的变量意味着什么。

许多型号我们,作为数据科学家,努力解决现实世界问题。因此,了解数据科学如何有助于特定的业务环境很重要。同样,有一个人知道组织数据的人很重要 - 我们的模型才能很好地工作,只有在他们有很大的培训集,所以在商业环境中了解数据是项目成功的关键。我认为数据科学家需要深入的域知识,但我认为项目团队至少应该有一个拥有这些知识的人,可以帮助指导工作。

7.您为数据科学家练习或倡导您的职业或倡导哪种异常或荒谬的事情?

有几件事想到了。首先,我有十几个GitHub页面,我从不在任何这些页面上使用我的真实姓名。为此的主要原因是我已经编写了一些代码并在过去开发了一些软件,现在许多人使用。问题是,一旦你开发一些东西,人们希望你能保持它。然而,我总是想在新的东西上工作。我认为很多人都不欣赏,即可在那里开源等问题,以确保人们在项目上进行协作。他们不在那里轰炸原始开发人员,需要数千封电子邮件,要求“更新”代码/软件。关键是 - 如果您是代码或软件的原始作者,您决定制作开源,您不再拥有它 - 它属于社区。

我认为是不寻常的另一件事,但非常重要,是以简单的方式解释你所做的事情 - 因为这个原因我创造了我的 YouTube Channel.,我试图以简单的方式讨论数据驱动科学和项目,任何人都能理解。

8.在数据科学中工作的是什么激励你?

我喜欢两件事:(i)作为一个行为数据科学家,我在许多不同的项目上工作(从人们如何在超市购买宇航员如何在太空中的风险和不确定性下做出决定),这真的很酷;以及(ii)该领域的多样性和包容性,我们有思想家(概念性地了解“黑匣子”数据科学/ AI模型); Do-ers(谁在实践中应用“黑匣子”模型)和开发人员(谁改变“黑匣子”模型,也许甚至努力确保我们使用的型号不再是“黑匣子”)。

9.您对今天想要进入数据科学的人会给哪些建议? 

我会说你需要的两个最重要的事情是想象力和学习的愿望。如果你有想象力,你将能够制定有趣的问题。一旦你制定了你的问题,如果你愿意学习,你会得到解决这些问题的技能。

他们应该忽略什么建议?

在你的职业生涯中会有很多人,谁会告诉你一些事情是不可能的,你不应该尝试一下。如果您倾听此建议 - 您将留在您的位置,不会发展。我喜欢詹姆斯卡梅伦的这个报价:“ 如果您将目标设置为高度和它’失败,你将失败的其他人’s success“。基本上,不要因为有人告诉你而不是放弃。同样,如果您第一次失败,请不要放弃 - 再试一次。

10.过去1-2岁,数据科学和机器学习中最相关的最相关突破,以及您认为新兴趋势如何发展?

我的答案将非常偏向我的个人偏好,但我认为近年来的重大突破是(i)xai模型,特别是有助于理解机器学习预测的模型(即,帮助“解压缩”黑匣子预测) - 例如,石灰模型和类似技术; (ii)将行为数据科学的出现作为领域 - 与机器学习模型混合和匹配人类行为的理论是很酷的!

11.标记您希望查看这些问题的一个或两个数据科学家。

Kirstie Whitaker.

任务 ai时间杂志 是透过信息
关于人工智能的知识,改变
即将到来的是使用AI技术的新机会
益处人性。

加入AI时间杂志
加入助理编辑

您是否有兴趣分享AI的信息和知识,并与现场中的一些最聪明的思维联系起来?

了解加入作为一个 Associate Editor.

关于AI时间期刊编辑人员

任务 ai时间杂志 是透过信息 关于人工智能的知识,改变 即将到来的是使用AI技术的新机会 benefit humanity.

查看所有帖子由AI时间期刊编辑人员→