采访Daniele Micci-Barreca,产品分析铅,数据科学,谷歌

我们感谢 Daniele Micci-Barreca谷歌 参加 数据科学访谈系列 并分享几个有价值的AI智能之家,包括:

  • 数据科学家和最突出的挑战所需的关键技能
  • 可以提供帮助的资源 数据科学家磨练他们的技能
  • 数据科学和AI领域的个人经历
  • 挑战组织面临数据科学并具有数据驱动的心态

多年来,描述了我们所做的事情的术语,从数据挖掘到预测分析到大数据和数据科学,方法已经发展,数据已经指数增长。

–Daniele Micci-Barreca

你是如何第一次进入数据科学的?

我正在努力工作。在认知和神经系统中,当然,我对机器智能感兴趣并着迷。但是,当应用领域非常窄时,图像识别,机器人和模式识别等物品。但这是那时这个词“Data Mining”出现了将这些机器学习和统计方法应用于数据库挖掘的想法开始出现。

这种ML和数据的融合推动了我对该领域的兴趣。我还有机会在第一个中的epsilon实习“database marketing”组织采用“Data Mining”对于客户响应建模和其他应用程序。多年来,描述了我们所做的事情的术语,从数据挖掘到预测分析到大数据和数据科学,方法已经发展,数据已经指数增长。尽管如此,我相信的基本概念非常相同。

您每天使用的主要技能是数据科学家的关键技能,以及您是如何发展的?

我认为一个良好数据科学家的主要特征是好奇心,以及使用数据来发现关系和模式的能力。在我看来,技术技能不如围绕数据的推理能力,创造性地转换和操纵它,呈现并想象它,使用适当的技术,例如统计和ML算法,并解释结果。

我不相信成为ML算法Guru就像是一个好的一样有用“storyteller”通过数据,并且后者可能比前者更困难。发展这些技能具有实践和实践。很难从书中收集这些知识;它来自强大的导师,犯错误,尝试不同的东西。

您目前作为专业数据科学家面临的最大挑战是什么?您如何解决它们?

我认为交易的工具正在快速发展和繁殖。决定哪种工具值得学习可能具有挑战性,哪些工具可能会褪色。此外,我看到朝着越来越强大的算法抛出原始数据的坚实趋势,而不是专注于理解,转换和解释数据的核心实践。我认为这有一些弊端和许多好处,这是在这个方向上加速的原因。

数据科学正朝着更多成为更多的练习“black box”模型可能良好,但对数据提供很少的洞察力。

一个良好数据科学家的主要特征是好奇心和使用数据来发现关系和模式的能力。

–Daniele Micci-Barreca

您作为数据科学家的商业/行业的域名知识是多么重要,您是如何获得它的?

人们可能对此有不同的意见,但域名知识是成为一个成功的数据科学家的基础。多年来,我曾担任顾问,我的工作需要跳进新的业务环境并产生有意义的AI智能之家和模型。每次我进入一个新的领域时,迅速获得该领域的专家级别域知识的最大挑战是理解数据的含义及其流程。

当我在我已经工作的一个地区开始一个项目时,它使一个不同的世界。因此,成功的数据科学家倾向于坚持一些相关的地区,并成为该领域的专家。例如,在字面上之后‘stumbling,’这意味着在前几个项目中感觉像鱼类出来的水,进入税收分析领域,我最终开始了专注于此的咨询业务。我们专注于帮助全国范围内的税务机构和国际利用数据科学,以改善其税收合规计划。税收不是一个简单的域名,但我们一旦我们所做的一旦我们获得了以下十年的巨大可信度和成功。

当您了解该领域时,您可以与您的语言与您的利益相关者交谈,了解数据的含义,并专门技术解释您的模型。

3个单词最汇总如何学习ML和数据科学:

我通过谦卑,好奇心和创造力学习了数据科学.

从一开始,我意识到这一领域有很多东西可以学习;尽管已经学习了很长时间,但我没有从我的教育中获得所有的技能。此外,当时,适用于数据科学的教育机会需要我们更有限。您需要掌握数据提取和操纵;您需要了解您的统计数据,以及机器学习,最重要的是,域名。

如果你专注于你不知道什么,最好是’T尚未知道,而不是你熟知的,这通常是工具和算法,但你将始终面对一个新域来应用您的知识。正如我所说,数据科学的好奇心是一个重要的成分。快速接受数据中的线索或调查结果的不一致总是追求真相并提出问题。

创造力在您可以使用可用于转换它以使其更具信息丰富的数据–在实现这方面,域名知识可以提供帮助。同时,有时是新的一个区域也可以帮助带来一些关于数据的新的视角,或者您可能能够利用其他域中使用的想法和方法。

书籍:哪些书在您的旅程中帮助了您最多?为什么?

我认为每个人对某些时候对数据科学感兴趣的人应该读一本书 “统计学习的要素”由Hastie,Tibshirani和弗里德曼或类似的东西,因为它为数据科学提供了数学基础。对于想要获得更多企业如何利用数据科学的人们概述的人,我喜欢这本书 通过ProSt和Fawcett,“商业数据科学”, 做得很好。

课程:您认为哪些课程/课程,这有助于推动数据科学的职业生涯?

当时专门的在线课程和数据科学计划开始出现,我已经开发了相当多的工作体验。因此,我没有尽可能多地利用这些资源。当然,我感谢我作为我博士学研究的一部分收到的机器学习培训以及来自以前的研究的计算机科学基金会。

然而,我记得,参加由斯坦福教授Hastie和Tibshirani提出的统计学习的优秀现场研讨会,我有机会参加和他们之前提到的书籍。我也喜欢查看Andrew Ng’S级机器学习。

您对今天想要进入数据科学的人会给哪些建议?

如果您已经在相关领域工作,则会有机会在使用数据科学方法涉及涉及实际项目的机会,特别是如果您可以使用经验丰富的数据科学家在支持角色中工作。如果您仍然在您的学术旅程中,请不要跳过教育内容,为您提供扎实的理论基础。为您的发现的域知识和业务解释提供价值。不要用最复杂的算法坠入爱河; 通常,最简单的解决方案是最好的。练习偶尔’s Razor.

有什么激励你在数据科学中工作的?

基于数据洞察力和无限适用性推动决策的机会,以改善业务流程。此外,我认为大规模数据资产的融合(特别是在图像和文本)和引人注目的学习方法,如深度学习最近就是可能的。在某些领域进行的进展,如自动化机器翻译和图像识别,是令人难以置信的。

在许多其他领域,在我看来,仍然是既有成熟的方法的制作模型的艺术和科学仍然是这样的方式。然而,无论如何“how,”我看到很多行业的广泛采用真正的,我认为这次是在这里留下来。

在您的行业中标记一个或两个人,您希望看到这些问题。

分享您对客户,业务或最终用户解决问题的应用程序的经验?

我在这个领域工作了超过20年。因此,总结我的旅程和我必须为客户创新的机会,需要一段时间。我始于零售,我有财富将沃尔玛作为客户,并使用数据科学来使用销售数据在全国各地分配商店的创新方式。然后我转移到欺诈检测和预防应用程序,最初帮助在线商家打电话信用卡欺诈–这是非常具有挑战性的工作。

从那里,我与另一个合作伙伴开始了自己的咨询业务,我们开发了税收合规性的深刻专业知识,为审计选择,债务收集和欺诈检测等申请制定税务机构模式。

经过12年超过12年的业务,我通过加入优步搬回了公司世界’S支付和风险组织。最近,我来到谷歌,我是Google Commerce组织的一部分。

数据驱动的文化意味着查看驱动组织的许多决策点’S操作和茁壮成长,确保每个决定,大小,都是由数据洞察力驱动的。

–Daniele Micci-Barreca

企业在获得模型以影响业务时面临什么挑战?

对于许多组织来说,这一挑战一直在为整个公司提供数据驱动的文化。这就是差异的原因。实现模型或两个以改进特定的操作领域并不是驱动激进的改变。顺便说一句,这通常是完成的专业顾问,他们设计,构建然后离开。

数据驱动的文化意味着查看驱动组织的许多决策点’S操作和茁壮成长,确保每个决定,大小,都是由数据洞察力驱动的。有些组织的工作方式,亚马逊一直是一个设置数十年和许多以纪要的公司的标准之一。但许多其他人,特别是传统更传统的,仍然在寻找合适的人群,工具在公司内部的核心功能。

副主编

我是联合创始人&基于新加坡的数据科学和AI初创公司的CTO,以及一位机器学习爱好者,他喜欢与人们互动,了解有关人工智能如何塑造组织和人民的生活以及它如何用于优化业务运营。

加入AI时间杂志
加入助理编辑

您是否有兴趣分享AI的信息和知识,并与现场中的一些最聪明的思维联系起来?

了解加入作为一个 Associate Editor.

about aditya.

我是联合创始人&基于新加坡的数据科学和AI初创公司的CTO,以及一位机器学习爱好者,他喜欢与人们互动,了解有关人工智能如何塑造组织和人民的生活以及它如何用于优化业务运营。

查看上午的所有帖子。 aditya.→