boost.ai 的首席数据科学家Abhishek Thakur的访谈&第一Kaggle三重大师

阿比舍克·塔库(Abhishek Thakur)是世界上第一个获得Kaggle Triple Grandmaster排名的人。

卡格勒 是世界’是最大的数据科学家和机器学习工程师在线社区,他们可以在其中共同努力,参加竞赛以解决数据科学挑战。

阿比舍克·塔库(Abhishek Thakur)还是以下公司的首席数据科学家 boost.ai ,这是一家专门从事会话人工智能(AI)的软件公司。

在采访的第一部分中,Abhishek分享了他从进入数据科学到成为Kaggle Triple GM的历程,他克服的挑战以及对有抱负的数据科学家的建议。

在采访的第二部分中,Abhishek在boost.ai上讨论了他的工作,并提供了对话式AI的思想领导力。

AI时间杂志资源
您正在学习数据科学吗?

Check out what 图书 帮助20多个成功的数据科学家成长。


您是世界上第一个达到Kaggle Triple Grandmaster水平的人。这个成就对您意味着什么?

这确实是一个非常困难的成就。有超过15万名活跃成员,有人花了3年时间才获得三级大师的头衔,所以感觉还不错。我对此感到非常高兴。

图片: 阿比舍克·塔库(Abhishek Thakur)’s profile on 卡格勒

您是如何实现这一里程碑的?

要达到这个里程碑,需要在6年的时间内进行大量的努力,奉献和坚持。每个挑战都会带来一些新的东西,可以从中学习。如果您对数据中的某些知识了解不足或不了解,则可能会变得充满挑战,并且将来避免该问题的唯一方法是学习如何处理不同的问题和数据集,而这只能实现通过练习。

要达到这个里程碑,需要在6年的时间内进行大量的努力,奉献和坚持。每个挑战都会带来一些新的东西,可以从中学习。

您是如何进入数据科学的?您在此过程中克服了哪些挑战?

我来自电子工程学背景,但是我一直对计算机科学感兴趣。因此,我从印度来到德国学习计算机科学硕士学位。在攻读硕士学位期间,我曾与Fraunhofer一起工作,当时我正在为微控制器开发图像处理算法。同时,我的朋友们从事自然语言处理的工作,而我对他们关于自然语言处理和神经网络的演讲总是着迷。我在大学里修过一门机器学习课程,但似乎这不是我所需要的。因此,我开始独自阅读,并在Kaggle上提出了有关情感识别的问题。我使用了非常基本的方法,但是在那场比赛中失败了。我一直等到获奖者分享他们的方法,阅读并实施它们。在我还是学生的时候,我读了很多论文,并且自己实施了一些论文。我决定不自己学习课程,而是决定自己学习所有内容,并通过应用程序学习所有内容。因此,我会选择一个问题并尝试解决它,在此过程中,我会遇到很多我不知道的事情。因此,我会在网上搜索它们,并尝试通过阅读论文或观看youtube讲座来理解它们。

您主要使用哪些数据科学工具和技术?

我使用python。我经常(几乎每天)使用的一些库是scikit-learn,pandas,xgboost,Keras,TensorFlow和PyTorch。

数据科学家应具备哪些关键技能?

数据科学家应具有一定的数学背景,例如基本代数,微积分和概率知识。 

除此之外,最重要的是具有开箱即用的思维能力,并试图逐步解决问题。优秀的数据科学家应尝试以对业界和消费者最有效,最有用的方式解决问题。 

编程也是必需的,也是数据科学家必不可少的。如果他们不知道如何自己实现算法,或者不知道如何使算法有用,更快和可扩展,那么就不能成为一名出色的数据科学家。 

您对想成为数据科学家的人有何建议?

首先,我可以推荐吴安德(Andrew Ng)在Coursera上的课程。他以最简单的方式解释了一切。

如今,许多想将其专业转向数据科学的人或许多想要进入数据科学领域的学生都缺乏一件事:建立档案袋。您可以阅读所需的内容,也可以在线学习MOOC课程,但是最后,如果您不知道如何解决机器学习问题,那么进入一个好行业将会遇到很多麻烦。 

首先,我建议在Kaggle上进行一场持续的比赛,并尝试自己解决。您也可以查看内核和讨论以快速入门以及是否陷入困境。即使您在比赛中排名不高,最后也不要放弃!这也是我经常看到的事情,人们倾向于很早就放弃。如果您在那场比赛中表现不佳,请查看获胜者的解决方案,并尝试自己理解和实施。一个人永远不应该被他人吓倒并永远放弃。 

掌握了已经解决或试图解决的一些机器学习问题后,您应该在Kaggle讨论中或其他任何地方撰写有关此问题的简短文章,并通过Github以适当的格式共享代码。这两件事将帮助您理解问题和编码技巧。 

最后但并非最不重要的一点是,您需要投入大量精力。如果您是学生,则每天需要几个小时。如果您每天工作1-2个小时。您显然可以在周末多花几个小时。与其花费时间,不如说是花费更多的时间来理解给定的问题陈述并写下您想尝试的不同方法。

作为数据科学家,您未来的目标是什么?

我未来的目标是继续学习并为社区做出贡献。我没有明确的目标,但我只想继续为数据科学界做出贡献并与之分享,并帮助那些对此领域着迷并正在努力进入数据科学领域的人们。 


对话式AI Q&A

这次采访已在《 2019对话AI计划》中进行了介绍。

您如何在以下方面利用会话式AI  boost.ai ?

我们的对话式AI解决方案在市场上是独一无二的。得益于我们专有的自动语义理解功能,它比典型的聊天机器人提供了更高的理解水平。这使基于我们技术的虚拟代理能够处理极其复杂的客户请求,同时准确地处理多个意图,并在某些情况下将误报的可能性降低多达90%。

公司如何利用会话式AI使客户更快乐,更满意?

我们的策略  boost.ai 是为了帮助我们的客户始终将客户体验放在首位。首先,我已经提到了–对下一层语言的理解。但是我们也认识到,虚拟代理不会百分之一百地解决问题。因此,我们的解决方案旨在确定何时更适合将人工操作人员混入其中。对话式AI可以做到最好–大规模自动化交互。有了更多细微的差别,它就可以平稳地移交给人工操作员,从而使客户每次与品牌互动时,无论是与人还是与机器互动,都能获得无摩擦的体验。

您认为在未来几年中哪种与会话式AI相关的技术趋势将对您的行业产生最大的影响?

我认为对话式AI的最大趋势之一将是,从技术的信息本质向交易能力的显着转变。我们已经看到这种情况在2019年发生了,银行,保险公司和电信公司使用其虚拟代理代表客户执行程序。现在,无需人工操作,就可以进行诸如重置PIN码和通过虚拟代理转帐等操作。在不久的将来,我们可以期望他们能够走得更远,担当顾问的角色,帮助客户选择退休金计划或提供抵押建议。

我认为对话式AI的最大趋势之一将是,从技术的信息本质向交易能力的显着转变。

的使命 AI时间杂志 是泄露信息
和关于人工智能的知识,
的到来和使用AI技术的新机会
造福人类。

关于AI Time Journal编辑人员

的使命 AI时间杂志 是泄露信息 和关于人工智能的知识, 的到来和使用AI技术的新机会 benefit humanity.

查看AI Time Journal编辑人员的所有帖子→