采访Boost.ai的首席数据科学家Abhishek Thakur&第一个kaggle三重大师

Abhishek Thakur.是世界上第一个达到哈格林三重奖金等级的人。

kaggle. is the world’最大的数据科学家和机器学习工程师在线社区,他们可以共同努力,进入竞争来解决数据科学挑战。

Abhishek Thakur.还担任首席数据科学家 Boost.ai. 是一家专门从事会话人工智能(AI)的软件公司。

在采访的第一部分,Abhishek分享了他的旅程,以进入数据科学,成为他克明三重通用汽车,他克服的挑战,以及他对抱负数据科学家的建议。

在采访的第二部分,Abhishek讨论了他在Boost.ai的工作,并在对话AI上提供思想领导。

AI时间期刊资源
你学习数据科学吗?

Check out what 图书 帮助20多个成功的数据科学家在他们的职业生涯中成长。


你是世界上第一个达到了卡格三联兰大师水平的人。这一成就对你意味着什么?

确实是一个非常困难的成就。有超过150k活跃的成员,有人需要3年的时间来获得三重奖金的标题,所以感觉非常好。我很高兴它。

图像: Abhishek Thakur.’s profile on Kaggle

你是如何实现这一里程碑的?

在6年内,实现了许多努力工作,奉献和持久性的努力。每个挑战都会带来新的东西来学习它。如果数据中有一些关于或不了解的知识,则可能成为挑战性,并且将来避免它的唯一方法是学习如何接近不同的问题和数据集,并且只能完成通过练习。

在6年内,实现了许多努力工作,奉献和持久性的努力。每个挑战都会带来新的东西来学习它。

你是如何进入数据科学的?你沿途克服了哪些挑战?

我来自电子工程背景,但我一直对计算机科学感兴趣。因此,我从印度来到德国学习计算机科学的主人。在我的硕士学位,我正在与Fraunhofer作为一个学生一起制造用于微控制器的图像处理算法。与此同时,我的朋友正在致力于自然语言处理,我总是被他们关于自然语言处理和神经网络的谈判着迷。我在大学里拿了一台机器学习课程,但它似乎没有为我制作。所以,我开始阅读自己并挑选了关于卡格上的情感认可问题。我使用了非常基本的方法,并在这种比赛中失败了。我等到赢家分享了他们的方法,阅读并实施了它们。我读了很多文件,在我是学生时自己在自己的少数人实施。我决定使用自己的一切并通过应用程序来学习一切。所以,我会选择一个问题并尝试解决它,在那课程中,我会遇到很多我不知道的事情。所以,我会在网上搜索它们,并尝试通过阅读论文或观看YouTube讲座来了解它。

您主要使用哪些数据科学工具和技术?

我使用python。我经常使用的一些图书馆(几乎每天)都是Scikit-Learn,Pandas,XGBoost,Keras,Tensorflow和Pytorch。

数据科学家应该拥有的主要技能是什么?

数据科学家应该具有一些数学背景,例如基本代数,微积分和概率知识。 

除此之外,最重要的是要思考盒子的能力,并尝试以逐步的方式开始解决问题。一个好的数据科学家应该尝试以一种最有效和对行业和消费者有用的方式解决问题。 

编程也是必需的,是数据科学家的必备方面。如果他们不知道如何独立地实现算法,或者如何使算法有用,更快和可扩展,可以是一个好的数据科学家。 

您对想要成为数据科学家的人的建议是什么?

首先,我可以推荐Andrew NG的Coursera课程。他以最简单的方式解释一切。

许多人想要将他们的领域改为数据科学这些天或许多想要进入数据科学领域的学生缺乏一个基本的东西:建立一个投资组合。你可以尽可能多地阅读,你可以做在线mooc课程,但最终,如果你不知道如何接近机器学习问题,你将有很多麻烦进入一个良好的行业。 

要从问题开始,我建议在卡格上举办持续的竞争,并尝试自己解决它。人们也可以看看内核和讨论快速开始,如果它们被卡住。即使你在比赛中没有得到良好的等级,最终也不要放弃!这也是我经常看到的,人们倾向于很早放弃。如果您在该竞争中进行了良好表现,请查看获奖者的解决方案,并尝试自己理解和实现它们。人们永远不应该被别人吓倒并放弃。 

一旦你掌握了一些机器学习问题,您已经解决或尝试解决自己,您应该在kaggle讨论或其他任何地方写一篇关于它的简短文章,并通过github以正确的格式共享代码。这两件事将照顾你对问题和编码技能的理解。 

最后但并非最不重要的是,你需要很多奉献精神。如果你是学生,每天每天几个小时。如果您每天工作1-2小时。你可以在周末投入几个小时。而不是投入时间,它更多地了解给定的问题陈述并记下您想要尝试的不同方法。

您未来的目标是作为数据科学家的目标是什么?

我未来的目标是继续学习并为社区做出贡献。我没有规定的目标,但我只是想继续与数据科学界共享并与这一领域着迷的人,并努力进入数据科学领域。 


会话ai问:&A

这次采访已经在2019年对话AI倡议中得到了特色。

你如何利用会话ai  Boost.ai. ?

我们的会话AI解决方案在市场上是独一无二的。由于我们的专有自动语义理解,它提供了比典型的聊天更大的理解水平。这允许建立在我们技术上的虚拟代理来处理令人难以置信的复杂的客户请求,同时准确地处理多个意图,在某些情况下将误报的可能性降低至多90%。

公司如何利用对话的AI使他们的客户更幸福,更满意?

我们的战略  Boost.ai. 是为了帮助我们的客户始终首先放置客户体验。我们首先做到这一点,并与我已经提到过的东西–下一级语言理解。但我们还认识到虚拟代理人不会让事情百分之百。因此,我们的解决方案旨在识别何时更合适地将人类运营商带入混合。会话ai可以做到最好的事情–按比例自动化交互。对于更细微的任何内容,它允许对人类运营商进行平滑切换,以便客户每次与品牌互动时都会获得无摩擦的体验,无论是人类还是机器。

您认为您认为哪种与会相关的AI相关技术趋势在未来几年将对您的行业产生最大的影响?

我认为会话AI的最大趋势之一将是远离技术的信息性质的标志,进入更多的交易能力。我们已经看到2019年发生这种情况,银行,保险公司和电信使用他们的虚拟机代表客户进行程序。现在,可以通过没有人工操作员的虚拟代理商来做类似RESET PIN编号和传输资金的事情。在不太遥远的未来,我们可以预期他们能够进一步走一步并接受咨询角色,帮助客户选择养老金计划或在抵押贷款提供建议。

我认为会话AI的最大趋势之一将是远离技术的信息性质的标志,进入更多的交易能力。

任务  ai时间杂志 是透过信息
关于人工智能的知识,改变
即将到来的是使用AI技术的新机会
益处人性。

加入AI时间杂志
加入助理编辑

您是否有兴趣分享AI的信息和知识,并与现场中的一些最聪明的思维联系起来?

了解加入作为一个 Associate Editor.

关于AI时间期刊编辑人员

任务  ai时间杂志 是透过信息 关于人工智能的知识,改变 即将到来的是使用AI技术的新机会 benefit humanity.

查看所有帖子由AI时间期刊编辑人员→